"Invention is in our DNA and technology is the fundamental tool we wield to evolve and improve every aspect of the experience we provide our customers."
「发明创新是我们的DNA,技术是我们用来不断进化、改善客户体验每一个方面的根本工具。」
致我们的股东:
随机森林、朴素贝叶斯估计器、RESTful服务、Gossip协议、最终一致性、数据分片、反熵、拜占庭法定人数(Byzantine quorum)、纠删码(erasure coding)、向量时钟……走进亚马逊某些会议室,你可能会一时以为自己误入了一堂计算机科学课。
翻开当今软件架构领域的教科书,几乎找不到什么我们在亚马逊没有应用的模式。我们使用高性能事务系统、复杂的渲染与对象缓存、工作流与队列系统、商业智能与数据分析、机器学习与模式识别、神经网络与概率决策,以及各种其他技术。而且,尽管我们的许多系统是基于计算机科学研究的最新成果,但这往往还不够:我们的架构师和工程师不得不在尚无学术先驱涉足的方向上推进研究。我们面临的许多问题没有现成的教科书答案,因此我们——满怀热情地——发明了新的解决方法。
我们的技术几乎全部以"服务"的形式实现:一段逻辑,封装其操作的数据,并以硬化的接口作为访问其功能的唯一方式。这一方法减少了副作用,允许服务以各自的节奏演进,而不会影响整体系统的其他组件。服务导向架构(SOA)是亚马逊技术体系的基础构建抽象。得益于一支富有远见卓识的工程师和架构师团队,这一方法在SOA成为业界流行词之前很久就已在亚马逊付诸实践。我们的电商平台由数百个软件服务联合运作,从推荐到订单履行再到库存追踪,各功能协同运转。举个例子,仅为一位访问Amazon.com的客户生成一个商品详情页,我们的软件就需要调用200到300个服务,以呈现高度个性化的体验。
状态管理是任何需要扩展到超大规模的系统的核心。多年前,亚马逊的需求已超过任何商业解决方案所能承载的上限:我们的关键数据服务需要存储许多拍字节(petabytes)的数据,并处理每秒数百万次的请求。为了满足这些苛刻而特殊的需求,我们开发了多种替代性的专用持久化方案,包括我们自己的键值存储和单表存储。在这一过程中,我们大量借鉴了分布式系统和数据库研究社区的核心原则,并在此基础上进一步创新。我们所开创的存储系统在保持对性能、可用性和成本的严格控制的同时,展现出极致的可扩展性。为了实现其超大规模特性,这些系统对数据更新管理采取了一种全新的方法:通过放宽需要向大量副本传播的更新的同步要求,这些系统能够在最恶劣的性能和可用性条件下依然正常运转。这些实现基于"最终一致性"(eventual consistency)的概念。亚马逊工程师在数据管理领域的创新,已成为亚马逊网络服务(AWS)旗下云存储和数据管理服务底层架构的出发点。例如,我们的简单存储服务(Simple Storage Service,S3)目前已存储超过1万亿个数据对象,每天新增超过10亿个对象。S3常规情况下每秒处理超过50万次事务,峰值接近每秒100万次事务。
搜索是我们技术应用的另一个绝佳例证。如今,Amazon.com的搜索系统每天为数以千万计的查询提供服务,必须在毫秒内从数亿件商品中找出相关结果。如此大规模且多样化的搜索,需要多层次的机器学习技术:从语言建模(用于理解查询意图),到个性化(基于客户历史行为预测其偏好),再到结果排序(预测客户对某商品感兴趣的概率并优化排名)。商品的多样性要求我们采用经过训练的随机决策树森林(random forests of decision trees)等现代回归技术,在排序时灵活融合数千种商品属性。所有这些幕后软件的最终呈现?快速、精准的搜索结果,帮助你找到所需之物。
我们在技术上投入的所有精力,如果只是把技术隔离在某个研发部门里,可能意义并不大——但我们从不采取这种方式。技术渗透进我们所有的团队、所有的流程、我们的决策制定,以及我们在每个业务领域的创新方式。它深度融入了我们所做的一切。
一个典型例子是Whispersync,我们的Kindle服务,旨在确保无论你身处何处、携带何种设备,都能访问你的阅读库以及所有高亮、笔记和书签,并在所有Kindle设备和移动应用之间保持同步。技术挑战在于:为全球超过100个国家的数百万Kindle用户、数亿本书籍和数百种设备类型,实现全天候的可靠体验。Whispersync的核心是一个基于最终一致性的复制数据存储,配备应用自定义的冲突解决机制,能够处理设备离线长达数周乃至更长时间的情况。当然,作为Kindle用户,我们对这一切技术复杂性都是隐而不见的——打开Kindle,它已自动同步,停留在正确的页面。套用科幻作家阿瑟·克拉克的话:如同任何足够先进的技术,它与魔法无异。
此刻,如果某些尽职阅读本信的股东眼神已开始涣散,我要唤醒你们,指出一件事:在我看来,这些技术的追求并非无的放矢——它们直接通向自由现金流。
我们生活在一个带宽、磁盘空间和计算能力以惊人速度增长的时代,而这些资源还在持续快速降价。我们的团队中汇聚了世界上最顶尖的技术专家——他们正在解决当今可能性边界上的挑战。如我多次讲过的,我们坚定不移地相信:股东的长期利益与客户的利益完美契合。
我们喜欢这样的局面。发明创新是我们的DNA,技术是我们用来进化和改善客户体验每一个方面的根本工具。我们还有很多需要学习的地方,我期待并希望我们能继续如此充满乐趣地学习下去。能成为这支团队的一员,我深感自豪。
一如既往,附上我们1997年原信的副本。我们的理念不变,仍是第一天(Day 1)。
杰弗里·P·贝佐斯
创始人兼首席执行官
亚马逊公司
📊 2010年关键数据
| 指标 | 上年(2009) | 本年(2010) | 增幅 |
|---|---|---|---|
| 净销售额 | $245亿 | $342亿 | ~40% |
| 自由现金流 | $22亿 | $27亿 | ~23% |
| AWS S3存储对象数 | 未披露 | 超过1万亿 | — |
| S3峰值事务/秒 | 未披露 | 接近100万 | — |
| Kindle覆盖国家 | 未披露 | 超过100个国家 | — |
| 产品详情页调用服务数 | — | 200-300个软件服务 | — |
🧠 核心概念
概念一:服务导向架构(Service-Oriented Architecture,SOA)
中文释义: 服务导向架构是亚马逊技术体系的基础构建抽象。亚马逊将所有技术几乎全部实现为"服务"——即封装了其操作数据并以硬化接口作为唯一访问方式的逻辑模块。这一方式减少了副作用,允许各服务以自身节奏演进而不影响整体系统。贝佐斯特别强调,亚马逊在SOA成为业界流行词之前很久就已采纳这一方法。这种架构使得亚马逊的电商平台由数百个独立软件服务联合运作,仅构建一个客户的商品详情页,后台就需要调用200至300个服务。SOA架构后来也成为AWS云服务的底层基础。
关联概念: 云计算 | AWS | 微服务架构 | 最终一致性
概念二:最终一致性(Eventual Consistency)
中文释义: 最终一致性是亚马逊在分布式存储系统中自主研发的核心数据管理原则。传统数据库要求每次写操作在所有副本上立即同步(强一致性),但在极大规模下这会带来性能瓶颈。亚马逊的做法是放宽同步要求——允许副本之间存在短暂的数据不一致,但保证"最终"会达到一致状态。这一思路使系统能够在极端的性能和可用性条件下继续运转。这些由亚马逊工程师开创的数据管理进步,成为AWS云存储和数据管理服务的架构基础,例如S3和DynamoDB的前身。Kindle的Whispersync同步服务也使用了基于最终一致性的复制数据存储。
关联概念: 分布式系统 | AWS | Whispersync | 数据库设计
概念三:技术即基础设施(Technology as Infrastructure)
中文释义: 贝佐斯在2010年信中着重阐明了亚马逊的技术理念:技术不是孤立于业务之外的研发部门,而是深度融入每一个团队、每一个流程、每一项决策和每一项创新的核心要素。亚马逊应用了计算机科学前沿几乎所有主要技术:高性能事务系统、机器学习与模式识别、神经网络与概率决策、工作流与队列系统等。更关键的是,当现有学术和商业方案不足以满足需求时,亚马逊工程师会自行开拓新方向——例如开发专属的键值存储和单表存储系统来管理拍字节(petabytes)量级的数据。
关联概念: Day 1文化 | 创新 | 工程文化 | AWS起源
概念四:技术通向自由现金流(Technology Leads to Free Cash Flow)
中文释义: 贝佐斯在信中用一句话将深奥的技术讨论与股东最关心的财务回报直接挂钩。他指出,所有关于分布式系统、最终一致性、机器学习等技术的讨论并非纸上谈兵,而是直接导向自由现金流的创造。这体现了贝佐斯一贯的长期主义:技术投入在短期内可能看不出直接财务回报,但从长期看,技术能力积累是亚马逊核心竞争优势的来源,并最终转化为规模化、低成本、高质量的客户服务,形成自由现金流。
关联概念: 自由现金流 | 长期主义 | 技术投资回报 | 股东价值
概念五:Whispersync——技术"魔法"
中文释义: Whispersync是Kindle的跨设备同步服务,确保用户在全球超过100个国家、数百种设备类型上,无论身处何处都能访问自己的阅读库、书签、笔记和高亮标注,并保持实时同步。其技术挑战在于:要为数百万Kindle用户、数亿本书籍、数百种设备类型,实现24×7全天候的可靠服务。其核心是基于应用自定义冲突解决机制的最终一致性复制数据存储,能够处理设备长达数周甚至更长时间离线的情况。贝佐斯引用科幻作家阿瑟·克拉克的名言,强调最好的技术体验是让用户感受不到技术的存在,只感受到"魔法"般的效果。
关联概念: Kindle | 最终一致性 | 用户体验 | 设备生态
🔗 核心概念关系图
┌─────────────────────┐
│ 技术作为核心战略 │
│ (Technology as DNA) │
└──────────┬──────────┘
│
┌────────────────┼────────────────┐
▼ ▼ ▼
┌──────────────┐ ┌──────────────┐ ┌──────────────┐
│ 服务导向架构 │ │ 最终一致性 │ │ 机器学习/AI │
│ (SOA) │ │ (Eventual │ │ 推荐/搜索 │
└──────┬───────┘ │ Consistency) │ └──────┬───────┘
│ └──────┬───────┘ │
│ │ │
▼ ▼ ▼
┌──────────────┐ ┌──────────────┐ ┌──────────────┐
│ AWS云服务 │ │ Whispersync │ │ 个性化体验 │
│ (数百服务) │ │ Kindle同步 │ │ (客户价值) │
└──────┬───────┘ └──────────────┘ └──────────────┘
│
▼
┌──────────────┐
│ 自由现金流 │
│ Free Cash │
│ Flow │
└──────────────┘
💡 延伸思考
- 亚马逊将SOA架构应用于内部系统,后来演变为对外的AWS——这种"内部工具产品化"的路径,还有哪些其他企业成功复制过?
- 贝佐斯将技术复杂性(分布式系统、最终一致性)与"自由现金流"直接挂钩,这种向股东沟通技术价值的方式,与传统科技公司CEO的沟通风格有何不同?参见长期主义。
- Whispersync的"用户感受不到技术存在"理念,与乔布斯的产品哲学有何异同?参见用户体验设计。
- 亚马逊自研键值存储的经历,预示着后来DynamoDB的诞生——一家电商公司为何有能力和动力做底层数据库创新?
- 2010年信完全以技术为主题,没有列举通常股东信中常见的财务数字——这种"技术即护城河"的叙事策略,对投资者传递了什么信号?参见亚马逊股东信_1997。