定义与起源
亚马逊的自研芯片战略是AWS基础设施创新的最新前沿,也可能是继AWS本身之后亚马逊最重要的垂直整合决策。虽然这一战略在贾西担任CEO后的2021年开始被系统性地对外阐述,但其技术根源可追溯到AWS长期以来对基础设施创新的追求。AWS从2018年开始推出第一代Graviton(通用CPU芯片),旨在打破Intel在服务器CPU领域的垄断地位,为客户提供更好的价格性能比。随后,亚马逊将同样的逻辑扩展到AI领域——开发了Trainium(AI训练芯片)和Inferentia(AI推理芯片),挑战NVIDIA在AI芯片领域的主导地位。到2025年,芯片业务(Graviton+Trainium+Nitro网卡)的年化收入运行率已超过200亿美元,如果作为独立企业估值约500亿美元。贾西明确表示这可能成为"亚马逊在芯片领域的一个潜在新支柱"(a potential new pillar for Amazon in chips)。
核心要义
1. Graviton——通用CPU领域的颠覆
Graviton是亚马逊自研的通用CPU芯片,设计用于替代Intel和AMD的x86处理器。核心价值主张是40%更优的价格性能比。在Graviton之前,几乎所有AWS工作负载都运行在Intel芯片上,客户别无选择。Graviton改变了这一格局:到2025年,前1000大EC2客户中98%在使用Graviton。Graviton的成功不仅为客户降低了成本,更为AWS创造了底层差异化——其他云提供商无法提供同等的价格性能比,因为他们没有自己的芯片。Graviton已迭代到第四代(Graviton4),比Graviton3提供高达30%更好的计算性能和75%更多的内存带宽。
2. Trainium——AI训练芯片的同样故事弧线
Trainium是亚马逊自研的AI训练芯片,正在AI领域复制Graviton在CPU领域的成功路径。贾西在2025年信中明确指出"同样的故事弧线正在AI领域上演"。Trainium2的性价比比同类GPU好约30%,已基本售罄。Trainium3刚于2026年初出货,性价比比Trainium2好30-40%,已几乎全部预订。Trainium4距广泛可用还有约18个月,但已有大量预订。关键在于Trainium不仅服务外部客户——Amazon Bedrock(AWS主要且快速增长的推理服务)的大部分推理已运行在Trainium上。Trainium2将为生成式AI应用提供比Trainium1快四倍的机器学习训练和三倍的内存容量。
3. Inferentia——推理专用芯片
Inferentia是亚马逊自研的AI推理芯片,专注于模型部署后的预测和输出环节。随着AI应用规模化,推理将代表未来AI成本的绝大部分——因为客户定期训练模型,但在大规模AI应用中不断产生推理。贾西预判推理将成为"另一个构建模块服务,与计算、存储、数据库等并列"。降低推理成本是释放AI广泛使用潜力的关键。领先的基础模型制造商Anthropic已宣布使用Trainium和Inferentia来构建、训练和部署其未来的基础模型。
4. 可能成为亚马逊的新支柱——改变AWS经济学
自研芯片的战略意义远不止于"降低成本"。贾西在2025年信中首次将芯片业务作为潜在的新支柱进行完整论述。核心经济学:大规模使用自研芯片预计每年节省数百亿美元资本开支,并相比依赖他人芯片进行推理提供数百个基点的运营利润率优势。芯片业务年化收入运行率超200亿美元,等效独立估值约500亿美元。未来很可能向第三方出售整机架的芯片——这意味着亚马逊可能从芯片消费者变为芯片供应商。
实际案例
-
Graviton的采用曲线:从2018年第一代推出到2025年被98%的前1000大EC2客户使用,Graviton的采用曲线是自研芯片战略可行性的最佳证明。两个大型AWS客户甚至询问能否购买2026年全部的Graviton实例容量——需求如此之大以至于亚马逊不得不拒绝。
-
Trainium代际预售售罄:Trainium2已基本售罄。Trainium3刚出货就几乎全部被预订。Trainium4距广泛可用还有约18个月,但已有大量预订。这种"代际预售售罄"的模式在芯片行业极为罕见,说明客户对价格性能比的渴求。
-
Anthropic选择Trainium:世界上最先进的AI公司之一Anthropic宣布使用Trainium和Inferentia来构建、训练和部署未来的基础模型。这是对亚马逊AI芯片能力的最高级别背书。其他使用亚马逊AI芯片的客户包括Airbnb、Hugging Face、Qualtrics、Ricoh和Snap。
-
节省超过1亿美元资本开支(2022年):到2022年,自研芯片已为亚马逊节省超过1亿美元资本开支。到2025年,随着规模扩大,预计节省额将达到"数百亿美元/年"的量级。这种成本优势直接转化为更低的客户价格和更高的AWS利润率。
常见误解
误解一:亚马逊自研芯片是为了与NVIDIA竞争
纠偏:贾西在2025年信中明确表示"我们与英伟达有着牢固的合作关系,始终会有客户选择使用英伟达,我们将继续让AWS成为运行英伟达的最佳场所"。AWS继续提供所有云提供商中最广泛的NVIDIA实例集合。自研芯片的目的是为客户提供更多选择和更好的价格性能比,而非替代NVIDIA。两者是互补关系——不同客户、不同工作负载有不同的最优选择。
误解二:芯片设计不是亚马逊的核心能力
纠偏:亚马逊通过2015年收购Annapurna Labs(以色列芯片设计公司)获得了芯片设计核心团队。此后投入大量资源建设芯片设计能力,已成功迭代多代产品(Graviton 1-4、Trainium 1-4、Inferentia 1-2、Nitro)。98%的前1000大客户采用Graviton证明了产品质量。芯片设计已成为亚马逊的核心能力之一。
误解三:自研芯片只是为了降低AWS的成本
纠偏:虽然成本优势是重要的驱动力(预计每年节省数百亿美元资本开支),但自研芯片的战略意义远不止于此。它创造了竞争护城河——其他云提供商无法复制这种价格性能优势;它使AWS能够提供差异化的底层性能;它正在成为独立的收入来源(年化200亿+,未来可能对外销售整机架);它改变了AWS的利润结构(数百个基点的运营利润率优势)。芯片是AWS的战略武器,不仅仅是成本工具。
思想演变(2018→2025)
| 时期 | 表述 | 关键变化 |
|---|---|---|
| 2018 | Graviton1发布 | 自研CPU芯片的首次尝试——挑战Intel在服务器领域的垄断 |
| 2021 | 贾西首封信提及芯片战略 | 芯片从技术项目升级为CEO级战略叙事 |
| 2022 | Graviton3 + Trainium1发布 | CPU和AI双线推进;"已为亚马逊节省$100M+资本开支" |
| 2023 | 全栈AI战略 + Trainium2/Inferentia2宣布 | 芯片成为GenAI三层堆栈底层的核心;Anthropic选择Trainium |
| 2024 | Trainium2交付 + 30-40%性价比优势 | 性价比优势从理论变为现实;AI芯片收入以三位数增长 |
| 2025 | "$20B+运行率,等效$50B独立估值" | 芯片作为"潜在新支柱"被首次正式定位 |
芯片战略的演变体现了亚马逊经典的"垂直整合"逻辑:当市场上的供应商不能满足你的需求(性能、成本或可用性),就自己做。Intel/AMD在CPU领域缺乏竞争导致价格性能停滞→Graviton。NVIDIA在AI芯片领域供应稀缺且成本高昂→Trainium。每一次垂直整合都遵循同样的模式:先在内部使用证明可行,再逐步对外开放。最深刻的变化是2025年——当贾西将芯片业务等效估值为500亿美元独立企业并暗示未来可能对外销售整机架时,芯片从"AWS的成本优化工具"变成了"亚马逊可能的新收入支柱"。如果Trainium真的能每年节省"数百亿美元"资本开支并提供"数百个基点"利润率优势,这将是亚马逊历史上仅次于AWS本身的最重要的垂直整合决策。