定义与起源

亚马逊的自研芯片战略是AWS基础设施创新的最新前沿,也可能是继AWS本身之后亚马逊最重要的垂直整合决策。虽然这一战略在贾西担任CEO后的2021年开始被系统性地对外阐述,但其技术根源可追溯到AWS长期以来对基础设施创新的追求。AWS从2018年开始推出第一代Graviton(通用CPU芯片),旨在打破Intel在服务器CPU领域的垄断地位,为客户提供更好的价格性能比。随后,亚马逊将同样的逻辑扩展到AI领域——开发了Trainium(AI训练芯片)和Inferentia(AI推理芯片),挑战NVIDIA在AI芯片领域的主导地位。到2025年,芯片业务(Graviton+Trainium+Nitro网卡)的年化收入运行率已超过200亿美元,如果作为独立企业估值约500亿美元。贾西明确表示这可能成为"亚马逊在芯片领域的一个潜在新支柱"(a potential new pillar for Amazon in chips)。

核心要义

1. Graviton——通用CPU领域的颠覆

Graviton是亚马逊自研的通用CPU芯片,设计用于替代Intel和AMD的x86处理器。核心价值主张是40%更优的价格性能比。在Graviton之前,几乎所有AWS工作负载都运行在Intel芯片上,客户别无选择。Graviton改变了这一格局:到2025年,前1000大EC2客户中98%在使用Graviton。Graviton的成功不仅为客户降低了成本,更为AWS创造了底层差异化——其他云提供商无法提供同等的价格性能比,因为他们没有自己的芯片。Graviton已迭代到第四代(Graviton4),比Graviton3提供高达30%更好的计算性能和75%更多的内存带宽。

2. Trainium——AI训练芯片的同样故事弧线

Trainium是亚马逊自研的AI训练芯片,正在AI领域复制Graviton在CPU领域的成功路径。贾西在2025年信中明确指出"同样的故事弧线正在AI领域上演"。Trainium2的性价比比同类GPU好约30%,已基本售罄。Trainium3刚于2026年初出货,性价比比Trainium2好30-40%,已几乎全部预订。Trainium4距广泛可用还有约18个月,但已有大量预订。关键在于Trainium不仅服务外部客户——Amazon Bedrock(AWS主要且快速增长的推理服务)的大部分推理已运行在Trainium上。Trainium2将为生成式AI应用提供比Trainium1快四倍的机器学习训练和三倍的内存容量。

3. Inferentia——推理专用芯片

Inferentia是亚马逊自研的AI推理芯片,专注于模型部署后的预测和输出环节。随着AI应用规模化,推理将代表未来AI成本的绝大部分——因为客户定期训练模型,但在大规模AI应用中不断产生推理。贾西预判推理将成为"另一个构建模块服务,与计算、存储、数据库等并列"。降低推理成本是释放AI广泛使用潜力的关键。领先的基础模型制造商Anthropic已宣布使用Trainium和Inferentia来构建、训练和部署其未来的基础模型。

4. 可能成为亚马逊的新支柱——改变AWS经济学

自研芯片的战略意义远不止于"降低成本"。贾西在2025年信中首次将芯片业务作为潜在的新支柱进行完整论述。核心经济学:大规模使用自研芯片预计每年节省数百亿美元资本开支,并相比依赖他人芯片进行推理提供数百个基点的运营利润率优势。芯片业务年化收入运行率超200亿美元,等效独立估值约500亿美元。未来很可能向第三方出售整机架的芯片——这意味着亚马逊可能从芯片消费者变为芯片供应商。

实际案例

  • Graviton的采用曲线:从2018年第一代推出到2025年被98%的前1000大EC2客户使用,Graviton的采用曲线是自研芯片战略可行性的最佳证明。两个大型AWS客户甚至询问能否购买2026年全部的Graviton实例容量——需求如此之大以至于亚马逊不得不拒绝。

  • Trainium代际预售售罄:Trainium2已基本售罄。Trainium3刚出货就几乎全部被预订。Trainium4距广泛可用还有约18个月,但已有大量预订。这种"代际预售售罄"的模式在芯片行业极为罕见,说明客户对价格性能比的渴求。

  • Anthropic选择Trainium:世界上最先进的AI公司之一Anthropic宣布使用Trainium和Inferentia来构建、训练和部署未来的基础模型。这是对亚马逊AI芯片能力的最高级别背书。其他使用亚马逊AI芯片的客户包括Airbnb、Hugging Face、Qualtrics、Ricoh和Snap。

  • 节省超过1亿美元资本开支(2022年):到2022年,自研芯片已为亚马逊节省超过1亿美元资本开支。到2025年,随着规模扩大,预计节省额将达到"数百亿美元/年"的量级。这种成本优势直接转化为更低的客户价格和更高的AWS利润率。

常见误解

误解一:亚马逊自研芯片是为了与NVIDIA竞争

纠偏:贾西在2025年信中明确表示"我们与英伟达有着牢固的合作关系,始终会有客户选择使用英伟达,我们将继续让AWS成为运行英伟达的最佳场所"。AWS继续提供所有云提供商中最广泛的NVIDIA实例集合。自研芯片的目的是为客户提供更多选择和更好的价格性能比,而非替代NVIDIA。两者是互补关系——不同客户、不同工作负载有不同的最优选择。

误解二:芯片设计不是亚马逊的核心能力

纠偏:亚马逊通过2015年收购Annapurna Labs(以色列芯片设计公司)获得了芯片设计核心团队。此后投入大量资源建设芯片设计能力,已成功迭代多代产品(Graviton 1-4、Trainium 1-4、Inferentia 1-2、Nitro)。98%的前1000大客户采用Graviton证明了产品质量。芯片设计已成为亚马逊的核心能力之一。

误解三:自研芯片只是为了降低AWS的成本

纠偏:虽然成本优势是重要的驱动力(预计每年节省数百亿美元资本开支),但自研芯片的战略意义远不止于此。它创造了竞争护城河——其他云提供商无法复制这种价格性能优势;它使AWS能够提供差异化的底层性能;它正在成为独立的收入来源(年化200亿+,未来可能对外销售整机架);它改变了AWS的利润结构(数百个基点的运营利润率优势)。芯片是AWS的战略武器,不仅仅是成本工具。

思想演变(2018→2025)

时期 表述 关键变化
2018 Graviton1发布 自研CPU芯片的首次尝试——挑战Intel在服务器领域的垄断
2021 贾西首封信提及芯片战略 芯片从技术项目升级为CEO级战略叙事
2022 Graviton3 + Trainium1发布 CPU和AI双线推进;"已为亚马逊节省$100M+资本开支"
2023 全栈AI战略 + Trainium2/Inferentia2宣布 芯片成为GenAI三层堆栈底层的核心;Anthropic选择Trainium
2024 Trainium2交付 + 30-40%性价比优势 性价比优势从理论变为现实;AI芯片收入以三位数增长
2025 "$20B+运行率,等效$50B独立估值" 芯片作为"潜在新支柱"被首次正式定位

芯片战略的演变体现了亚马逊经典的"垂直整合"逻辑:当市场上的供应商不能满足你的需求(性能、成本或可用性),就自己做。Intel/AMD在CPU领域缺乏竞争导致价格性能停滞→Graviton。NVIDIA在AI芯片领域供应稀缺且成本高昂→Trainium。每一次垂直整合都遵循同样的模式:先在内部使用证明可行,再逐步对外开放。最深刻的变化是2025年——当贾西将芯片业务等效估值为500亿美元独立企业并暗示未来可能对外销售整机架时,芯片从"AWS的成本优化工具"变成了"亚马逊可能的新收入支柱"。如果Trainium真的能每年节省"数百亿美元"资本开支并提供"数百个基点"利润率优势,这将是亚马逊历史上仅次于AWS本身的最重要的垂直整合决策。

原话引用

💬 2025 (贾西) "Having our own hotly demanded AI chip opens up many possibilities, but perhaps none larger than the ability to lower costs for customers and secure better economics for AWS. At scale, we expect Trainium will save us tens of billions of capex dollars per year, and provide several hundred basis points of operating margin advantage versus relying on others' chips for inference." 拥有自己广受追捧的AI芯片打开了许多可能性,但也许没有什么比降低客户成本和为AWS获得更好经济性更重要的了。在大规模运营下,我们预计Trainium每年将为我们节省数百亿美元的资本支出,并相比依赖他人的芯片进行推理,提供数百个基点的运营利润率优势。
💬 2025 (贾西) "The same story arc is playing out in AI. Our second-generation custom AI chip (Trainium2) has roughly 30% better price-performance than comparable GPUs and is essentially sold out." 同样的故事弧线正在AI领域上演。我们第二代自研AI芯片(Trainium2)的性价比比同类GPU约好30%,已基本售罄。
💬 2025 (贾西) "We have a strong partnership with NVIDIA, there'll always be customers who want to use NVIDIA, and we'll keep making AWS the best place to run NVIDIA. However, customers want better price-performance." 我们与英伟达有着牢固的合作关系,始终会有客户选择使用英伟达,我们将继续让AWS成为运行英伟达的最佳场所。然而,客户想要更好的性价比。
💬 2025 (贾西) "Our chip business (Graviton, Trainium, and Nitro) has an annualized revenue run rate of over $20 billion now, growing triple digits year-over-year." 我们芯片业务(包括Graviton、Trainium和Nitro)的年化收入运行率目前已超过200亿美元,同比三位数增长。
💬 2025 (贾西) "If our chip business were a standalone company, selling chips produced this year to both AWS and other third parties… our annualized run rate would be approximately $50 billion." 如果我们的芯片业务是一家独立企业,将今年生产的芯片同时卖给AWS和其他第三方,我们的年化运行率将约为500亿美元。
💬 2023 (贾西) "Customers have asked us to push the envelope on AI chips price-performance, much the way we did with general-purpose CPU chips with Graviton." 客户要求我们在AI芯片的性价比上突破极限,就像我们在通用CPU芯片上用Graviton所做的一样。
💬 2023 (贾西) "Graviton chips provide approximately 40% better price-performance than other leading x86 processors." Graviton芯片比其他领先的x86处理器提供约40%更好的性价比。
💬 2025 (贾西) "Graviton's price-performance is 40% better than other x86 processors, and it's now widely used by 98% of the top 1,000 EC2 customers." Graviton的性价比比其他x86处理器高出40%,现在被前1000大EC2客户中的98%广泛使用。
💬 2024 (贾西) "AI doesn't have to be as expensive as it is today, and it won't be going forward. Chips are the biggest culprit." AI不必像今天这么贵,将来也不会。芯片是最大的罪魁祸首。
💬 2024 (贾西) "Lowering AI unit costs will unlock AI being used as pervasively as possible, and will also bring more total AI spend." 降低AI单位成本将释放AI被尽可能广泛使用的潜力,也会带来更多的AI总支出。

关联概念

  • AWS战略 — 自研芯片是AWS底层差异化的核心,可能成为改变AWS经济学的关键变量
  • 原语思维 — 芯片是最底层的"硬件原语"——在其上构建计算、存储、AI等所有高层原语
  • 直线是谎言 — 从Graviton1到Trainium4的迭代之路充满曲折,是非线性进步的典型案例
  • 亚马逊领导力原则 — "Customer Obsession"驱动了芯片战略——客户要求更好的价格性能比
  • 长期主义 — 芯片设计需要数年的前期投入才能见到回报——这是长期主义的又一体现