📖 产品简介

Jalapeño（哈拉贝诺辣椒）是 OpenAI 2026/6/24 与博通（Broadcom）联合发布的**首款自研 AI 推理芯片**，由台积电 3nm 工艺代工，**9 个月完成从设计到流片**——刷新行业纪录。这是科技巨头中 OpenAI 第一次把「自研芯片」从传言变成实物，意味着它要从英伟达 GPU 的绝对依赖里部分抽离。

核心定位：**专攻 LLM 推理**（不是训练），瞄准 ChatGPT 这种规模 API 调用下的「成本黑洞」。博通 CEO 陈福阳在发布会上披露：**早期实验室测试中，Jalapeño 的推理成本较主流 GPU 节省约 50%，性能对标英伟达 Blackwell**——如果落地真能跑出这个数字，就意味着 OpenAI 的单次 ChatGPT 调用成本可能直接腰斩。

**节奏与生态**：芯片由谷歌 TPU 老将主导，与博通共同设计、Celestica 协助制造、台积电流片，**计划 2026 年底首批部署**，并明言这是「**多代芯片发展计划的第一步**」。从 2026 年起将与微软等合作伙伴共同推动**千兆瓦级数据中心部署**。OpenAI 仍在评估是否把自研芯片对外销售或仅自用。

意义：**Jalapeño 的出现标志着 AI 大厂从「买卡」时代正式进入「造芯」时代**——继谷歌 TPU、亚马逊 Trainium、Meta MTIA 之后，OpenAI 成为又一个加入自研阵营的玩家，给英伟达「卖铲子」生意第一次出现明显裂缝。

⚡ 核心功能

9 个月流片：从设计到流片仅 9 个月，刷新行业纪录；与博通联合设计、台积电 3nm 工艺代工
推理成本降 50%：早期实验室测试推理成本较主流 GPU 节省约 50%（博通 CEO 陈福阳披露）
性能对标 Blackwell：在推理负载上对标英伟达 Blackwell；同台谷歌 TPU、AWS Trainium 等定制 ASIC
专攻 LLM 推理：为 ChatGPT 等规模化 API 调用优化，不是训练芯片——节流而非攻顶
多代芯片计划起点：Jalapeño 是 OpenAI 多代芯片发展计划的第一步，后续会有持续迭代
千兆瓦级数据中心：2026 起将与微软等合作伙伴共同推动千兆瓦级数据中心部署
TPU 大将主导：由原谷歌 TPU 团队核心人物主导设计，工程血统硬核

🎯 适合谁用

以下类型的用户会特别受益于 OpenAI Jalapeño：

OpenAI 自家 ChatGPT / API / Codex 等大规模推理负载
微软 Azure 上 OpenAI 系列模型的成本下沉
未来可能对外销售时，企业大规模推理负载选型替代英伟达推理卡
国产同行（华为昇腾 / 寒武纪等）对标参照系
AI 基础设施分析师 / 投资人评估「英伟达天花板」时的关键变量

✅ 优点亮点

9 个月流片速度行业纪录
推理成本相较主流 GPU 节省约 50%（实验室）
性能对标英伟达 Blackwell
OpenAI 自研芯片之路的明确起点 + 多代计划
博通 + 台积电 + 谷歌 TPU 系人才组合，工程实力扎实
对英伟达「绝对垄断」是一次实质性裂缝

💰 价格与方案

**未对外销售**：目前仅供 OpenAI 自用 + 微软等深度合作伙伴部署。是否对外开放销售仍在评估中。**间接受益**：用户使用 ChatGPT / API 的成本下降预期。

📝 总结与建议

Jalapeño 是 OpenAI 在「英伟达卡难买、推理成本飙升」背景下迈出的关键一步——**9 个月流片 + 推理成本降 50% + 性能对标 Blackwell**，让 AI 大厂从「买卡」进入「造芯」。当前更多是战略信号而非用户可直接采购的产品；但对 ChatGPT 用户、OpenAI API 开发者来说，未来一年内推理成本与可用性可能因此显著改善。对国产芯片厂商（华为昇腾、寒武纪等），Jalapeño 则是必须研究的对标对象。

🕐 版本演进

Jalapeño（首款自研推理芯片） （2026-06-24）：与博通联合发布，台积电 3nm 工艺，9 个月流片；推理成本较主流 GPU 降低约 50%；性能对标英伟达 Blackwell；2026 年底首批部署

OpenAI Jalapeño 热门 新增