📖 产品简介
Jalapeño(哈拉贝诺辣椒)是 OpenAI 2026/6/24 与博通(Broadcom)联合发布的**首款自研 AI 推理芯片**,由台积电 3nm 工艺代工,**9 个月完成从设计到流片**——刷新行业纪录。这是科技巨头中 OpenAI 第一次把「自研芯片」从传言变成实物,意味着它要从英伟达 GPU 的绝对依赖里部分抽离。
核心定位:**专攻 LLM 推理**(不是训练),瞄准 ChatGPT 这种规模 API 调用下的「成本黑洞」。博通 CEO 陈福阳在发布会上披露:**早期实验室测试中,Jalapeño 的推理成本较主流 GPU 节省约 50%,性能对标英伟达 Blackwell**——如果落地真能跑出这个数字,就意味着 OpenAI 的单次 ChatGPT 调用成本可能直接腰斩。
**节奏与生态**:芯片由谷歌 TPU 老将主导,与博通共同设计、Celestica 协助制造、台积电流片,**计划 2026 年底首批部署**,并明言这是「**多代芯片发展计划的第一步**」。从 2026 年起将与微软等合作伙伴共同推动**千兆瓦级数据中心部署**。OpenAI 仍在评估是否把自研芯片对外销售或仅自用。
意义:**Jalapeño 的出现标志着 AI 大厂从「买卡」时代正式进入「造芯」时代**——继谷歌 TPU、亚马逊 Trainium、Meta MTIA 之后,OpenAI 成为又一个加入自研阵营的玩家,给英伟达「卖铲子」生意第一次出现明显裂缝。
⚡ 核心功能
- 9 个月流片:从设计到流片仅 9 个月,刷新行业纪录;与博通联合设计、台积电 3nm 工艺代工
- 推理成本降 50%:早期实验室测试推理成本较主流 GPU 节省约 50%(博通 CEO 陈福阳披露)
- 性能对标 Blackwell:在推理负载上对标英伟达 Blackwell;同台谷歌 TPU、AWS Trainium 等定制 ASIC
- 专攻 LLM 推理:为 ChatGPT 等规模化 API 调用优化,不是训练芯片——节流而非攻顶
- 多代芯片计划起点:Jalapeño 是 OpenAI 多代芯片发展计划的第一步,后续会有持续迭代
- 千兆瓦级数据中心:2026 起将与微软等合作伙伴共同推动千兆瓦级数据中心部署
- TPU 大将主导:由原谷歌 TPU 团队核心人物主导设计,工程血统硬核
🎯 适合谁用
以下类型的用户会特别受益于 OpenAI Jalapeño:
- OpenAI 自家 ChatGPT / API / Codex 等大规模推理负载
- 微软 Azure 上 OpenAI 系列模型的成本下沉
- 未来可能对外销售时,企业大规模推理负载选型替代英伟达推理卡
- 国产同行(华为昇腾 / 寒武纪等)对标参照系
- AI 基础设施分析师 / 投资人评估「英伟达天花板」时的关键变量
✅ 优点亮点
- 9 个月流片速度行业纪录
- 推理成本相较主流 GPU 节省约 50%(实验室)
- 性能对标英伟达 Blackwell
- OpenAI 自研芯片之路的明确起点 + 多代计划
- 博通 + 台积电 + 谷歌 TPU 系人才组合,工程实力扎实
- 对英伟达「绝对垄断」是一次实质性裂缝
💰 价格与方案
**未对外销售**:目前仅供 OpenAI 自用 + 微软等深度合作伙伴部署。是否对外开放销售仍在评估中。**间接受益**:用户使用 ChatGPT / API 的成本下降预期。
📝 总结与建议
Jalapeño 是 OpenAI 在「英伟达卡难买、推理成本飙升」背景下迈出的关键一步——**9 个月流片 + 推理成本降 50% + 性能对标 Blackwell**,让 AI 大厂从「买卡」进入「造芯」。当前更多是战略信号而非用户可直接采购的产品;但对 ChatGPT 用户、OpenAI API 开发者来说,未来一年内推理成本与可用性可能因此显著改善。对国产芯片厂商(华为昇腾、寒武纪等),Jalapeño 则是必须研究的对标对象。
🕐 版本演进
- Jalapeño(首款自研推理芯片) (2026-06-24):与博通联合发布,台积电 3nm 工艺,9 个月流片;推理成本较主流 GPU 降低约 50%;性能对标英伟达 Blackwell;2026 年底首批部署