
OpenAI 造了自己的 AI 芯片,跟博通联手整了个叫 Jalapeño 的东西
今天凌晨,OpenAI 正式宣布了他们的第一颗自研 AI 推理芯片,代号叫 Jalapeño(墨西哥小辣椒)。这名字挺有意思的,可能是想说这芯片个头不大但够辣。
先说说这颗芯片是干嘛的。
Jalapeño 是一颗专门为 AI 推理设计的 ASIC 芯片,也就是专用集成电路。它不负责训练大模型——那个还是得靠 GPU 集群搞——而是在模型训练好之后,负责低成本、高效率地跑推理。换句话说,ChatGPT 每次回答你问题的时候,背后跑的就是推理。这笔账算下来,推理的算力需求比训练大得多,所以 OpenAI 才会自己去造芯片。
跟谁造的?博通。没错,就是那家做网络芯片和无线通信的巨头。据业内人士分析,Jalapeño 的设计指标相当猛:一个接近光罩极限的大核心,配备大约 216GB 的 HBM3E 高带宽内存,带宽 7.1-7.4 TB/s,FP4 精度下算力接近 10 PFLOPS。什么概念呢?就是一颗芯片的推理性能,可能抵得上好几块英伟达 H100。
更狠的是,从设计到 Tape-out(流片)据说只用了 9 个月。这个速度在芯片行业是极为罕见的——正常一颗高复杂度的 AI 芯片从设计到流片,一年半到两年是标准周期。OpenAI 能这么快,据说是他们自己的大模型参与了芯片设计辅助。这就是"用 AI 设计 AI 芯片"的闭环。
OpenAI 合伙人 Greg Brockman 在公告里特别强调了性能功耗比,说这款芯片"专门针对 LLM 推理工作负载做了深度优化"。这个信息量很大——言下之意是不只是通用 GPU 的思路,而是针对 Transformer 架构做了定制加速。
为什么 OpenAI 要自己做芯片?
说白了就是算力太贵了。ChatGPT 每天的推理成本是个天文数字,而英伟达的 GPU 不仅贵还不一定买得到。自己做芯片,虽然前期投入几百亿,但长期来看单位成本能降很多。OpenAI 自己的估算,Jalapeño 部署到位后,推理成本有望下降 50% 以上。
这不只是 OpenAI 一家的事。谷歌有 TPU,亚马逊有 Trainium/Inferentia,微软有 Maia,现在 OpenAI 也加入了。AI 大厂们纷纷"自研芯片"的趋势已经很明确了——大家都不想被英伟达卡脖子。
当然,量产和部署需要时间。Jalapeño 计划先在内部替换部分 GPU 推理集群,未来可能开放给第三方使用。但短期内,英伟达在 AI 芯片市场的统治地位不会动摇。
不过方向已经很清楚了:AI 硬件的下一场战争,已经打响了。
评论 (0)
暂无评论,来写第一条吧 ✍️