OpenAI 造了自己的 AI 推理芯片,跟博通联手整了个叫 Jalapeño 的东西
资讯动态 5 次阅读

OpenAI 造了自己的 AI 推理芯片,跟博通联手整了个叫 Jalapeño 的东西

OpenAI Jalapeño芯片

OpenAI 造了自己的 AI 芯片,跟博通联手整了个叫 Jalapeño 的东西

今天凌晨,OpenAI 正式宣布了他们的第一颗自研 AI 推理芯片,代号叫 Jalapeño(墨西哥小辣椒)。这名字挺有意思的,可能是想说这芯片个头不大但够辣。

先说说这颗芯片是干嘛的。

Jalapeño 是一颗专门为 AI 推理设计的 ASIC 芯片,也就是专用集成电路。它不负责训练大模型——那个还是得靠 GPU 集群搞——而是在模型训练好之后,负责低成本、高效率地跑推理。换句话说,ChatGPT 每次回答你问题的时候,背后跑的就是推理。这笔账算下来,推理的算力需求比训练大得多,所以 OpenAI 才会自己去造芯片。

跟谁造的?博通。没错,就是那家做网络芯片和无线通信的巨头。据业内人士分析,Jalapeño 的设计指标相当猛:一个接近光罩极限的大核心,配备大约 216GB 的 HBM3E 高带宽内存,带宽 7.1-7.4 TB/s,FP4 精度下算力接近 10 PFLOPS。什么概念呢?就是一颗芯片的推理性能,可能抵得上好几块英伟达 H100。

更狠的是,从设计到 Tape-out(流片)据说只用了 9 个月。这个速度在芯片行业是极为罕见的——正常一颗高复杂度的 AI 芯片从设计到流片,一年半到两年是标准周期。OpenAI 能这么快,据说是他们自己的大模型参与了芯片设计辅助。这就是"用 AI 设计 AI 芯片"的闭环。

OpenAI 合伙人 Greg Brockman 在公告里特别强调了性能功耗比,说这款芯片"专门针对 LLM 推理工作负载做了深度优化"。这个信息量很大——言下之意是不只是通用 GPU 的思路,而是针对 Transformer 架构做了定制加速。

为什么 OpenAI 要自己做芯片?

说白了就是算力太贵了。ChatGPT 每天的推理成本是个天文数字,而英伟达的 GPU 不仅贵还不一定买得到。自己做芯片,虽然前期投入几百亿,但长期来看单位成本能降很多。OpenAI 自己的估算,Jalapeño 部署到位后,推理成本有望下降 50% 以上。

这不只是 OpenAI 一家的事。谷歌有 TPU,亚马逊有 Trainium/Inferentia,微软有 Maia,现在 OpenAI 也加入了。AI 大厂们纷纷"自研芯片"的趋势已经很明确了——大家都不想被英伟达卡脖子。

当然,量产和部署需要时间。Jalapeño 计划先在内部替换部分 GPU 推理集群,未来可能开放给第三方使用。但短期内,英伟达在 AI 芯片市场的统治地位不会动摇。

不过方向已经很清楚了:AI 硬件的下一场战争,已经打响了。

分享

评论 (0)

评论通过后显示

暂无评论,来写第一条吧 ✍️