OpenAI × Broadcom 发布 Jalapeño：首款 LLM 推理专用 Intelligence Processor

本文存档 OpenAI 官方博客与 Broadcom 投资者新闻稿（2026-06-24）：OpenAI and Broadcom unveil LLM-optimized inference chip——联合发布首款专为 LLM 推理设计的 Jalapeño Intelligence Processor。科技 Hub 本篇以文字解读发布要点；题图为 Sam Altman 与 Hock Tan 手持 Jalapeño 晶圆（OpenAI 官方素材）。

这是 OpenAI「自建全栈基础设施」路线的硬件里程碑：不再仅依赖 NVIDIA/AMD 通用 GPU 租赁，而是与 Broadcom（NASDAQ: AVGO）及 Celestica 共同工业化推理加速器 + 机架 + 网络 + 量产。与 Hub 内 NVIDIA Halos 物理 AI 安全、State of AI 2026 对照，本篇聚焦推理侧 ASIC 与数据中心 capex，而非消费端 App 竞争或工厂 floor 功能安全。

发布摘要

OpenAI 与 Broadcom（NASDAQ: AVGO） 今日发布 Jalapeño——OpenAI 首款 Intelligence Processor：围绕 OpenAI 对 LLM 推理未来的愿景架构的加速器，也是两家公司共建的多代计算平台中的首款 AI 加速器，目标让先进 AI 更快、更可靠、对更多人更可及。

Jalapeño 由 Broadcom 总裁兼 CEO Hock Tan 与总裁 Charlie Kawwas 交付给 OpenAI CEO Sam Altman 与总裁 Greg Brockman，标志 OpenAI 在「模型与产品背后的全栈」战略上迈出重要一步。

架构与合作伙伴

OpenAI 基于对 LLM 基础的深度理解从零设计该芯片，输入来自其模型路线图、内核（kernels）、Serving 系统与产品需求；Broadcom 与 Celestica 协助工业化：芯片实现、板卡、机架系统集成、高性能网络与可扩展量产系统。

Jalapeño 被设计为具有灵活性，可在 OpenAI 对当前与未来 AI 模型推理需求的洞察下，适配全行业各类 LLM。工程样片已在实验室以量产目标频率与功耗运行 ML 工作负载，包括 GPT‑5.3‑Codex‑Spark。

OpenAI 仍在测量最终性能，但早期测试显示 Jalapeño 的每瓦性能（performance per watt）将显著优于当前业界最优水平；详细技术报告将在未来数月公布。架构通过减少数据搬运、平衡算力/内存/网络资源，使实际利用率更接近理论峰值。Broadcom 的硅片实现与网络技术（含 Tomahawk 网络芯片）支撑平台大规模量产。

高管引述

「世界正在走向算力驱动的经济，」OpenAI 总裁兼联合创始人 Greg Brockman 表示。「Jalapeño 是我们长期全栈基础设施战略的一部分，旨在让算力更充裕，从而使 AI 更快、更可靠、对个人与企业更实惠，并可用于解决更重要的问题。通过自行设计更多栈层，我们能以更高效率服务更多智能，并推动先进 AI 向更广泛的可及性迈进。」

「Jalapeño 是与 OpenAI 研究员紧密协作、基于详细洞察从零为 LLM 推理设计的，」OpenAI 硬件项目负责人 Richard Ho 说。「我们围绕对前沿 AI 模型最重要的内核、内存搬运、网络与 Serving 模式优化架构。基于早期测试，Jalapeño 将高效执行我们最重要的工作负载，接近硬件理论极限。」

「与 OpenAI 的合作代表对扩展未来十年 AI 所需物理基础设施的根本承诺，」Broadcom 总裁兼 CEO Hock Tan 表示。「这只是多代路线图的起点。通过与 OpenAI 直接联合开发业界领先的硅片，我们正在与 Microsoft 等伙伴一起，自 2026 年起启用千兆瓦（gigawatt）级数据中心部署。」

专为 LLM 推理设计的平台

Jalapeño 是面向现代 LLM 推理的空白页（blank-slate）设计，而非从早期 AI 工作负载改造而来的通用加速器。它借鉴 OpenAI 每日运行的 ChatGPT、Codex、API 与未来 Agent 产品系统，同时也面向全行业当前与未来 LLM。目标是结合当今领先 AI 加速器的算力与吞吐，以及更接近最快专用推理系统的延迟，使其适合大规模交互式 LLM 产品。

这就是全栈优势：OpenAI 不仅开发前沿模型或在之上做产品，还设计其下的基础设施——芯片架构、内核、内存系统、网络、调度、部署系统与产品体验。因 OpenAI 横跨全栈，每一层可围绕同一目标优化：让模型对用户更快、更可靠、更便宜。

飞轮：基础设施 → 模型 → 产品 → 再投资

Jalapeño 强化 OpenAI 进展背后的飞轮：更好的基础设施 → 更高算力效率 → 更好的训练与 Serving → 更强的模型 → 更好的产品 → 更多使用与收入 → 再投资下一代基础设施。长期看，该循环有助于让智能更强、更可靠、更便宜。

九个月流片：OpenAI 模型加速设计

Jalapeño 从初始设计到制造 tape-out 仅九个月——OpenAI 称这是高性能先进半导体领域有史以来最快的 ASIC 开发周期。速度来自 OpenAI 工程团队与 Broadcom 的深度软硬件协同，以及使用 OpenAI 模型加速部分设计与优化流程。服务用户的同一套模型，正在帮助改进运行未来模型的基础设施——若 AI 能帮助工程师更快设计更好的芯片，可降低全行业算力成本并民主化先进 AI。

多代平台与 Celestica

Jalapeño 是多代计算平台的第一步，计划2026 年底前首次部署并在随后年份扩展，组合包括：OpenAI 设计的加速器 + Broadcom 硅片实现/网络/连接 + Celestica 的板卡、机架与系统专长。

推理即 AI 触达用户之处

这项工作的要点很简单：推理是 AI 触达人的地方。成本、速度、可靠性的每一次改进，都可能体现为：更快的 ChatGPT 回答、更少等待的 Codex 多步任务、更便宜的 API、或在高峰需求时更稳定的服务。民主化 AI 意味着让先进模型可及、可靠、足够便宜，供学生、开发者、小企业、研究人员、企业与任何学习/创造/解决难题的人日常使用。

与科技 Hub 其它内容的衔接

下方半导体/平台前十与 IR 书签已对搜索引擎 noindex；本篇为可索引原创解读。更新流程：编辑 JSON → npm run build-articles → npm run build-hubs → npm run build-seo-locales。

检索与官方入口

OpenAI 官方博客 Broadcom IR 新闻稿 OpenAI Jalapeño chip Broadcom Tomahawk datacenter LLM inference ASIC 2026 OpenAI custom silicon Broadcom 科技 Hub 全部原创索引