aogl.cn — 生成式 AI 工具與大模型動態(個人書籤)

← 返回首頁 · 本站原創

OpenAI × Broadcom 發佈 Jalapeño:首款 LLM 推理專用 Intelligence Processor

9 個月流片 · GPT‑5.3‑Codex‑Spark 實驗室驗證 · 2026 年底部署

· 本站原創

本文存檔 OpenAI 官方博客Broadcom 投資者新聞稿(2026-06-24):OpenAI and Broadcom unveil LLM-optimized inference chip——聯合發佈首款專為 LLM 推理設計的 Jalapeño Intelligence Processor。科技 Hub 本篇以文字解讀發佈要點;題圖為 Sam Altman 與 Hock Tan 手持 Jalapeño 晶圓(OpenAI 官方素材)。

這是 OpenAI「自建全棧基礎設施」路線的硬件里程碑:不再僅依賴 NVIDIA/AMD 通用 GPU 租賃,而是與 Broadcom(NASDAQ: AVGO)及 Celestica 共同工業化推理加速器 + 機架 + 網絡 + 量產。與 Hub 內 NVIDIA Halos 物理 AI 安全State of AI 2026 對照,本篇聚焦推理側 ASIC 與數據中心 capex,而非消費端 App 競爭或工廠 floor 功能安全。

發佈摘要

OpenAIBroadcom(NASDAQ: AVGO) 今日發佈 Jalapeño——OpenAI 首款 Intelligence Processor:圍繞 OpenAI 對 LLM 推理未來的願景架構的加速器,也是兩家公司共建的多代計算平臺中的首款 AI 加速器,目標讓先進 AI 更快、更可靠、對更多人更可及。

Jalapeño 由 Broadcom 總裁兼 CEO Hock Tan 與總裁 Charlie Kawwas 交付給 OpenAI CEO Sam Altman 與總裁 Greg Brockman,標誌 OpenAI 在「模型與產品背後的全棧」戰略上邁出重要一步。

架構與合作伙伴

OpenAI 基於對 LLM 基礎的深度理解從零設計該芯片,輸入來自其模型路線圖、內核(kernels)、Serving 系統與產品需求;BroadcomCelestica 協助工業化:芯片實現、板卡、機架系統集成、高性能網絡與可擴展量產系統。

Jalapeño 被設計為具有靈活性,可在 OpenAI 對當前與未來 AI 模型推理需求的洞察下,適配全行業各類 LLM。工程樣片已在實驗室以量產目標頻率與功耗運行 ML 工作負載,包括 GPT‑5.3‑Codex‑Spark

OpenAI 仍在測量最終性能,但早期測試顯示 Jalapeño 的每瓦性能(performance per watt)將顯著優於當前業界最優水平;詳細技術報告將在未來數月公佈。架構通過減少數據搬運、平衡算力/內存/網絡資源,使實際利用率更接近理論峰值。Broadcom 的硅片實現與網絡技術(含 Tomahawk 網絡芯片)支撐平臺大規模量產。

高管引述

「世界正在走向算力驅動的經濟,」OpenAI 總裁兼聯合創始人 Greg Brockman 表示。「Jalapeño 是我們長期全棧基礎設施戰略的一部分,旨在讓算力更充裕,從而使 AI 更快、更可靠、對個人與企業更實惠,並可用於解決更重要的問題。通過自行設計更多棧層,我們能以更高效率服務更多智能,並推動先進 AI 向更廣泛的可及性邁進。」

「Jalapeño 是與 OpenAI 研究員緊密協作、基於詳細洞察從零為 LLM 推理設計的,」OpenAI 硬件項目負責人 Richard Ho 說。「我們圍繞對前沿 AI 模型最重要的內核、內存搬運、網絡與 Serving 模式優化架構。基於早期測試,Jalapeño 將高效執行我們最重要的工作負載,接近硬件理論極限。」

「與 OpenAI 的合作代表對擴展未來十年 AI 所需物理基礎設施的根本承諾,」Broadcom 總裁兼 CEO Hock Tan 表示。「這只是多代路線圖的起點。通過與 OpenAI 直接聯合開發業界領先的硅片,我們正在與 Microsoft 等夥伴一起,自 2026 年起啟用千兆瓦(gigawatt)級數據中心部署。」

專為 LLM 推理設計的平臺

Jalapeño 是面向現代 LLM 推理的空白頁(blank-slate)設計,而非從早期 AI 工作負載改造而來的通用加速器。它借鑑 OpenAI 每日運行的 ChatGPT、Codex、API 與未來 Agent 產品系統,同時也面向全行業當前與未來 LLM。目標是結合當今領先 AI 加速器的算力與吞吐,以及更接近最快專用推理系統的延遲,使其適合大規模交互式 LLM 產品。

這就是全棧優勢:OpenAI 不僅開發前沿模型或在之上做產品,還設計其下的基礎設施——芯片架構、內核、內存系統、網絡、調度、部署系統與產品體驗。因 OpenAI 橫跨全棧,每一層可圍繞同一目標優化:讓模型對用戶更快、更可靠、更便宜

飛輪:基礎設施 → 模型 → 產品 → 再投資

Jalapeño 強化 OpenAI 進展背後的飛輪:更好的基礎設施 → 更高算力效率 → 更好的訓練與 Serving → 更強的模型 → 更好的產品 → 更多使用與收入 → 再投資下一代基礎設施。長期看,該循環有助於讓智能更強、更可靠、更便宜

九個月流片:OpenAI 模型加速設計

Jalapeño 從初始設計到製造 tape-out九個月——OpenAI 稱這是高性能先進半導體領域有史以來最快的 ASIC 開發週期。速度來自 OpenAI 工程團隊與 Broadcom 的深度軟硬件協同,以及使用 OpenAI 模型加速部分設計與優化流程。服務用戶的同一套模型,正在幫助改進運行未來模型的基礎設施——若 AI 能幫助工程師更快設計更好的芯片,可降低全行業算力成本並民主化先進 AI。

多代平臺與 Celestica

Jalapeño 是多代計算平臺的第一步,計劃2026 年底前首次部署並在隨後年份擴展,組合包括:OpenAI 設計的加速器 + Broadcom 硅片實現/網絡/連接 + Celestica 的板卡、機架與系統專長。

推理即 AI 觸達用戶之處

這項工作的要點很簡單:推理是 AI 觸達人的地方。成本、速度、可靠性的每一次改進,都可能體現為:更快的 ChatGPT 回答、更少等待的 Codex 多步任務、更便宜的 API、或在高峰需求時更穩定的服務。民主化 AI 意味著讓先進模型可及、可靠、足夠便宜,供學生、開發者、小企業、研究人員、企業與任何學習/創造/解決難題的人日常使用。

與科技 Hub 其它內容的銜接

下方半導體/平臺前十與 IR 書籤已對搜索引擎 noindex;本篇為可索引原創解讀。更新流程:編輯 JSON → npm run build-articlesnpm run build-hubsnpm run build-seo-locales

檢索與官方入口

OpenAI 官方博客 Broadcom IR 新聞稿 OpenAI Jalapeño chip Broadcom Tomahawk datacenter LLM inference ASIC 2026 OpenAI custom silicon Broadcom 科技 Hub 全部原創索引