OpenAI и Broadcom (24 июня 2026) представили Jalapeño — первый Intelligence Processor для LLM inference. Tape-out за 9 месяцев; развёртывание к концу 2026 с Microsoft.
Главное
- ASIC с нуля под LLM inference, не адаптированный GPU
- Полный стек OpenAI: чип, ядра, память, сеть, serving
- Broadcom (Tomahawk) + Celestica (стойки/платы)
- Лабораторные образцы с GPT‑5.3‑Codex‑Spark
- З заявлен perf/W выше SOTA; бенчмарки позже
См. NVIDIA Halos, State of AI 2026.