OpenAI와 Broadcom(2026-06-24)이 LLM 추론용 첫 Jalapeño Intelligence Processor 공개. 9개월 tape-out, GPT‑5.3‑Codex‑Spark 랩 검증, 2026년 말 배포.
핵심
- LLM inference 전용 blank-slate ASIC
- OpenAI 전 스택(칩·커널·네트워크·Serving) 최적화
- Broadcom(Tomahawk)·Celestica(랙/보드) 협력
- 초기 perf/W, SOTA 대비 상당히 우수(벤치는 추후)
- Microsoft 등과 2026 gigawatt급 DC
관련: NVIDIA Halos, State of AI 2026.