OpenAI初の独自推論チップ「Jalapeño」公開:9ヶ月での開発を支えたAI設計とフルスタック戦略
OpenAIは、Broadcomと共同開発した最新LLMおよびエージェント型AIワークロード特化の推論プロセッサ「Jalapeño(ハラペーニョ)」を公開しました。開発着手からわずか9ヶ月でテープアウト(設計完了・製造工程移行)を達成した、同社初の独自チップとなります。
背景と課題:LLM推論におけるボトルネック
従来の汎用GPUや学習用アクセラレータでは、大規模な推論実行時に以下の課題が顕在化していました。
- データ移動に伴う高いコストと電力消費
- コンピューティングリソースとメモリリソースの不均衡
- 大規模ネットワークにおける通信効率の低下
解決策:推論特化型ASIC「Jalapeño」のアーキテクチャ
Jalapeñoは、設計段階からLLMの動作特性を反映させた、推論専用のハードウェアです。高いスループットと低レイテンシを両立するため、以下の構成を採用しています。
| 項目 | 詳細内容 |
|---|---|
| チップ構造 | 約840mm²の巨大コンピューティングチップレット(EUV露光限界に近いサイズ) |
| メモリ | 6つのHBM(高帯域幅メモリ)モジュールを統合 |
| 設計思想 | チップレット間通信の遅延を最小化する単一チップレット構造 |
ハードウェアの理論的限界に近い性能を引き出すことで、コストと電力の両面で高い実効効率を提供します。
実装の要点:AIを活用した超高速開発サイクル
通常、独自のASIC設計には1.5〜2年を要しますが、Jalapeñoはわずか9ヶ月でエンジニアリングサンプルに到達しました。この異例のスピードを実現した要因は2点あります。
- AIによる設計最適化: OpenAI自体のAIモデルをチップ設計と最適化プロセスに活用。
- 既存資産の活用: Broadcomが保有する広範なロジックIPを再利用。
現在、ラボ内のサンプルは目標クロックと消費電力基準を満たしており、「GPT-5.3-Codex-Spark」などの次世代ワークロードで安定稼働が確認されています。
運用と今後の展望:インフラコスト50%削減へ
OpenAIは、この独自チップの導入により、従来の汎用GPUと比較して約50%のインフラコスト削減を見込んでいます。これはNVIDIA等の外部ベンダーへの依存度を下げ、供給リスクを回避する戦略的な一手です。
- デプロイ計画: 2026年末より、Microsoft等のパートナーと共にギガワット(GW)級のデータセンターへ本格配置予定。
- 戦略的意義: Google、Meta、Amazonに続く「独自AIシリコン連合」への参入。ただし、NVIDIAやAMDのチップも継続して併用する方針です。
今後は供給量の確保次第で、サードパーティ企業向けのハードウェアビジネスへ拡張する可能性も示唆されています。

