Google(アメリカカリフォルニア州)は、AI技術の進化に伴い、新しいTensor Processing Unit(TPU)「Trillium」を発表した。この第6世代のTPUは、これまでのモデルに比べて4.7倍のピーク計算性能を持ち、エネルギー効率も67%向上している。

「Trillium」は、Google I/Oで発表された「Gemini 1.5 Flash」、「Imagen 3」、「Gemma 2」といった新しいモデルのトレーニングに使用されている。これらのモデルはTPU上で訓練され、TPUを介して提供される。Googleは、顧客が新しい可能性を追求できるように、この最新のTPUを公開した。

新しい「Trillium」TPUは、高帯域メモリー(HBM)の容量と帯域幅を2倍にし、チップ間通信(ICI)の帯域幅も2倍に増加させた。さらに、第3世代のSparseCoreを搭載しており、高度なランキングや推薦ワークロードにおける大規模な埋め込みを効率的に処理する。

「Trillium」は、単一のポッド内で最大256個のTPUをスケールアップし、高帯域幅と低遅延を実現する。Titanium Intelligence Processing Units(IPU)とマルチスライス技術を使用して、ポッドレベルのスケーラビリティーを数百のポッドに拡張できる。Googleは、AIの次の段階を「Trillium」を通じて推進していく。

ソース:AI & Machine Learning | Google Cloud Blog