Tachyumは最近、BF16データ型をProdigyコンパイラーとソフトウェアに統合し、ストレージと計算速度を最適化することで機械学習機能を強化した。この新しい追加機能は、IEEEインストールされたベータ版を通じて、早期導入者と顧客に利用可能になった。IEEE 32ビット単精度浮動小数点標準から派生したBF16データ型は、機械学習アルゴリズムの高速化に役立つ。

同社のProdigyプロセッサーは、マトリックスとベクトル処理機能を中核として設計されており、さまざまなデータタイプをサポートし、コアごとに1024ビットのデュアルベクトル ユニットを備えている。Prodigyのアーキテクチャーは、AIトレーニングと推論のワークロードを強化するように調整されており、メモリー使用量を最小限に抑えながらパフォーマンスを最大化することを目指している。プロセッサーの設計により、AIのスパース性とスーパースパース性を効率的に処理できるようになり、不整合なベクトルのロードやストアによるペナルティなしで動作する。

TachyumのCEOであるRadoslav Danilak博士は、Prodigyソフトウェア配布パッケージの拡大に対する同社の取り組みを強調した。BF16の組み込みは、ハードウェアの効率とパフォーマンスを向上させるための戦略的な動きであり、ハイパースケールコンピューティングとAIワークロードの厳しい要件に対応するという同社の目標と一致している。TachyumのProdigyは、特殊なAIハードウェアの必要性を排除する多目的ソリューションを提供し、データセンターの運用を世界的に変革する準備ができている。

Prodigyは、AI/ML、HPC、クラウドサービスなど、さまざまなコンピューティング ドメインでトップクラスのパフォーマンスを発揮できるユニバーサルプロセッサーとして際立っている。Prodigyを搭載したデータセンター サーバーがこれらのドメイン間を動的に切り替えることができるようにすることで、Tachyumは資本支出と運用支出の両方を大幅に削減することを目指している。このプロセッサーは、192個のカスタム設計された64ビットコンピューティング コアを誇り、クラウドワークロードでは主要なx86プロセッサー、HPCおよびAIアプリケーションではGPUを上回るパフォーマンスを発揮する。ProdigyエミュレーションシステムでResNetモデルを使用して画像分類を行うビデオデモがオンラインで公開されており、BF16データタイプの利点が強調されている。

出典:プレスリリース