top of page

Generatived(Beta)|生成AIの最新ニュースとトレンドを提供

logo.png

GigaIOとd-MatrixがエンタープライズAI推論を強化

Generatived

25/5/5 0:00

GigaIOは、企業向けAI推論ソリューションの強化を目指し、d-Matrixとの戦略的パートナーシップを発表しました。この提携により、d-MatrixのCorsair推論プラットフォームとGigaIOのSuperNODEアーキテクチャが統合され、導入を簡素化し、AI推論ワークロードを効率的に拡張できるソリューションが提供されます。この共同取り組みは、従来のマルチノードシステムの制約に縛られることなく拡張可能な、高性能でエネルギー効率の高いAI機能への高まる需要に応えることを目指しています。

GigaIOのSuperNODEプラットフォームは、単一ノード内で多数のd-Matrix Corsairアクセラレータをサポートできるようになり、業界で最もスケーラブルなAI推論プラットフォームとなっています。この統合により、従来の分散コンピューティング手法の複雑さから脱却し、超低レーテンシーでバッチ処理された推論ワークロードを大規模に展開することが可能になります。GigaIOのCEOであるアラン・ベンジャミン氏は、このソリューションの革新的な性質を強調し、導入を効率化し、変化するAIワークロードに適応しながら、総所有コストと運用効率を向上させる能力を強調しました。

このパートナーシップにより、驚異的なパフォーマンス指標を誇るソリューションが実現し、エンタープライズAI推論の新たな基準を確立しました。毎秒3万トークンの処理能力と、GPUベースの代替ソリューションと比較して最大10倍のインタラクティブ速度を実現します。さらに、同等のコストで3倍のパフォーマンスと3倍のエネルギー効率を実現し、AI導入の持続可能性を高めます。d-MatrixのCEOであるSid Sheth氏は、この協業により、d-Matrixの効率的なインメモリコンピューティングアーキテクチャとGigaIOの強力なプラットフォームを融合し、大規模な生成AIを商業的に実現可能になると述べています。

GigaIOの先進的なPCIe Gen 5ベースのAIファブリックは、この統合の重要なコンポーネントであり、Corsairアクセラレータ間の低レイテンシ通信を促進し、d-Matrixアーキテクチャの効率を最大化します。このアプローチは、分散推論ワークロードに典型的に伴って発生するボトルネックを解消します。このパートナーシップの成功は、GigaIOがMLPerf推論ベンチマークで最近達成した成果によってさらに証明されており、同社のAIインフラストラクチャにおけるリーダーシップを際立たせています。ベンジャミン氏は最後に、より効率的でスケーラブルなAI推論ソリューションに対する市場のニーズと、d-Matrixとのパートナーシップによってもたらされた重要なエンジニアリングイノベーションに感謝の意を表しました。

この記事を共有:

最新のニュース
Meta Broadcom AIチップ共同開発拡大

Meta Broadcom AIチップ共同開発拡大

26/4/16 0:00

Meta(米カリフォルニア州)は、Broadcomとの提携を拡大し、次世代AIチップ「MTIA」の複数世代を共同開発すると発表した。

NVIDIA量子AIモデルIsing発表

NVIDIA量子AIモデルIsing発表

26/4/16 0:00

NVIDIA(米国カリフォルニア州サンタクララ)は、量子プロセッサ向けAIモデル群「NVIDIA Ising」を発表したとみられる。

NVIDIA NVbandwidth性能測定ツール

NVIDIA NVbandwidth性能測定ツール

26/4/16 0:00

NVIDIA(米国カリフォルニア州サンタクララ)は、CUDAアプリケーションにおけるデータ転送性能の可視化を目的としたツール「NVbandwidth」を紹介したとみられる。

Google ChromeにAI Skills機能

Google ChromeにAI Skills機能

26/4/16 0:00

Google(米国カリフォルニア州マウンテンビュー)は、Chrome上でAIプロンプトを保存・再利用できる新機能「Skills」を発表したとみられる。

Copyright © 2024 Generatived - All right Reserved.

この記事を共有:

この記事を共有:

Generatived AI Logo

Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。

  • Facebook
  • X

フォローをお願いします

言語

最新のニュース
Meta Broadcom AIチップ共同開発拡大

Meta Broadcom AIチップ共同開発拡大

26/4/16 0:00

Meta(米カリフォルニア州)は、Broadcomとの提携を拡大し、次世代AIチップ「MTIA」の複数世代を共同開発すると発表した。

NVIDIA量子AIモデルIsing発表

NVIDIA量子AIモデルIsing発表

26/4/16 0:00

NVIDIA(米国カリフォルニア州サンタクララ)は、量子プロセッサ向けAIモデル群「NVIDIA Ising」を発表したとみられる。

NVIDIA NVbandwidth性能測定ツール

NVIDIA NVbandwidth性能測定ツール

26/4/16 0:00

NVIDIA(米国カリフォルニア州サンタクララ)は、CUDAアプリケーションにおけるデータ転送性能の可視化を目的としたツール「NVbandwidth」を紹介したとみられる。

Google ChromeにAI Skills機能

Google ChromeにAI Skills機能

26/4/16 0:00

Google(米国カリフォルニア州マウンテンビュー)は、Chrome上でAIプロンプトを保存・再利用できる新機能「Skills」を発表したとみられる。

bottom of page