Generatived(Beta)|生成AIの最新ニュースとトレンドを提供
%20(1)%20(1).webp)
MLCommons が MLPerf Inference v4.1 の結果を発表
Generatived
24/8/29 2:00
MLCommons は、機械学習システムのパフォーマンスを評価する MLPerf Inference v4.1 ベンチマーク スイートの最新結果を発表しました。データ センターとエッジ システムの両方をカバーするこのスイートは、AI および ML モデル用の公平で再現可能なベンチマーク プラットフォームを提供することを目指しています。最新リリースには 6 つの新しいプロセッサの結果が含まれており、そのうちのいくつかは現在利用可能で、その他はプレビューとして提供されています。
ベンチマーク スイートには 22 の組織が参加しており、さまざまな AI システム テクノロジーが紹介されています。結果は、AI テクノロジーの評価と調達に不可欠な透明性のあるパフォーマンス ベンチマークに対する業界の取り組みを強調しています。参加者には、AMD や Sustainable Metal Cloud など、MLPerf Inference への新規提出企業を含むテクノロジー大手と新興企業の両方が含まれています。
MLPerf Inference スイートへの注目すべき追加は、専門家混合 (MoE) モデル アーキテクチャに基づく新しいベンチマークです。このアプローチでは、複数の小さなモデル、つまり「エキスパート」を利用して推論タスクを処理します。これにより、従来の単一モデル システムよりもパフォーマンス上のメリットが得られます。これまでで最も複雑なものの 1 つである MoE ベンチマークは、Mixtral 8x7B モデルを使用し、Q&A、数学の問題解決、コード生成などのタスクをカバーします。
ベンチマーク スイートには電力消費テストも含まれており、データ センターとエッジ環境で動作するシステムについて 31 件の結果が提出されています。これらのテストは、電力コストが全体的な運用コストに大きく影響するため、AI システムのエネルギー需要を理解することの重要性を強調しています。MLCommons は、オープンで透明性のあるベンチマークを提供することで AI 業界をサポートし続け、急速に進化する AI テクノロジーの状況を関係者が乗り越えられるよう支援しています。
最新のニュース
Gemini、 Google AIを活用したカスタムトラック作成を開始
26/2/20 0:00
Geminiは、ユーザーが説明文を入力するか写真をアップロードするだけで、カスタム音楽トラックを作成できる新機能を導入しました。
Google、グローバルAIアクセス強化イニシアチブを発表
26/2/20 0:00
Googleは、AI技術への世界的なアクセス向上への取り組みを発表し、様々な分野における課題解決のためにこれらのツールが広く利用可能であることの重要性を強調しました。
Sarvam AI と NVIDIA が多言語 AI モデルを加速
26/2/20 0:00
インド・ベンガルールのAIスタートアップ企業Sarvam AIは、インドの多様な言語ニーズに応えるため、大規模な多言語基盤モデルを構築するという野心的なプロジェクトに着手しました。
Copyright © 2024 Generatived - All right Reserved.
ニュース
Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。
最新のニュース
Gemini、 Google AIを活用したカスタムトラック作成を開始
26/2/20 0:00
Geminiは、ユーザーが説明文を入力するか写真をアップロードするだけで、カスタム音楽トラックを作成できる新機能を導入しました。
Google、グローバルAIアクセス強化イニシアチブを発表
26/2/20 0:00
Googleは、AI技術への世界的なアクセス向上への取り組みを発表し、様々な分野における課題解決のためにこれらのツールが広く利用可能であることの重要性を強調しました。
Sarvam AI と NVIDIA が多言語 AI モデルを加速
26/2/20 0:00
インド・ベンガルールのAIスタートアップ企業Sarvam AIは、インドの多様な言語ニーズに応えるため、大規模な多言語基盤モデルを構築するという野心的なプロジェクトに着手しました。




%20(1).webp)

