Generatived(Beta)|生成AIの最新ニュースとトレンドを提供

Cerebras、6つの新しいAI推論データセンターを発表
Generatived
25/3/12 4:30
Cerebras Systems は、2025 年までに運用開始予定の 6 つの新しい AI 推論データセンターの立ち上げを発表しました。これらの施設は、同社の Wafer-Scale Engines によって稼働し、1 秒あたり 4,000 万を超える Llama 70B トークンを提供する予定です。この開発により、Cerebras は高速推論サービスの大手プロバイダーおよび国内最大の高速推論クラウドとしての地位を確立します。
この拡張は、増大する顧客需要に対応するために AI 推論能力を 20 倍に増やすという Cerebras の戦略計画の一環です。オクラホマシティとモントリオールのデータセンターは Cerebras が独占的に所有および運営し、その他の場所は戦略的パートナーである G42 と提携して管理されます。容量の大部分を米国に拠点を置く Cerebras は、国の AI インフラストラクチャを強化し、この分野でのリーダーシップを維持することを目指しています。
Cerebras は、2024 年 8 月に高速推論サービスを導入して以来、需要が大幅に増加しています。Mistral や Perplexity などの大手 AI 企業や大企業が、AI アプリケーションに Cerebras のテクノロジーを採用しています。同社の COO である Dhiraj Mallick 氏は、これらの新しいデータセンターが AI イノベーションの次の波をサポートし、同社の AI 推論機能の需要を満たす上で重要であることを強調しました。
Scale Datacenter と名付けられたオクラホマシティのデータセンターは、2025 年 6 月に開設される予定で、300 台を超える Cerebras CS-3 システムが設置されます。この施設は、自然災害から保護され、高度な冷却ソリューションを備えた堅牢な施設として設計されています。一方、Bit Digital, Inc. の一部である Enovum Montreal 施設は、2025 年 7 月に稼働開始予定で、Cerebras がカナダのテクノロジー エコシステムにウェーハ スケール推論を導入するのはこれが初めてとなります。これらの開発により、AI 推論速度が大幅に加速し、最新の推論モデルでほぼ瞬時に結果が得られるようになり、Cerebras はリアルタイム AI 推論の市場リーダーとしての地位を確立すると期待されています。
最新のニュース
PKSHA次世代AI面接サービス開始
25/12/5 0:00
PKSHA(東京都文京区)は、グループ会社タレントアンドアセスメント(東京都港区)と共同で、対話型AI面接サービス「SHaiN」の新機能を開発し、2025年12月3日から提供を開始すると発表した。
Copyright © 2024 Generatived - All right Reserved.
ニュース
Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。
最新のニュース
PKSHA次世代AI面接サービス開始
25/12/5 0:00
PKSHA(東京都文京区)は、グループ会社タレントアンドアセスメント(東京都港区)と共同で、対話型AI面接サービス「SHaiN」の新機能を開発し、2025年12月3日から提供を開始すると発表した。


%20(1).webp)



