Generatived(Beta)|生成AIの最新ニュースとトレンドを提供

Cerebras、開発者向けの高速 AI 推論ソリューションを発表
Generatived
24/8/28 9:00
Cerebras Systems は、世界最速と謳われる新しい AI 推論ソリューションを発表しました。このソリューションは、特定の AI モデルに対して 1 秒あたり 1,800 トークンを配信できます。このパフォーマンスは、ハイパースケール クラウドにおける既存の GPU ベースのソリューションよりも 20 倍高速と言われています。同社は、この速度は精度を犠牲にすることなく、推論プロセス全体を通じて最先端の精度を維持することを強調しています。
同社の CEO は、セレブラスが AI 推論ベンチマークで新たな速度記録を樹立したと述べ、この成果を強調しました。この進歩は、リアルタイムまたは大容量の AI アプリケーションを必要とする開発者にとって重要な一歩と見られています。推論サービスは競争力のある価格で提供されており、従量課金モデルは 100 万トークンあたり 10 セントから始まります。
Cerebras の推論サービスは 3 つの層に分かれており、個人から大企業まで幅広いユーザーに対応しています。無料層では寛大な使用制限付きのAPIアクセスが提供され、開発者層ではコスト効率の高いサーバーレス デプロイメント オプションが提供されます。エンタープライズ層は、専用のサポートとカスタム サービス レベル アグリーメントにより、持続的なワークロード向けにカスタマイズされています。
同社はまた、AI開発を促進するための戦略的パートナーシップを結び、さまざまな業界リーダーと協力して、AIアプリケーションの作成をサポートするツールとプラットフォームを提供しています。Cerebrasの推論ソリューションは、競合他社よりも大きなメモリ帯域幅の利点を誇るCS-3システムとWafer Scale Engine 3を搭載しており、生成AIアプリケーションを促進します。このサービスに興味のある開発者は、既存のAIモデルと簡単に統合できるように設計されたCerebras Inference APIにアクセスできます。
最新のニュース
BOOSTTECH、SNS投稿AI法務機能公開
26/5/1 0:00
BOOSTTECH(東京都新宿区)は、AI縦型ショート動画生成・多媒体配信プラットフォーム「SHORTBOOSTER」において、SNS投稿前の法令・規約違反リスクをAIが自動判定する「コンプライアンスチェック機能」を4月30日に公開したと発表した。
Copyright © 2024 Generatived - All right Reserved.
ニュース
Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。
最新のニュース
BOOSTTECH、SNS投稿AI法務機能公開
26/5/1 0:00
BOOSTTECH(東京都新宿区)は、AI縦型ショート動画生成・多媒体配信プラットフォーム「SHORTBOOSTER」において、SNS投稿前の法令・規約違反リスクをAIが自動判定する「コンプライアンスチェック機能」を4月30日に公開したと発表した。






