top of page

Generatived(Beta)|生成AIの最新ニュースとトレンドを提供

logo.png

Cerebras が画期的な AI 推論速度を達成

Generatived

25/1/31 5:00

Cerebras Systems は、AI パフォーマンスの大幅な向上を発表し、DeepSeek-R1-Distill-Llama-70B 推論で 1 秒あたり 1,500 トークン以上を達成しました。この速度は、既存の GPU ベースのソリューションの 57 倍の速さであると報告されており、複雑な AI タスクの処理速度が大幅に向上しています。同社の AI クラウド担当 SVP である Hagay Lupesko 氏は、長い推論プロセスをほぼ瞬時の応答に変換したことを強調し、開発者や企業が高度な AI モデルを活用する方法を変える可能性があると述べました。

Cerebras Wafer Scale Engine を搭載した同社のプラットフォームは、実世界のパフォーマンスが劇的に向上しています。たとえば、他のプラットフォームでは 22 秒かかる標準的なコーディング プロンプトが、Cerebras ではわずか 1.5 秒で完了します。これは、応答時間が 15 倍向上していることを示しています。この機能強化により、通常は大量の計算リソースを必要とする高度な推論モデルの実用的な展開が容易になると期待されています。

Cerebras は、Meta が開発した Llama アーキテクチャに、DeepSeek の 671B パラメータ Mixture of Experts (MoE) モデルの高度な推論機能を統合しました。このモデルは 70B パラメータ サイズが効率的であるにもかかわらず、複雑な数学やコーディング タスクではより大きなモデルよりも優れています。Lupesko 氏は、セキュリティとプライバシーに対する同社の取り組みも強調し、すべての推論リクエストは米国ベースのデータ センター内で処理され、厳格なゼロ データ保持ポリシーが適用されているため、データが米国内にとどまり、顧客の単独の所有権のもとにあることを指摘しました。

DeepSeek-R1-Distill-Llama-70B モデルは現在、Cerebras Inference を通じて入手可能で、開発者プレビュー プログラムを通じて一部の顧客にAPIアクセスが提供されています。これらの即時推論機能をアプリケーションに利用したいと考えている関係者は、Cerebras の Web サイトにアクセスして詳細情報を入手できます。Cerebras Systems は、革新的な AI モデルとアプリケーションの開発において、大手企業、研究機関、政府機関など、さまざまなクライアントを継続的にサポートしています。

この記事を共有:

最新のニュース
Dropbox ChatGPT連携アプリ3種発表

Dropbox ChatGPT連携アプリ3種発表

26/4/21 0:00

Dropbox Japan(東京都千代田区)は、ChatGPTと連携する3つの新アプリを発表したと明らかにした。

ChillStack NEC経費AI連携開始

ChillStack NEC経費AI連携開始

26/4/21 0:00

ChillStack(東京都渋谷区)とNEC(東京都港区)は、不正経費自動検知クラウド「Stena Expense」と行政向け業務システム「GPRIME庶務事務」のデータ連携を開始したと発表した。

NTTデータ先端技術tsuzumi2対応開始

NTTデータ先端技術tsuzumi2対応開始

26/4/21 0:00

NTTデータ先端技術(東京都千代田区)は、Private AIサービス「INTELLILINK Private AI スタートパック」で、NTT開発のLLM「tsuzumi 2」への対応検証を開始したと発表した。

リチカ 動画自動生成機能を追加発表

リチカ 動画自動生成機能を追加発表

26/4/21 0:00

リチカ(東京都渋谷区)は、LP情報や画像素材をもとに複数の広告動画を一括生成できる機能を「リチカ クラウド」に追加したと発表した。

Copyright © 2024 Generatived - All right Reserved.

この記事を共有:

この記事を共有:

Generatived AI Logo

Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。

  • Facebook
  • X

フォローをお願いします

言語

最新のニュース
Dropbox ChatGPT連携アプリ3種発表

Dropbox ChatGPT連携アプリ3種発表

26/4/21 0:00

Dropbox Japan(東京都千代田区)は、ChatGPTと連携する3つの新アプリを発表したと明らかにした。

ChillStack NEC経費AI連携開始

ChillStack NEC経費AI連携開始

26/4/21 0:00

ChillStack(東京都渋谷区)とNEC(東京都港区)は、不正経費自動検知クラウド「Stena Expense」と行政向け業務システム「GPRIME庶務事務」のデータ連携を開始したと発表した。

NTTデータ先端技術tsuzumi2対応開始

NTTデータ先端技術tsuzumi2対応開始

26/4/21 0:00

NTTデータ先端技術(東京都千代田区)は、Private AIサービス「INTELLILINK Private AI スタートパック」で、NTT開発のLLM「tsuzumi 2」への対応検証を開始したと発表した。

リチカ 動画自動生成機能を追加発表

リチカ 動画自動生成機能を追加発表

26/4/21 0:00

リチカ(東京都渋谷区)は、LP情報や画像素材をもとに複数の広告動画を一括生成できる機能を「リチカ クラウド」に追加したと発表した。

bottom of page