top of page

Generatived(Beta)|生成AIの最新ニュースとトレンドを提供

logo.png

Cerebras が画期的な AI 推論速度を達成

Generatived

25/1/31 5:00

Cerebras Systems は、AI パフォーマンスの大幅な向上を発表し、DeepSeek-R1-Distill-Llama-70B 推論で 1 秒あたり 1,500 トークン以上を達成しました。この速度は、既存の GPU ベースのソリューションの 57 倍の速さであると報告されており、複雑な AI タスクの処理速度が大幅に向上しています。同社の AI クラウド担当 SVP である Hagay Lupesko 氏は、長い推論プロセスをほぼ瞬時の応答に変換したことを強調し、開発者や企業が高度な AI モデルを活用する方法を変える可能性があると述べました。

Cerebras Wafer Scale Engine を搭載した同社のプラットフォームは、実世界のパフォーマンスが劇的に向上しています。たとえば、他のプラットフォームでは 22 秒かかる標準的なコーディング プロンプトが、Cerebras ではわずか 1.5 秒で完了します。これは、応答時間が 15 倍向上していることを示しています。この機能強化により、通常は大量の計算リソースを必要とする高度な推論モデルの実用的な展開が容易になると期待されています。

Cerebras は、Meta が開発した Llama アーキテクチャに、DeepSeek の 671B パラメータ Mixture of Experts (MoE) モデルの高度な推論機能を統合しました。このモデルは 70B パラメータ サイズが効率的であるにもかかわらず、複雑な数学やコーディング タスクではより大きなモデルよりも優れています。Lupesko 氏は、セキュリティとプライバシーに対する同社の取り組みも強調し、すべての推論リクエストは米国ベースのデータ センター内で処理され、厳格なゼロ データ保持ポリシーが適用されているため、データが米国内にとどまり、顧客の単独の所有権のもとにあることを指摘しました。

DeepSeek-R1-Distill-Llama-70B モデルは現在、Cerebras Inference を通じて入手可能で、開発者プレビュー プログラムを通じて一部の顧客にAPIアクセスが提供されています。これらの即時推論機能をアプリケーションに利用したいと考えている関係者は、Cerebras の Web サイトにアクセスして詳細情報を入手できます。Cerebras Systems は、革新的な AI モデルとアプリケーションの開発において、大手企業、研究機関、政府機関など、さまざまなクライアントを継続的にサポートしています。

この記事を共有:

最新のニュース
医学書院とNTT 医療AI基盤協業

医学書院とNTT 医療AI基盤協業

26/4/20 0:00

医学書院(東京都文京区)はNTTおよびNTTドコモビジネスと医療AI情報プラットフォーム開発に向けた協業基本契約を締結したと発表した。

Google Gemini音声合成モデル強化

Google Gemini音声合成モデル強化

26/4/20 0:00

Google(米カリフォルニア州)は新たな音声合成モデル「Gemini 3.1 Flash TTS」を発表し、開発者や企業向けに順次提供を開始したと明らかにした。

Microsoftが示すAI変革と産業別活用

Microsoftが示すAI変革と産業別活用

26/4/20 0:00

Microsoft(米国ワシントン州)は、企業がAI活用の試行段階を越え、成長と変革を推進する段階に移行していると発表したとされる。

NVIDIAがDeepStream9で開発効率向上

NVIDIAがDeepStream9で開発効率向上

26/4/20 0:00

NVIDIA(米国カリフォルニア州)は、リアルタイム視覚AI開発を効率化する「DeepStream 9」を発表したとされる。

Copyright © 2024 Generatived - All right Reserved.

この記事を共有:

この記事を共有:

Generatived AI Logo

Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。

  • Facebook
  • X

フォローをお願いします

言語

最新のニュース
医学書院とNTT 医療AI基盤協業

医学書院とNTT 医療AI基盤協業

26/4/20 0:00

医学書院(東京都文京区)はNTTおよびNTTドコモビジネスと医療AI情報プラットフォーム開発に向けた協業基本契約を締結したと発表した。

Google Gemini音声合成モデル強化

Google Gemini音声合成モデル強化

26/4/20 0:00

Google(米カリフォルニア州)は新たな音声合成モデル「Gemini 3.1 Flash TTS」を発表し、開発者や企業向けに順次提供を開始したと明らかにした。

Microsoftが示すAI変革と産業別活用

Microsoftが示すAI変革と産業別活用

26/4/20 0:00

Microsoft(米国ワシントン州)は、企業がAI活用の試行段階を越え、成長と変革を推進する段階に移行していると発表したとされる。

NVIDIAがDeepStream9で開発効率向上

NVIDIAがDeepStream9で開発効率向上

26/4/20 0:00

NVIDIA(米国カリフォルニア州)は、リアルタイム視覚AI開発を効率化する「DeepStream 9」を発表したとされる。

bottom of page