Generatived(Beta)|生成AIの最新ニュースとトレンドを提供

DeepSeek V4、100万トークン対応モデル発表
Generatived
26/4/27 0:00
DeepSeekは、第4世代となるフラッグシップモデル「DeepSeek-V4-Pro」と「DeepSeek-V4-Flash」を発表した。両モデルは最大100万トークンの長文コンテキストに対応し、長文解析やエージェント型AIの実用化を大きく前進させる。
最大モデルのV4-Proは総パラメータ数1.6兆(アクティブ49B)、V4-Flashは284B(同13B)で、高速処理と効率性を重視した設計となっている。いずれも最大38.4万トークンの出力に対応し、コード生成や文書解析、検索、AIエージェント用途での活用が想定される。
技術面では、従来モデルをベースにしたMoEアーキテクチャに加え、ハイブリッドアテンションを採用。KVキャッシュのメモリ負荷を最大90%削減し、推論計算量も大幅に削減することで、長文処理のボトルネックを解消した。
さらに、NVIDIAのBlackwellプラットフォーム上での検証では、高速かつ低遅延な推論性能を確認。GPUアクセラレーション環境やツール群との統合により、企業における大規模AI運用とエージェントワークフローの実装を後押しする。
最新のニュース
Swiggy、AI開発者向け新プログラム発表
26/4/28 0:00
Swiggyは、AIネイティブなコマース体験の構築を支援する開発者向けプログラム「Swiggy Builders Club」を発表した。
Vertex AI、Claudeのマルチリージョン提供
26/4/28 0:00
Google Cloudは、Vertex AI上でClaudeのマルチリージョンエンドポイントの公開プレビュー提供を開始した。
Copyright © 2024 Generatived - All right Reserved.
ニュース
Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。
最新のニュース
Swiggy、AI開発者向け新プログラム発表
26/4/28 0:00
Swiggyは、AIネイティブなコマース体験の構築を支援する開発者向けプログラム「Swiggy Builders Club」を発表した。
Vertex AI、Claudeのマルチリージョン提供
26/4/28 0:00
Google Cloudは、Vertex AI上でClaudeのマルチリージョンエンドポイントの公開プレビュー提供を開始した。


%20(1).webp)


