Googleは最近、パフォーマンスと効率が強化された新しいAIモデルであるGemini 1.5の発売を発表した。このモデルは、前世代のGemini 1.0 Ultraの成功を基礎としており、新しい専門家混合アーキテクチャーのおかげで、トレーニングとサービスの効率が向上するように設計されている。Gemini 1.5 Proは、初期テスト用にリリースされた最初のモデルで、1.0 Ultraに匹敵する品質を提供しながら、より少ない計算能力を必要とする中型のマルチモーダルモデルだ。

Gemini 1.5の大きな進歩は、長いコンテキスト情報を理解できることだ。このモデルの情報処理能力は大幅に向上し、最大100万個のトークンを一貫して処理できるようになった。この機能は、大規模な基盤モデルの新しい標準を設定し、数時間分のビデオやオーディオ、大規模なコードベース、または長いドキュメントなどの大量のデータを1つのプロンプトで処理できるようにする。

開発者と企業顧客には、AI StudioとVertex AIを通じて新しいモデルのロングコンテキスト機能を実験するための限定的なプレビューアークセスが許可されている。この実験的な機能により、より有用なモデルやアプリケーションを作成するための新たな可能性が解き放たれることが期待されている。同社は、レーテンシーを改善し、計算要件を軽減し、全体的なユーザー エクスペリエンスを向上させるためのさらなる最適化に積極的に取り組んでいる。

同社は技術力に加え、AI開発における安全性と倫理性の重要性を重視している。Gemini 1.5モデルは、確立されたAI原則と安全ポリシーに準拠していることを確認するために厳格なテストを受けている。チームは、ロングコンテキスト機能によってもたらされる特有の課題に対処するために、モデルの改良と新しいテスト方法の開発を続けている。モデルがより広範なリリースに向けて進むにつれて、同社は、標準の128,000トークンから最大100万トークンまで、モデルのコンテキストウィンドウの容量に基づいた価格帯を導入する予定だ。

ソース:DeepMind Blog