Generatived(Beta)|生成AIの最新ニュースとトレンドを提供

Gemini 3 ProはAIビジョンと空間データを強化
Generatived
25/12/9 0:00
Gemini 3 ProはAIにおいて飛躍的な進歩を遂げ、複雑な視覚データと空間データの理解・処理能力を強化しました。このモデルは視覚において新たなベンチマークを達成し、文書、空間、画面、動画の理解といったタスクにおいて優れた性能を発揮しています。さらに、高度な光学式文字認識(OCR)と視覚推論技術を用いることで、雑然として構造化されていないことが多い実世界の文書を正確に解釈する能力も備えています。
このモデルは文書理解能力に優れており、過去の手書きの表や数学的な注釈をHTMLやLaTeXなどの構造化コードに変換することができます。Gemini 3 Proは優れた推論能力も示しており、CharXiv推論テストなどのベンチマークにおいて人間を上回る成績を収めています。米国国勢調査局の所得データといった広範な報告書を分析し、詳細な比較や因果関係分析を提供することができます。
空間理解においては、画像内の物体を識別・参照するGemini 3 Proの精度は、特にロボット工学や拡張現実(AR)アプリケーションに有益です。空間に基づいた計画を生成し、散らかったテーブルの上のゴミの分別や、ユーザーマニュアル内の特定の項目の特定といった作業を支援します。このモデルの画面理解能力は、コンピュータインターフェースとのインタラクション、タスクの自動化、ユーザーエクスペリエンスの向上といった点で実証されています。
動画理解能力も向上しており、Gemini 3 Proは高フレームレートの映像を分析して複雑なディテールを捉えることができるため、スポーツ分析などのアプリケーションに不可欠です。このモデルの「思考」モードは、動画内の複雑な物語をトレースし、単なる物体認識にとどまらず、根底にある原因と結果を理解することを可能にします。
Gemini 3 Proの影響は広範囲に及ぶと予想されており、教育、医用画像、法律、金融といった分野への応用が期待されています。強化された視覚機能は、教育現場におけるマルチモーダル推論問題の解決を支援し、医用画像の分析精度を向上させることができます。金融や法律の専門家は、このモデルの文書推論機能を活用して複雑なワークフローをナビゲートすることができます。開発者は media_resolution パラメータを通じて画像処理を制御できるため、視覚的な忠実度とパフォーマンスおよびコストのバランスをとることができます。
最新のニュース
AIデータ新サービス開始不動産支援
25/12/9 0:00
AIデータ(東京都港区)は、不動産鑑定士やアセットマネジメント会社など向けに、AIを活用した新サービス「AI PropertyPro on IDX」の提供を開始した。
ヤマリキエッジAI動画ツールSORA2導入
25/12/9 0:00
ヤマリキエッジ(東京)は、SNSマーケティングを支援するAI動画自動投稿ツール「いんすと」の動画生成エンジンを次世代AI「SORA2」に全面的に移行した。
Copyright © 2024 Generatived - All right Reserved.
ニュース
Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。
最新のニュース
AIデータ新サービス開始不動産支援
25/12/9 0:00
AIデータ(東京都港区)は、不動産鑑定士やアセットマネジメント会社など向けに、AIを活用した新サービス「AI PropertyPro on IDX」の提供を開始した。
ヤマリキエッジAI動画ツールSORA2導入
25/12/9 0:00
ヤマリキエッジ(東京)は、SNSマーケティングを支援するAI動画自動投稿ツール「いんすと」の動画生成エンジンを次世代AI「SORA2」に全面的に移行した。



%20(1).webp)


