top of page

Generatived(Beta)|生成AIの最新ニュースとトレンドを提供

logo.png

Gemini 3 ProはAIビジョンと空間データを強化

Generatived

25/12/9 0:00

Gemini 3 ProはAIにおいて飛躍的な進歩を遂げ、複雑な視覚データと空間データの理解・処理能力を強化しました。このモデルは視覚において新たなベンチマークを達成し、文書、空間、画面、動画の理解といったタスクにおいて優れた性能を発揮しています。さらに、高度な光学式文字認識(OCR)と視覚推論技術を用いることで、雑然として構造化されていないことが多い実世界の文書を正確に解釈する能力も備えています。

このモデルは文書理解能力に優れており、過去の手書きの表や数学的な注釈をHTMLやLaTeXなどの構造化コードに変換することができます。Gemini 3 Proは優れた推論能力も示しており、CharXiv推論テストなどのベンチマークにおいて人間を上回る成績を収めています。米国国勢調査局の所得データといった広範な報告書を分析し、詳細な比較や因果関係分析を提供することができます。

空間理解においては、画像内の物体を識別・参照するGemini 3 Proの精度は、特にロボット工学や拡張現実(AR)アプリケーションに有益です。空間に基づいた計画を生成し、散らかったテーブルの上のゴミの分別や、ユーザーマニュアル内の特定の項目の特定といった作業を支援します。このモデルの画面理解能力は、コンピュータインターフェースとのインタラクション、タスクの自動化、ユーザーエクスペリエンスの向上といった点で実証されています。

動画理解能力も向上しており、Gemini 3 Proは高フレームレートの映像を分析して複雑なディテールを捉えることができるため、スポーツ分析などのアプリケーションに不可欠です。このモデルの「思考」モードは、動画内の複雑な物語をトレースし、単なる物体認識にとどまらず、根底にある原因と結果を理解することを可能にします。

Gemini 3 Proの影響は広範囲に及ぶと予想されており、教育、医用画像、法律、金融といった分野への応用が期待されています。強化された視覚機能は、教育現場におけるマルチモーダル推論問題の解決を支援し、医用画像の分析精度を向上させることができます。金融や法律の専門家は、このモデルの文書推論機能を活用して複雑なワークフローをナビゲートすることができます。開発者は media_resolution パラメータを通じて画像処理を制御できるため、視覚的な忠実度とパフォーマンスおよびコストのバランスをとることができます。

この記事を共有:

最新のニュース
TP Tech、TP.ai FAB AIオーケストレーションプラットフォームを発表

TP Tech、TP.ai FAB AIオーケストレーションプラットフォームを発表

25/12/12 0:00

インドネシアのTPは、ジャカルタで開催された重要なイベントにおいて、最新のイノベーションであるTP.ai FABを発表しました。

Fortience AI新規ビジネス評価サービス

Fortience AI新規ビジネス評価サービス

25/12/12 0:00

フォーティエンス(東京都千代田区)は、AIと専門コンサルタントの知見を組み合わせた「AIエージェントによる新規事業企画評価サービス」を12月10日から開始する。

NTTデータ北海道とNTT-AT札幌市役所事務効率化実験

NTTデータ北海道とNTT-AT札幌市役所事務効率化実験

25/12/12 0:00

NTTデータ北海道(北海道札幌市)とNTT-AT(東京都新宿区)は、札幌市の行政内部事務の効率化を目指し、共同で実証実験を行うことを発表した。

Google DeepMind、英国とのAI安全性研究協力を拡大

Google DeepMind、英国とのAI安全性研究協力を拡大

25/12/12 0:00

英国AIセキュリティ研究所(AISI)との連携拡大は、より安全な人工知能開発の実現に向けた重要な一歩となります。

Copyright © 2024 Generatived - All right Reserved.

この記事を共有:

この記事を共有:

Generatived AI Logo

Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。

  • Facebook
  • X

フォローをお願いします

言語

最新のニュース
TP Tech、TP.ai FAB AIオーケストレーションプラットフォームを発表

TP Tech、TP.ai FAB AIオーケストレーションプラットフォームを発表

25/12/12 0:00

インドネシアのTPは、ジャカルタで開催された重要なイベントにおいて、最新のイノベーションであるTP.ai FABを発表しました。

Fortience AI新規ビジネス評価サービス

Fortience AI新規ビジネス評価サービス

25/12/12 0:00

フォーティエンス(東京都千代田区)は、AIと専門コンサルタントの知見を組み合わせた「AIエージェントによる新規事業企画評価サービス」を12月10日から開始する。

NTTデータ北海道とNTT-AT札幌市役所事務効率化実験

NTTデータ北海道とNTT-AT札幌市役所事務効率化実験

25/12/12 0:00

NTTデータ北海道(北海道札幌市)とNTT-AT(東京都新宿区)は、札幌市の行政内部事務の効率化を目指し、共同で実証実験を行うことを発表した。

Google DeepMind、英国とのAI安全性研究協力を拡大

Google DeepMind、英国とのAI安全性研究協力を拡大

25/12/12 0:00

英国AIセキュリティ研究所(AISI)との連携拡大は、より安全な人工知能開発の実現に向けた重要な一歩となります。

bottom of page