top of page

Generatived(Beta)|生成AIの最新ニュースとトレンドを提供

logo.png

新たなマルチモーダル情報検索モデルを発表

Generatived

25/7/2 0:00

視覚データとテキストデータの統合により、視覚言語モデル(VLM)が開発されました。VLMは、視覚情報とテキスト情報を統合し、両方の情報を処理・理解することができます。これらのモデルは、視覚的な質問応答や画像キャプション作成など、より直感的な機械インタラクションを促進するように設計されています。画像とテキストを組み合わせた広範なデータセットで学習されており、近年の進歩により、複雑な画像に対応できるモデルが開発され、信頼性と効率性が向上しています。

文書検索の分野では、従来の手法では、処理前に文書をテキストに変換することが多かったです。しかし、VLMの登場により、複雑なテキスト抽出が不要になり、このプロセスが簡素化されました。これらのモデルは、生の画像を直接埋め込むことで、視覚情報を維持しながらテキストの意味を解釈することができます。しかし、VLMは優れた機能を備えているにもかかわらず、依然としてエラーが発生しやすいため、正確な検索手順がVLMの効果を左右する重要な要素となっています。

大規模で効率的なマルチモーダル情報検索システムの構築を支援するために、新しいモデルが導入されました。このモデルはコンパクトでありながら強力で、画像とテキストを共有特徴空間に埋め込むことができます。これは、商品検索エンジンやマルチメディアデータセットの整理といったタスクに不可欠です。ビジョンエンコーダー、言語モデル、そして投影層を組み合わせることで、画像を言語モデルの埋め込み空間にマッピングします。

この新しいモデルの性能は様々なデータセットで評価され、他の小規模なビジョン埋め込みモデルと比較して優れた検索精度が実証されています。コントラスト損失を用いて微調整することで、テキストクエリの埋め込みと関連する回答を含む文書画像を対応付けています。このモデルは、高精度な情報検索とリアルタイムのビジネスインサイトを提供するために設計されたマイクロサービススイートの一部であり、ホスト環境で利用可能です。

この記事を共有:

最新のニュース
Microsoft クラウドAI保護強化

Microsoft クラウドAI保護強化

26/7/3 0:00

Microsoft(米ワシントン州レドモンド)は、Frost & Sullivanの2026年版「Cloud/Application Runtime Security」分析で、クラウドとアプリケーション実行環境のセキュリティ分野における先進的な事業者として評価されたと発表した。

Google Cloud VS Code連携強化

Google Cloud VS Code連携強化

26/7/3 0:00

Google Cloud(米カリフォルニア州マウンテンビュー)は、VS Code向け「Google Cloud Workbench Notebooks」拡張機能の提供を開始した。

Google 教育AI活用でNY会議開催

Google 教育AI活用でNY会議開催

26/7/3 0:00

Google(米カリフォルニア州マウンテンビュー)は、ニューヨーク市で教育関係者や産業界のリーダー約150人を集めたAI教育サミットを開催した。

NVIDIA 米国AI基盤投資を加速

NVIDIA 米国AI基盤投資を加速

26/7/3 0:00

NVIDIA(米カリフォルニア州サンタクララ)は、AI時代を支える米国内インフラ整備を加速すると発表した。

Copyright © 2024 Generatived - All right Reserved.

この記事を共有:

この記事を共有:

Generatived AI Logo

Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。

  • Facebook
  • X

フォローをお願いします

言語

最新のニュース
Microsoft クラウドAI保護強化

Microsoft クラウドAI保護強化

26/7/3 0:00

Microsoft(米ワシントン州レドモンド)は、Frost & Sullivanの2026年版「Cloud/Application Runtime Security」分析で、クラウドとアプリケーション実行環境のセキュリティ分野における先進的な事業者として評価されたと発表した。

Google Cloud VS Code連携強化

Google Cloud VS Code連携強化

26/7/3 0:00

Google Cloud(米カリフォルニア州マウンテンビュー)は、VS Code向け「Google Cloud Workbench Notebooks」拡張機能の提供を開始した。

Google 教育AI活用でNY会議開催

Google 教育AI活用でNY会議開催

26/7/3 0:00

Google(米カリフォルニア州マウンテンビュー)は、ニューヨーク市で教育関係者や産業界のリーダー約150人を集めたAI教育サミットを開催した。

NVIDIA 米国AI基盤投資を加速

NVIDIA 米国AI基盤投資を加速

26/7/3 0:00

NVIDIA(米カリフォルニア州サンタクララ)は、AI時代を支える米国内インフラ整備を加速すると発表した。

bottom of page