top of page

Generatived(Beta)|生成AIの最新ニュースとトレンドを提供

logo.png

新たなマルチモーダル情報検索モデルを発表

Generatived

25/7/2 0:00

視覚データとテキストデータの統合により、視覚言語モデル(VLM)が開発されました。VLMは、視覚情報とテキスト情報を統合し、両方の情報を処理・理解することができます。これらのモデルは、視覚的な質問応答や画像キャプション作成など、より直感的な機械インタラクションを促進するように設計されています。画像とテキストを組み合わせた広範なデータセットで学習されており、近年の進歩により、複雑な画像に対応できるモデルが開発され、信頼性と効率性が向上しています。

文書検索の分野では、従来の手法では、処理前に文書をテキストに変換することが多かったです。しかし、VLMの登場により、複雑なテキスト抽出が不要になり、このプロセスが簡素化されました。これらのモデルは、生の画像を直接埋め込むことで、視覚情報を維持しながらテキストの意味を解釈することができます。しかし、VLMは優れた機能を備えているにもかかわらず、依然としてエラーが発生しやすいため、正確な検索手順がVLMの効果を左右する重要な要素となっています。

大規模で効率的なマルチモーダル情報検索システムの構築を支援するために、新しいモデルが導入されました。このモデルはコンパクトでありながら強力で、画像とテキストを共有特徴空間に埋め込むことができます。これは、商品検索エンジンやマルチメディアデータセットの整理といったタスクに不可欠です。ビジョンエンコーダー、言語モデル、そして投影層を組み合わせることで、画像を言語モデルの埋め込み空間にマッピングします。

この新しいモデルの性能は様々なデータセットで評価され、他の小規模なビジョン埋め込みモデルと比較して優れた検索精度が実証されています。コントラスト損失を用いて微調整することで、テキストクエリの埋め込みと関連する回答を含む文書画像を対応付けています。このモデルは、高精度な情報検索とリアルタイムのビジネスインサイトを提供するために設計されたマイクロサービススイートの一部であり、ホスト環境で利用可能です。

この記事を共有:

最新のニュース
NVIDIA、AIワークロード向けの第5世代NVLinkを発表

NVIDIA、AIワークロード向けの第5世代NVLinkを発表

25/8/26 0:00

NVIDIAは、AIモデルの増大する計算需要への対応において最前線に立ってきました。

Gemini Code Assist、開発者向けエージェントモードを発表

Gemini Code Assist、開発者向けエージェントモードを発表

25/8/26 0:00

Gemini Code Assistは、複雑なタスクで開発者を支援することでコーディング効率を向上させる機能「エージェントモード」の一般提供開始を発表しました。

Google、 AIが業界にもたらす変革的影響を強調

Google、 AIが業界にもたらす変革的影響を強調

25/8/26 0:00

ルース・ポラット氏は先日、ジャクソンホール経済政策シンポジウムで講演し、人工知能(AI)が経済と金融システムを再構築する上で大きな可能性を秘めていることを強調しました。

Elliptic Labs、ノートパソコンの顧客とのAIセンサー契約を拡大

Elliptic Labs、ノートパソコンの顧客とのAIセンサー契約を拡大

25/8/26 0:00

世界的なAIソフトウェア企業であるElliptic Labsは、既存のノートパソコン顧客と複数年契約を締結しました。

Copyright © 2024 Generatived - All right Reserved.

この記事を共有:

この記事を共有:

Generatived AI Logo

Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。

  • Facebook
  • X

フォローをお願いします

言語

最新のニュース
NVIDIA、AIワークロード向けの第5世代NVLinkを発表

NVIDIA、AIワークロード向けの第5世代NVLinkを発表

25/8/26 0:00

NVIDIAは、AIモデルの増大する計算需要への対応において最前線に立ってきました。

Gemini Code Assist、開発者向けエージェントモードを発表

Gemini Code Assist、開発者向けエージェントモードを発表

25/8/26 0:00

Gemini Code Assistは、複雑なタスクで開発者を支援することでコーディング効率を向上させる機能「エージェントモード」の一般提供開始を発表しました。

Google、 AIが業界にもたらす変革的影響を強調

Google、 AIが業界にもたらす変革的影響を強調

25/8/26 0:00

ルース・ポラット氏は先日、ジャクソンホール経済政策シンポジウムで講演し、人工知能(AI)が経済と金融システムを再構築する上で大きな可能性を秘めていることを強調しました。

Elliptic Labs、ノートパソコンの顧客とのAIセンサー契約を拡大

Elliptic Labs、ノートパソコンの顧客とのAIセンサー契約を拡大

25/8/26 0:00

世界的なAIソフトウェア企業であるElliptic Labsは、既存のノートパソコン顧客と複数年契約を締結しました。

bottom of page