top of page

Generatived(Beta)|生成AIの最新ニュースとトレンドを提供

logo.png

新たなマルチモーダル情報検索モデルを発表

Generatived

25/7/2 0:00

視覚データとテキストデータの統合により、視覚言語モデル(VLM)が開発されました。VLMは、視覚情報とテキスト情報を統合し、両方の情報を処理・理解することができます。これらのモデルは、視覚的な質問応答や画像キャプション作成など、より直感的な機械インタラクションを促進するように設計されています。画像とテキストを組み合わせた広範なデータセットで学習されており、近年の進歩により、複雑な画像に対応できるモデルが開発され、信頼性と効率性が向上しています。

文書検索の分野では、従来の手法では、処理前に文書をテキストに変換することが多かったです。しかし、VLMの登場により、複雑なテキスト抽出が不要になり、このプロセスが簡素化されました。これらのモデルは、生の画像を直接埋め込むことで、視覚情報を維持しながらテキストの意味を解釈することができます。しかし、VLMは優れた機能を備えているにもかかわらず、依然としてエラーが発生しやすいため、正確な検索手順がVLMの効果を左右する重要な要素となっています。

大規模で効率的なマルチモーダル情報検索システムの構築を支援するために、新しいモデルが導入されました。このモデルはコンパクトでありながら強力で、画像とテキストを共有特徴空間に埋め込むことができます。これは、商品検索エンジンやマルチメディアデータセットの整理といったタスクに不可欠です。ビジョンエンコーダー、言語モデル、そして投影層を組み合わせることで、画像を言語モデルの埋め込み空間にマッピングします。

この新しいモデルの性能は様々なデータセットで評価され、他の小規模なビジョン埋め込みモデルと比較して優れた検索精度が実証されています。コントラスト損失を用いて微調整することで、テキストクエリの埋め込みと関連する回答を含む文書画像を対応付けています。このモデルは、高精度な情報検索とリアルタイムのビジネスインサイトを提供するために設計されたマイクロサービススイートの一部であり、ホスト環境で利用可能です。

この記事を共有:

最新のニュース
NVIDIAが科学AI基盤を強化

NVIDIAが科学AI基盤を強化

26/7/2 0:00

NVIDIAは、Anthropicが発表した研究向けAIワークベンチ「Claude Science」と「NVIDIA BioNeMo Agent Toolkit」の連携を発表した。

MicrosoftがAIエージェント攻撃解説

MicrosoftがAIエージェント攻撃解説

26/7/2 0:00

Microsoftは、AIエージェントが外部ツールと連携する際に発生する新たなサプライチェーンリスクについて解説するセキュリティーリポートを公開した。

USFとAWSが防衛研究基盤強化

USFとAWSが防衛研究基盤強化

26/7/2 0:00

The University of South Florida(米フロリダ州)は、Amazon Web Services(AWS)と連携し、防衛・航空宇宙分野の研究を支えるセキュアなクラウド基盤を整備すると発表した。

サイバーエージェント AI介在分析機能公開

サイバーエージェント AI介在分析機能公開

26/7/1 0:00

サイバーエージェント(東京都渋谷区)は、コーディングエージェントの実行履歴を分析し、人間による確認や介入(Human-in-the-Loop)の頻度や内容を可視化するスキル「hitl-harness-improver」をGitHubで公開したと発表した。

Copyright © 2024 Generatived - All right Reserved.

この記事を共有:

この記事を共有:

Generatived AI Logo

Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。

  • Facebook
  • X

フォローをお願いします

言語

最新のニュース
NVIDIAが科学AI基盤を強化

NVIDIAが科学AI基盤を強化

26/7/2 0:00

NVIDIAは、Anthropicが発表した研究向けAIワークベンチ「Claude Science」と「NVIDIA BioNeMo Agent Toolkit」の連携を発表した。

MicrosoftがAIエージェント攻撃解説

MicrosoftがAIエージェント攻撃解説

26/7/2 0:00

Microsoftは、AIエージェントが外部ツールと連携する際に発生する新たなサプライチェーンリスクについて解説するセキュリティーリポートを公開した。

USFとAWSが防衛研究基盤強化

USFとAWSが防衛研究基盤強化

26/7/2 0:00

The University of South Florida(米フロリダ州)は、Amazon Web Services(AWS)と連携し、防衛・航空宇宙分野の研究を支えるセキュアなクラウド基盤を整備すると発表した。

サイバーエージェント AI介在分析機能公開

サイバーエージェント AI介在分析機能公開

26/7/1 0:00

サイバーエージェント(東京都渋谷区)は、コーディングエージェントの実行履歴を分析し、人間による確認や介入(Human-in-the-Loop)の頻度や内容を可視化するスキル「hitl-harness-improver」をGitHubで公開したと発表した。

bottom of page