top of page

Generatived(Beta)|生成AIの最新ニュースとトレンドを提供

logo.png

Vertex AIがLLM対応セマンティック検索をリリース

Generatived

23/9/26 5:21

エンタープライズ向けに信頼性の高いGen AIサービスを構築するには、グラウンディング、埋め込み、ベクトル検索の概念を理解することが重要だ。この代表的な例は、ミリ秒単位で実行できる800万件のスタックオーバーフローの質問に対するセマンティック検索だ。このデモは一般公開されており、ユーザーは「STACKOVERFLOW」を選択し、コーディングに関する質問をクエリーとして入力し、プラットフォームに投稿された何百万もの質問に対してテキスト検索を実行できる。このデモの特徴は、LLM対応のセマンティック検索、ビジネス上の事実に基づいていること、およびスケーラビリティーと速度だ。このソリューションを実現する主な要因は、Vertex AI Embeddings for Textで生成されたエンベディングと、Vertex AI Vector Searchによる高速でスケーラブルなベクトル検索だ。埋め込みAPIを使用すると、LLM機能と組み合わせて、さまざまなテキスト処理タスクに埋め込みを適用できる。これらのタスクには、LLM対応のセマンティック検索、テキスト分類、推奨、クラスタリング、異常検出、感情分析などが含まれる。これらは全て、LLMレベルのセマンティクスを深く理解することで処理できる。Embeddings APIとVector Searchを組み合わせることで、Embeddingsを使用して、LLM出力を低レーテンシーで実際のビジネスデータに「グラウンディング」することができる。Stack Overflowデモで使用されるアーキテクチャーに加えて、グラウンディングのもう1つの一般的な方法は、ベクトル検索結果をLLMに入力し、LLMがユーザーに対する最終的な回答テキストを生成することだ。LangChainは、このパイプラインを実装するための人気のあるツールであり、Vertex AI Gen AI埋め込みAPIとVector Searchは、LangChainの統合に最適だ。

この記事を共有:

最新のニュース
Gemini、 Google AIを活用したカスタムトラック作成を開始

Gemini、 Google AIを活用したカスタムトラック作成を開始

26/2/20 0:00

Geminiは、ユーザーが説明文を入力するか写真をアップロードするだけで、カスタム音楽トラックを作成できる新機能を導入しました。

Google、グローバルAIアクセス強化イニシアチブを発表

Google、グローバルAIアクセス強化イニシアチブを発表

26/2/20 0:00

Googleは、AI技術への世界的なアクセス向上への取り組みを発表し、様々な分野における課題解決のためにこれらのツールが広く利用可能であることの重要性を強調しました。

Sarvam AI と NVIDIA が多言語 AI モデルを加速

Sarvam AI と NVIDIA が多言語 AI モデルを加速

26/2/20 0:00

インド・ベンガルールのAIスタートアップ企業Sarvam AIは、インドの多様な言語ニーズに応えるため、大規模な多言語基盤モデルを構築するという野心的なプロジェクトに着手しました。

NVIDIA と Nebius が GPU 部分割り当てのメリットを紹介

NVIDIA と Nebius が GPU 部分割り当てのメリットを紹介

26/2/20 0:00

NVIDIA は Nebius 社と協力し、大規模言語モデル (LLM) 推論における NVIDIA Run:ai の部分的 GPU 割り当てによるパフォーマンス向上を評価しました。

Copyright © 2024 Generatived - All right Reserved.

この記事を共有:

この記事を共有:

Generatived AI Logo

Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。

  • Facebook
  • X

フォローをお願いします

言語

最新のニュース
Gemini、 Google AIを活用したカスタムトラック作成を開始

Gemini、 Google AIを活用したカスタムトラック作成を開始

26/2/20 0:00

Geminiは、ユーザーが説明文を入力するか写真をアップロードするだけで、カスタム音楽トラックを作成できる新機能を導入しました。

Google、グローバルAIアクセス強化イニシアチブを発表

Google、グローバルAIアクセス強化イニシアチブを発表

26/2/20 0:00

Googleは、AI技術への世界的なアクセス向上への取り組みを発表し、様々な分野における課題解決のためにこれらのツールが広く利用可能であることの重要性を強調しました。

Sarvam AI と NVIDIA が多言語 AI モデルを加速

Sarvam AI と NVIDIA が多言語 AI モデルを加速

26/2/20 0:00

インド・ベンガルールのAIスタートアップ企業Sarvam AIは、インドの多様な言語ニーズに応えるため、大規模な多言語基盤モデルを構築するという野心的なプロジェクトに着手しました。

NVIDIA と Nebius が GPU 部分割り当てのメリットを紹介

NVIDIA と Nebius が GPU 部分割り当てのメリットを紹介

26/2/20 0:00

NVIDIA は Nebius 社と協力し、大規模言語モデル (LLM) 推論における NVIDIA Run:ai の部分的 GPU 割り当てによるパフォーマンス向上を評価しました。

bottom of page