top of page
Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif
logo.png

Vertex AI merilis pencarian semantik berkemampuan LLM

Generatived

26/9/23, 05.21

Memahami konsep grounding, embedding, dan pencarian vektor penting untuk membangun layanan Gen AI yang andal bagi perusahaan. Contoh utamanya adalah pencarian semantik dari 8 juta pertanyaan Stack Overflow yang dapat dijalankan dalam milidetik. Demo ini terbuka untuk umum dan memungkinkan pengguna memilih "STACKOVERFLOW", memasukkan pertanyaan pengkodean mereka sebagai kueri, dan melakukan pencarian teks terhadap jutaan pertanyaan yang diposting di platform. Demo ini menampilkan pencarian semantik berkemampuan LLM, berdasarkan fakta bisnis, serta skalabilitas dan kecepatan. Faktor pendukung utama dari solusi ini adalah penyematan yang dihasilkan dengan Vertex AI Embeddings for Text dan pencarian vektor yang cepat dan terukur dengan Vertex AI Vector Search. API penyematan memungkinkan Anda menerapkan penyematan ke berbagai tugas pemrosesan teks yang dikombinasikan dengan fungsionalitas LLM. Tugas-tugas ini mencakup pencarian semantik yang mendukung LLM, klasifikasi teks, rekomendasi, pengelompokan, deteksi anomali, analisis sentimen, dan banyak lagi. Semua ini dapat ditangani dengan pemahaman mendalam tentang semantik tingkat LLM. Dengan menggabungkan API Embeddings dan Pencarian Vektor, Embeddings dapat digunakan untuk "mendasarkan" keluaran LLM ke data bisnis nyata dengan latensi rendah. Selain arsitektur yang digunakan dalam demo Stack Overflow, metode grounding umum lainnya adalah memasukkan hasil pencarian vektor ke dalam LLM, yang kemudian menghasilkan teks jawaban akhir untuk pengguna. LangChain adalah alat populer untuk mengimplementasikan pipeline ini, dan Vertex AI Gen AI Embedded API serta Pencarian Vektor sempurna untuk integrasi LangChain.

Bagikan artikel ini:

Tin tức mới nhất
Gemini、 Google AIを活用したカスタムトラック作成を開始

Gemini、 Google AIを活用したカスタムトラック作成を開始

20/2/26, 00.00

Geminiは、ユーザーが説明文を入力するか写真をアップロードするだけで、カスタム音楽トラックを作成できる新機能を導入しました。

Google、グローバルAIアクセス強化イニシアチブを発表

Google、グローバルAIアクセス強化イニシアチブを発表

20/2/26, 00.00

Googleは、AI技術への世界的なアクセス向上への取り組みを発表し、様々な分野における課題解決のためにこれらのツールが広く利用可能であることの重要性を強調しました。

Sarvam AI と NVIDIA が多言語 AI モデルを加速

Sarvam AI と NVIDIA が多言語 AI モデルを加速

20/2/26, 00.00

インド・ベンガルールのAIスタートアップ企業Sarvam AIは、インドの多様な言語ニーズに応えるため、大規模な多言語基盤モデルを構築するという野心的なプロジェクトに着手しました。

NVIDIA と Nebius が GPU 部分割り当てのメリットを紹介

NVIDIA と Nebius が GPU 部分割り当てのメリットを紹介

20/2/26, 00.00

NVIDIA は Nebius 社と協力し、大規模言語モデル (LLM) 推論における NVIDIA Run:ai の部分的 GPU 割り当てによるパフォーマンス向上を評価しました。

Copyright © 2024 Generatived - All right Reserved.

Bagikan artikel ini:

Bagikan artikel ini:

Generatived

Hãy theo dõi chúng tôi

  • Facebook
  • X

Bahasa

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Generatived AI Logo

Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.

  • Facebook
  • X

Ikuti kami

Bahasa

Berita terkini
Gemini、 Google AIを活用したカスタムトラック作成を開始

Gemini、 Google AIを活用したカスタムトラック作成を開始

20/2/26, 00.00

Geminiは、ユーザーが説明文を入力するか写真をアップロードするだけで、カスタム音楽トラックを作成できる新機能を導入しました。

Google、グローバルAIアクセス強化イニシアチブを発表

Google、グローバルAIアクセス強化イニシアチブを発表

20/2/26, 00.00

Googleは、AI技術への世界的なアクセス向上への取り組みを発表し、様々な分野における課題解決のためにこれらのツールが広く利用可能であることの重要性を強調しました。

Sarvam AI と NVIDIA が多言語 AI モデルを加速

Sarvam AI と NVIDIA が多言語 AI モデルを加速

20/2/26, 00.00

インド・ベンガルールのAIスタートアップ企業Sarvam AIは、インドの多様な言語ニーズに応えるため、大規模な多言語基盤モデルを構築するという野心的なプロジェクトに着手しました。

NVIDIA と Nebius が GPU 部分割り当てのメリットを紹介

NVIDIA と Nebius が GPU 部分割り当てのメリットを紹介

20/2/26, 00.00

NVIDIA は Nebius 社と協力し、大規模言語モデル (LLM) 推論における NVIDIA Run:ai の部分的 GPU 割り当てによるパフォーマンス向上を評価しました。

bottom of page