top of page
Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif
logo.png

NVIDIA Meningkatkan Penulisan Ulang Kueri AI untuk Sistem RAG

Generatived

6/8/25, 00.00

NVIDIA memperkenalkan kemampuan inferensi AI tingkat lanjut ke Nemotron LLM untuk meningkatkan sistem perluasan dan pembangkitan pencarian (RAG). Sistem ini seringkali kesulitan menangani kueri pengguna yang ambigu atau implisit, sehingga menghasilkan hasil pencarian yang kurang optimal. Solusi NVIDIA menggunakan analisis kueri tingkat lanjut dan strategi penulisan ulang untuk menyempurnakan kemampuan pencarian mesin kueri dan meningkatkan relevansi serta akurasi informasi yang diambil.

Penulisan ulang kueri merupakan komponen kunci RAG, yang mengubah prompt awal pengguna menjadi kueri pencarian yang lebih efektif. Proses ini membantu menjembatani kesenjangan antara bahasa pengguna dan informasi terstruktur dalam basis pengetahuan. Teknik seperti penulisan ulang kueri Query2Expand (Q2E), Query2Doc (Q2D), dan Chain-of-Thought (CoT) digunakan untuk merestrukturisasi kueri, memperkenalkan kata kunci penting, dan menyelaraskan kueri pengguna dengan semantik korpus, sehingga meningkatkan kualitas pencarian dan jawaban secara signifikan.

Keluarga model Nemotron, termasuk Llama 3.3 Nemotron Super 49B v1, dioptimalkan untuk efisiensi dan kinerja dalam aplikasi seperti RAG. Model-model ini telah terbukti efektif dalam meningkatkan akurasi pengambilan informasi, sebagaimana dibuktikan oleh kinerjanya pada dataset Natural Questions (NQ). Model Nemotron tersedia dalam berbagai ukuran, dan dengan menggabungkan arsitektur Meta Llama dengan teknologi pemrosesan pasca-pelatihan NVIDIA, model-model ini telah mencapai akurasi tinggi dalam tolok ukur industri.

NVIDIA mengatasi kesenjangan semantik antara bahasa pengguna dan kosakata konten dengan meningkatkan mesin kueri penelusurannya dengan kemampuan inferensi. Penggunaan teknik penulisan ulang kueri seperti Q2E dapat secara signifikan meningkatkan peringkat sesi relevan yang dihasilkan oleh pengambil berbasis kesamaan semantik. Proses ini tidak hanya meningkatkan akurasi hasil penelusuran, tetapi juga memperluas jangkauan pemeringkatan ulang, memungkinkannya mengidentifikasi sesi yang membahas konsep terkait meskipun istilah yang sama persis dengan kueri asli tidak digunakan. Alur RAG kami yang telah disempurnakan menawarkan keunggulan yang jelas dibandingkan metode tradisional dengan merumuskan ulang kueri pengguna secara cerdas untuk menambahkan konteks dan detail penting, menciptakan kumpulan kandidat berkualitas tinggi dan sangat relevan, serta meningkatkan kinerja sistem.

Bagikan artikel ini:

Tin tức mới nhất
Memperluas platform AI khusus industri data AI

Memperluas platform AI khusus industri data AI

16/2/26, 00.00

AI Data (Minato-ku, Tokyo) telah mengumumkan perluasan platform AI khusus bisnisnya. Perusahaan akan memperkuat "AI Factory" yang menyediakan dukungan lintas industri

Peluncuran Layanan Dukungan Divisi Bisnis AIX Baru Bloom

Peluncuran Layanan Dukungan Divisi Bisnis AIX Baru Bloom

16/2/26, 00.00

Bloom (Chiyoda-ku, Tokyo) berfokus pada penggunaan AI untuk meningkatkan efisiensi bisnis dan menyediakan layanan dukungan AI kepada perusahaan.

Peningkatan Keamanan AI Digeon ENSOU

Peningkatan Keamanan AI Digeon ENSOU

16/2/26, 00.00

Digeon (Kobe, Prefektur Hyogo) telah menambahkan otentikasi masuk tunggal menggunakan akun Microsoft dan fungsi pembatasan alamat IP ke agen Generative AI

Peluncuran rekrutmen agen AI PeopleX

Peluncuran rekrutmen agen AI PeopleX

16/2/26, 00.00

PeopleX (Shinjuku-ku, Tokyo) telah meluncurkan layanan agen AI-nya, "PeopleX AI Copilot."

Copyright © 2024 Generatived - All right Reserved.

Bagikan artikel ini:

Bagikan artikel ini:

Generatived

Hãy theo dõi chúng tôi

  • Facebook
  • X

Bahasa

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Generatived AI Logo

Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.

  • Facebook
  • X

Ikuti kami

Bahasa

Berita terkini
Memperluas platform AI khusus industri data AI

Memperluas platform AI khusus industri data AI

16/2/26, 00.00

AI Data (Minato-ku, Tokyo) telah mengumumkan perluasan platform AI khusus bisnisnya. Perusahaan akan memperkuat "AI Factory" yang menyediakan dukungan lintas industri

Peluncuran Layanan Dukungan Divisi Bisnis AIX Baru Bloom

Peluncuran Layanan Dukungan Divisi Bisnis AIX Baru Bloom

16/2/26, 00.00

Bloom (Chiyoda-ku, Tokyo) berfokus pada penggunaan AI untuk meningkatkan efisiensi bisnis dan menyediakan layanan dukungan AI kepada perusahaan.

Peningkatan Keamanan AI Digeon ENSOU

Peningkatan Keamanan AI Digeon ENSOU

16/2/26, 00.00

Digeon (Kobe, Prefektur Hyogo) telah menambahkan otentikasi masuk tunggal menggunakan akun Microsoft dan fungsi pembatasan alamat IP ke agen Generative AI

Peluncuran rekrutmen agen AI PeopleX

Peluncuran rekrutmen agen AI PeopleX

16/2/26, 00.00

PeopleX (Shinjuku-ku, Tokyo) telah meluncurkan layanan agen AI-nya, "PeopleX AI Copilot."

bottom of page