top of page
Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif
logo.png

NVIDIA Meningkatkan Penulisan Ulang Kueri AI untuk Sistem RAG

Generatived

6/8/25, 00.00

NVIDIA memperkenalkan kemampuan inferensi AI tingkat lanjut ke Nemotron LLM untuk meningkatkan sistem perluasan dan pembangkitan pencarian (RAG). Sistem ini seringkali kesulitan menangani kueri pengguna yang ambigu atau implisit, sehingga menghasilkan hasil pencarian yang kurang optimal. Solusi NVIDIA menggunakan analisis kueri tingkat lanjut dan strategi penulisan ulang untuk menyempurnakan kemampuan pencarian mesin kueri dan meningkatkan relevansi serta akurasi informasi yang diambil.

Penulisan ulang kueri merupakan komponen kunci RAG, yang mengubah prompt awal pengguna menjadi kueri pencarian yang lebih efektif. Proses ini membantu menjembatani kesenjangan antara bahasa pengguna dan informasi terstruktur dalam basis pengetahuan. Teknik seperti penulisan ulang kueri Query2Expand (Q2E), Query2Doc (Q2D), dan Chain-of-Thought (CoT) digunakan untuk merestrukturisasi kueri, memperkenalkan kata kunci penting, dan menyelaraskan kueri pengguna dengan semantik korpus, sehingga meningkatkan kualitas pencarian dan jawaban secara signifikan.

Keluarga model Nemotron, termasuk Llama 3.3 Nemotron Super 49B v1, dioptimalkan untuk efisiensi dan kinerja dalam aplikasi seperti RAG. Model-model ini telah terbukti efektif dalam meningkatkan akurasi pengambilan informasi, sebagaimana dibuktikan oleh kinerjanya pada dataset Natural Questions (NQ). Model Nemotron tersedia dalam berbagai ukuran, dan dengan menggabungkan arsitektur Meta Llama dengan teknologi pemrosesan pasca-pelatihan NVIDIA, model-model ini telah mencapai akurasi tinggi dalam tolok ukur industri.

NVIDIA mengatasi kesenjangan semantik antara bahasa pengguna dan kosakata konten dengan meningkatkan mesin kueri penelusurannya dengan kemampuan inferensi. Penggunaan teknik penulisan ulang kueri seperti Q2E dapat secara signifikan meningkatkan peringkat sesi relevan yang dihasilkan oleh pengambil berbasis kesamaan semantik. Proses ini tidak hanya meningkatkan akurasi hasil penelusuran, tetapi juga memperluas jangkauan pemeringkatan ulang, memungkinkannya mengidentifikasi sesi yang membahas konsep terkait meskipun istilah yang sama persis dengan kueri asli tidak digunakan. Alur RAG kami yang telah disempurnakan menawarkan keunggulan yang jelas dibandingkan metode tradisional dengan merumuskan ulang kueri pengguna secara cerdas untuk menambahkan konteks dan detail penting, menciptakan kumpulan kandidat berkualitas tinggi dan sangat relevan, serta meningkatkan kinerja sistem.

Bagikan artikel ini:

Tin tức mới nhất
Pengembang ChatGPT Enhance AI

Pengembang ChatGPT Enhance AI

30/1/26, 00.00

Sistem AI meningkatkan pengalaman pengguna dengan melakukan tugas-tugas berbasis web, tetapi kemudahan ini disertai dengan potensi risiko keamanan.

Platform data AI untuk industri asuransi

Platform data AI untuk industri asuransi

30/1/26, 00.00

AI Data (Minato-ku, Tokyo) telah mengumumkan peluncuran "AI InsurancePro on IDX," sebuah platform yang akan mentransformasi operasional industri asuransi.

Berpartisipasi dalam Deklarasi Bersama Pemberdayaan Perempuan Kognitif

Berpartisipasi dalam Deklarasi Bersama Pemberdayaan Perempuan Kognitif

30/1/26, 00.00

Cognitee (Shinagawa-ku, Tokyo) akan berpartisipasi dalam Forum Future Perempuan Tokyo 2026 pada tanggal 26 Januari 2026.

Pengembangan Ruang Kelas AI untuk Revitalisasi Regional Aryaumu

Pengembangan Ruang Kelas AI untuk Revitalisasi Regional Aryaumu

30/1/26, 00.00

Toshitaka, yang menjalankan "Hashimoto Suinin! DAO" Kota Hashimoto menggunakan "Regional Revitalization Cooperation Team DAO" yang disediakan oleh Aruyaum (Kota Sapporo), sedang menarik perhatian.

Copyright © 2024 Generatived - All right Reserved.

Bagikan artikel ini:

Bagikan artikel ini:

Generatived

Hãy theo dõi chúng tôi

  • Facebook
  • X

Bahasa

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Generatived AI Logo

Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.

  • Facebook
  • X

Ikuti kami

Bahasa

Berita terkini
Pengembang ChatGPT Enhance AI

Pengembang ChatGPT Enhance AI

30/1/26, 00.00

Sistem AI meningkatkan pengalaman pengguna dengan melakukan tugas-tugas berbasis web, tetapi kemudahan ini disertai dengan potensi risiko keamanan.

Platform data AI untuk industri asuransi

Platform data AI untuk industri asuransi

30/1/26, 00.00

AI Data (Minato-ku, Tokyo) telah mengumumkan peluncuran "AI InsurancePro on IDX," sebuah platform yang akan mentransformasi operasional industri asuransi.

Berpartisipasi dalam Deklarasi Bersama Pemberdayaan Perempuan Kognitif

Berpartisipasi dalam Deklarasi Bersama Pemberdayaan Perempuan Kognitif

30/1/26, 00.00

Cognitee (Shinagawa-ku, Tokyo) akan berpartisipasi dalam Forum Future Perempuan Tokyo 2026 pada tanggal 26 Januari 2026.

Pengembangan Ruang Kelas AI untuk Revitalisasi Regional Aryaumu

Pengembangan Ruang Kelas AI untuk Revitalisasi Regional Aryaumu

30/1/26, 00.00

Toshitaka, yang menjalankan "Hashimoto Suinin! DAO" Kota Hashimoto menggunakan "Regional Revitalization Cooperation Team DAO" yang disediakan oleh Aruyaum (Kota Sapporo), sedang menarik perhatian.

bottom of page