top of page
Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif
logo.png

NVIDIA Meningkatkan Penulisan Ulang Kueri AI untuk Sistem RAG

Generatived

6/8/25, 00.00

NVIDIA memperkenalkan kemampuan inferensi AI tingkat lanjut ke Nemotron LLM untuk meningkatkan sistem perluasan dan pembangkitan pencarian (RAG). Sistem ini seringkali kesulitan menangani kueri pengguna yang ambigu atau implisit, sehingga menghasilkan hasil pencarian yang kurang optimal. Solusi NVIDIA menggunakan analisis kueri tingkat lanjut dan strategi penulisan ulang untuk menyempurnakan kemampuan pencarian mesin kueri dan meningkatkan relevansi serta akurasi informasi yang diambil.

Penulisan ulang kueri merupakan komponen kunci RAG, yang mengubah prompt awal pengguna menjadi kueri pencarian yang lebih efektif. Proses ini membantu menjembatani kesenjangan antara bahasa pengguna dan informasi terstruktur dalam basis pengetahuan. Teknik seperti penulisan ulang kueri Query2Expand (Q2E), Query2Doc (Q2D), dan Chain-of-Thought (CoT) digunakan untuk merestrukturisasi kueri, memperkenalkan kata kunci penting, dan menyelaraskan kueri pengguna dengan semantik korpus, sehingga meningkatkan kualitas pencarian dan jawaban secara signifikan.

Keluarga model Nemotron, termasuk Llama 3.3 Nemotron Super 49B v1, dioptimalkan untuk efisiensi dan kinerja dalam aplikasi seperti RAG. Model-model ini telah terbukti efektif dalam meningkatkan akurasi pengambilan informasi, sebagaimana dibuktikan oleh kinerjanya pada dataset Natural Questions (NQ). Model Nemotron tersedia dalam berbagai ukuran, dan dengan menggabungkan arsitektur Meta Llama dengan teknologi pemrosesan pasca-pelatihan NVIDIA, model-model ini telah mencapai akurasi tinggi dalam tolok ukur industri.

NVIDIA mengatasi kesenjangan semantik antara bahasa pengguna dan kosakata konten dengan meningkatkan mesin kueri penelusurannya dengan kemampuan inferensi. Penggunaan teknik penulisan ulang kueri seperti Q2E dapat secara signifikan meningkatkan peringkat sesi relevan yang dihasilkan oleh pengambil berbasis kesamaan semantik. Proses ini tidak hanya meningkatkan akurasi hasil penelusuran, tetapi juga memperluas jangkauan pemeringkatan ulang, memungkinkannya mengidentifikasi sesi yang membahas konsep terkait meskipun istilah yang sama persis dengan kueri asli tidak digunakan. Alur RAG kami yang telah disempurnakan menawarkan keunggulan yang jelas dibandingkan metode tradisional dengan merumuskan ulang kueri pengguna secara cerdas untuk menambahkan konteks dan detail penting, menciptakan kumpulan kandidat berkualitas tinggi dan sangat relevan, serta meningkatkan kinerja sistem.

Bagikan artikel ini:

Tin tức mới nhất
Tim teknologi AI memperingatkan risiko keselamatan pada model generatif.

Tim teknologi AI memperingatkan risiko keselamatan pada model generatif.

12/2/26, 00.00

Penelitian terbaru menunjukkan bahwa keselarasan keamanan antara model bahasa besar (LLM) dan model difusi dapat terganggu oleh teknik yang disebut optimasi kebijakan relatif kelompok (GRPO).

Survei Meta-Linux Foundation: AI Mendorong Perekonomian Kanada

Survei Meta-Linux Foundation: AI Mendorong Perekonomian Kanada

12/2/26, 00.00

Kanada sedang memposisikan diri sebagai pemimpin global dalam kecerdasan buatan (AI), yang dapat menghasilkan manfaat ekonomi yang nyata, menurut sebuah laporan terbaru.

NVIDIA AutoDeploy Mempermudah Penerapan Model Bahasa Skala Besar

NVIDIA AutoDeploy Mempermudah Penerapan Model Bahasa Skala Besar

12/2/26, 00.00

NVIDIA telah mengumumkan rilis beta dari AutoDeploy, sebuah fitur dari TensorRT LLM.

Kini kompatibel dengan JTP “ Generative AI Ketiga”

Kini kompatibel dengan JTP “ Generative AI Ketiga”

12/2/26, 00.00

JTP (Shinagawa-ku, Tokyo) mengumumkan pada tanggal 6 Februari 2026 bahwa "Solusi Generative AI Ketiga" mereka kini kompatibel dengan "Claude Opus 4.6" dari Anthropic.

Copyright © 2024 Generatived - All right Reserved.

Bagikan artikel ini:

Bagikan artikel ini:

Generatived

Hãy theo dõi chúng tôi

  • Facebook
  • X

Bahasa

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Generatived AI Logo

Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.

  • Facebook
  • X

Ikuti kami

Bahasa

Berita terkini
Tim teknologi AI memperingatkan risiko keselamatan pada model generatif.

Tim teknologi AI memperingatkan risiko keselamatan pada model generatif.

12/2/26, 00.00

Penelitian terbaru menunjukkan bahwa keselarasan keamanan antara model bahasa besar (LLM) dan model difusi dapat terganggu oleh teknik yang disebut optimasi kebijakan relatif kelompok (GRPO).

Survei Meta-Linux Foundation: AI Mendorong Perekonomian Kanada

Survei Meta-Linux Foundation: AI Mendorong Perekonomian Kanada

12/2/26, 00.00

Kanada sedang memposisikan diri sebagai pemimpin global dalam kecerdasan buatan (AI), yang dapat menghasilkan manfaat ekonomi yang nyata, menurut sebuah laporan terbaru.

NVIDIA AutoDeploy Mempermudah Penerapan Model Bahasa Skala Besar

NVIDIA AutoDeploy Mempermudah Penerapan Model Bahasa Skala Besar

12/2/26, 00.00

NVIDIA telah mengumumkan rilis beta dari AutoDeploy, sebuah fitur dari TensorRT LLM.

Kini kompatibel dengan JTP “ Generative AI Ketiga”

Kini kompatibel dengan JTP “ Generative AI Ketiga”

12/2/26, 00.00

JTP (Shinagawa-ku, Tokyo) mengumumkan pada tanggal 6 Februari 2026 bahwa "Solusi Generative AI Ketiga" mereka kini kompatibel dengan "Claude Opus 4.6" dari Anthropic.

bottom of page