Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif

NVIDIA Meningkatkan Penulisan Ulang Kueri AI untuk Sistem RAG
Generatived
6/8/25, 00.00
NVIDIA memperkenalkan kemampuan inferensi AI tingkat lanjut ke Nemotron LLM untuk meningkatkan sistem perluasan dan pembangkitan pencarian (RAG). Sistem ini seringkali kesulitan menangani kueri pengguna yang ambigu atau implisit, sehingga menghasilkan hasil pencarian yang kurang optimal. Solusi NVIDIA menggunakan analisis kueri tingkat lanjut dan strategi penulisan ulang untuk menyempurnakan kemampuan pencarian mesin kueri dan meningkatkan relevansi serta akurasi informasi yang diambil.
Penulisan ulang kueri merupakan komponen kunci RAG, yang mengubah prompt awal pengguna menjadi kueri pencarian yang lebih efektif. Proses ini membantu menjembatani kesenjangan antara bahasa pengguna dan informasi terstruktur dalam basis pengetahuan. Teknik seperti penulisan ulang kueri Query2Expand (Q2E), Query2Doc (Q2D), dan Chain-of-Thought (CoT) digunakan untuk merestrukturisasi kueri, memperkenalkan kata kunci penting, dan menyelaraskan kueri pengguna dengan semantik korpus, sehingga meningkatkan kualitas pencarian dan jawaban secara signifikan.
Keluarga model Nemotron, termasuk Llama 3.3 Nemotron Super 49B v1, dioptimalkan untuk efisiensi dan kinerja dalam aplikasi seperti RAG. Model-model ini telah terbukti efektif dalam meningkatkan akurasi pengambilan informasi, sebagaimana dibuktikan oleh kinerjanya pada dataset Natural Questions (NQ). Model Nemotron tersedia dalam berbagai ukuran, dan dengan menggabungkan arsitektur Meta Llama dengan teknologi pemrosesan pasca-pelatihan NVIDIA, model-model ini telah mencapai akurasi tinggi dalam tolok ukur industri.
NVIDIA mengatasi kesenjangan semantik antara bahasa pengguna dan kosakata konten dengan meningkatkan mesin kueri penelusurannya dengan kemampuan inferensi. Penggunaan teknik penulisan ulang kueri seperti Q2E dapat secara signifikan meningkatkan peringkat sesi relevan yang dihasilkan oleh pengambil berbasis kesamaan semantik. Proses ini tidak hanya meningkatkan akurasi hasil penelusuran, tetapi juga memperluas jangkauan pemeringkatan ulang, memungkinkannya mengidentifikasi sesi yang membahas konsep terkait meskipun istilah yang sama persis dengan kueri asli tidak digunakan. Alur RAG kami yang telah disempurnakan menawarkan keunggulan yang jelas dibandingkan metode tradisional dengan merumuskan ulang kueri pengguna secara cerdas untuk menambahkan konteks dan detail penting, menciptakan kumpulan kandidat berkualitas tinggi dan sangat relevan, serta meningkatkan kinerja sistem.
Bagikan artikel ini:
Tin tức mới nhất
NVIDIA Umumkan NVFP4 untuk Enhance AI
10/2/26, 00.00
NVIDIA secara aktif terlibat dalam perancangan bersama yang ekstrem untuk memenuhi permintaan yang terus meningkat akan kinerja komputasi AI dengan kecepatan yang melampaui kemajuan
OpenAI memperkuat aksesibilitas AI lokal dalam skala global.
10/2/26, 00.00
OpenAI memposisikan AI sebagai infrastruktur nasional yang penting, serupa dengan listrik, menyoroti kebutuhan global akan sistem AI yang tidak hanya canggih tetapi juga sesuai secara budaya dan hukum.
OpenAI: Pendekatan baru untuk pengembangan berbasis AI
10/2/26, 00.00
OpenAI (San Francisco) telah menerbitkan artikel baru tentang metode pengembangan menggunakan Codex, sebuah model AI untuk pengkodean.
Copyright © 2024 Generatived - All right Reserved.
Bagikan artikel ini:
Bagikan artikel ini:
Kategori
Berita
AI dan hukum/peraturan/masyarakat
Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.
Berita terkini
NVIDIA Umumkan NVFP4 untuk Enhance AI
10/2/26, 00.00
NVIDIA secara aktif terlibat dalam perancangan bersama yang ekstrem untuk memenuhi permintaan yang terus meningkat akan kinerja komputasi AI dengan kecepatan yang melampaui kemajuan
OpenAI memperkuat aksesibilitas AI lokal dalam skala global.
10/2/26, 00.00
OpenAI memposisikan AI sebagai infrastruktur nasional yang penting, serupa dengan listrik, menyoroti kebutuhan global akan sistem AI yang tidak hanya canggih tetapi juga sesuai secara budaya dan hukum.
OpenAI: Pendekatan baru untuk pengembangan berbasis AI
10/2/26, 00.00
OpenAI (San Francisco) telah menerbitkan artikel baru tentang metode pengembangan menggunakan Codex, sebuah model AI untuk pengkodean.


%20(1).webp)



