Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif

NVIDIA Meningkatkan Penulisan Ulang Kueri AI untuk Sistem RAG
Generatived
6/8/25, 00.00
NVIDIA memperkenalkan kemampuan inferensi AI tingkat lanjut ke Nemotron LLM untuk meningkatkan sistem perluasan dan pembangkitan pencarian (RAG). Sistem ini seringkali kesulitan menangani kueri pengguna yang ambigu atau implisit, sehingga menghasilkan hasil pencarian yang kurang optimal. Solusi NVIDIA menggunakan analisis kueri tingkat lanjut dan strategi penulisan ulang untuk menyempurnakan kemampuan pencarian mesin kueri dan meningkatkan relevansi serta akurasi informasi yang diambil.
Penulisan ulang kueri merupakan komponen kunci RAG, yang mengubah prompt awal pengguna menjadi kueri pencarian yang lebih efektif. Proses ini membantu menjembatani kesenjangan antara bahasa pengguna dan informasi terstruktur dalam basis pengetahuan. Teknik seperti penulisan ulang kueri Query2Expand (Q2E), Query2Doc (Q2D), dan Chain-of-Thought (CoT) digunakan untuk merestrukturisasi kueri, memperkenalkan kata kunci penting, dan menyelaraskan kueri pengguna dengan semantik korpus, sehingga meningkatkan kualitas pencarian dan jawaban secara signifikan.
Keluarga model Nemotron, termasuk Llama 3.3 Nemotron Super 49B v1, dioptimalkan untuk efisiensi dan kinerja dalam aplikasi seperti RAG. Model-model ini telah terbukti efektif dalam meningkatkan akurasi pengambilan informasi, sebagaimana dibuktikan oleh kinerjanya pada dataset Natural Questions (NQ). Model Nemotron tersedia dalam berbagai ukuran, dan dengan menggabungkan arsitektur Meta Llama dengan teknologi pemrosesan pasca-pelatihan NVIDIA, model-model ini telah mencapai akurasi tinggi dalam tolok ukur industri.
NVIDIA mengatasi kesenjangan semantik antara bahasa pengguna dan kosakata konten dengan meningkatkan mesin kueri penelusurannya dengan kemampuan inferensi. Penggunaan teknik penulisan ulang kueri seperti Q2E dapat secara signifikan meningkatkan peringkat sesi relevan yang dihasilkan oleh pengambil berbasis kesamaan semantik. Proses ini tidak hanya meningkatkan akurasi hasil penelusuran, tetapi juga memperluas jangkauan pemeringkatan ulang, memungkinkannya mengidentifikasi sesi yang membahas konsep terkait meskipun istilah yang sama persis dengan kueri asli tidak digunakan. Alur RAG kami yang telah disempurnakan menawarkan keunggulan yang jelas dibandingkan metode tradisional dengan merumuskan ulang kueri pengguna secara cerdas untuk menambahkan konteks dan detail penting, menciptakan kumpulan kandidat berkualitas tinggi dan sangat relevan, serta meningkatkan kinerja sistem.
Bagikan artikel ini:
Tin tức mới nhất
Fitur help desk AI baru dari OPERe PokeSapo
16/2/26, 00.00
OPERe (Minato-ku, Tokyo) telah menambahkan fungsi baru, "AI Window," ke sistem komunikasi pasiennya, "PokeSapo."
Layanan VPS otomatis Xserver AI
16/2/26, 00.00
Xserver (Kita-ku, Osaka) telah mulai menawarkan citra aplikasi OpenClaw pada layanan VPS -nya, XServer VPS.
Pembaruan Penting dalam Wawancara AI PeopleX
16/2/26, 00.00
PeopleX (Shinjuku-ku, Tokyo), sebuah perusahaan penyedia layanan dukungan sumber daya manusia berbasis AI
Copyright © 2024 Generatived - All right Reserved.
Bagikan artikel ini:
Bagikan artikel ini:
Kategori
Berita
AI dan hukum/peraturan/masyarakat
Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.
Berita terkini
Fitur help desk AI baru dari OPERe PokeSapo
16/2/26, 00.00
OPERe (Minato-ku, Tokyo) telah menambahkan fungsi baru, "AI Window," ke sistem komunikasi pasiennya, "PokeSapo."
Layanan VPS otomatis Xserver AI
16/2/26, 00.00
Xserver (Kita-ku, Osaka) telah mulai menawarkan citra aplikasi OpenClaw pada layanan VPS -nya, XServer VPS.
Pembaruan Penting dalam Wawancara AI PeopleX
16/2/26, 00.00
PeopleX (Shinjuku-ku, Tokyo), sebuah perusahaan penyedia layanan dukungan sumber daya manusia berbasis AI

%20(1).webp)

%20(1).webp)


