Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

NVIDIA cải tiến khả năng viết lại truy vấn AI cho RAG Systems

Generatived

0:00 6/8/25

NVIDIA đang giới thiệu các khả năng suy luận AI tiên tiến cho Nemotron LLM để cải thiện các hệ thống mở rộng và tạo tìm kiếm (RAG). Các hệ thống này thường gặp khó khăn với các truy vấn người dùng mơ hồ hoặc ẩn ý, dẫn đến kết quả tìm kiếm không tối ưu. Giải pháp của NVIDIA sử dụng các chiến lược phân tích và viết lại truy vấn nâng cao để tinh chỉnh khả năng tìm kiếm của công cụ truy vấn và cải thiện tính liên quan cũng như độ chính xác của thông tin được truy xuất.

Viết lại truy vấn là một thành phần quan trọng của RAG, chuyển đổi lời nhắc ban đầu của người dùng thành một truy vấn tìm kiếm hiệu quả hơn. Quá trình này giúp thu hẹp khoảng cách giữa ngôn ngữ người dùng và thông tin có cấu trúc trong cơ sở tri thức. Các kỹ thuật như Query2Expand (Q2E), Query2Doc (Q2D) và viết lại truy vấn Chain-of-Thought (CoT) được sử dụng để tái cấu trúc truy vấn, đưa ra các từ khóa quan trọng và căn chỉnh truy vấn người dùng với ngữ nghĩa của một ngữ liệu, cải thiện đáng kể chất lượng tìm kiếm và trả lời.

Dòng sản phẩm Nemotron, bao gồm Llama 3.3 và Nemotron Super 49B v1, được tối ưu hóa về hiệu quả và hiệu suất trong các ứng dụng như RAG. Các mô hình này đã được chứng minh là hiệu quả trong việc cải thiện độ chính xác của việc truy xuất thông tin, thể hiện qua hiệu suất của chúng trên tập dữ liệu Natural Questions (NQ). Các mô hình Nemotron có sẵn ở nhiều kích cỡ khác nhau, và bằng cách kết hợp kiến trúc Meta Llama với công nghệ xử lý hậu huấn luyện của NVIDIA, chúng đã đạt được độ chính xác cao trong các tiêu chuẩn ngành.

NVIDIA đang giải quyết khoảng cách ngữ nghĩa giữa ngôn ngữ người dùng và vốn từ vựng nội dung bằng cách cải thiện công cụ truy vấn tìm kiếm với khả năng suy luận. Việc sử dụng các kỹ thuật viết lại truy vấn như Q2E có thể cải thiện đáng kể thứ hạng của các phiên liên quan được trả về bởi các trình truy xuất dựa trên độ tương đồng ngữ nghĩa. Quá trình này không chỉ cải thiện độ chính xác của kết quả tìm kiếm mà còn mở rộng phạm vi của trình xếp hạng lại, cho phép nó xác định các phiên thảo luận về các khái niệm liên quan ngay cả khi các thuật ngữ chính xác giống với truy vấn ban đầu không được sử dụng. Quy trình RAG nâng cao của chúng tôi mang lại lợi thế rõ ràng so với các phương pháp truyền thống bằng cách định dạng lại các truy vấn người dùng một cách thông minh để bổ sung ngữ cảnh và chi tiết quan trọng, tạo ra một nhóm ứng viên chất lượng cao, có liên quan cao và cải thiện hiệu suất hệ thống.

Nguồn: Blog nhà phát triển NVIDIA

Chia sẻ bài viết này:

Tin tức mới nhất

Solpac ra mắt dịch vụ IBM i được quản lý bằng AI.

0:00 22/4/26

Solpac vừa công bố ra mắt i_RODOR_i, một dịch vụ được quản lý bằng trí tuệ nhân tạo (AI) được thiết kế cho môi trường IBM i, tích hợp điện toán đám mây, tự động hóa và hỗ trợ vận hành.

đọc thêm

Hitachi Solutions ra mắt mitoco AI dành cho Salesforce.

0:00 22/4/26

Hitachi Solutions vừa công bố ra mắt "mitoco AI", một dịch vụ trí tuệ nhân tạo tạo sinh tích hợp với Salesforce nhằm nâng cao khả năng sử dụng dữ liệu doanh nghiệp

đọc thêm

TIS ra mắt dịch vụ quản lý bảo vệ dữ liệu bằng trí tuệ nhân tạo.

0:00 22/4/26

TIS vừa công bố ra mắt dịch vụ quản lý bảo vệ dữ liệu sẵn sàng cho AI, được thiết kế để giải quyết các rủi ro rò rỉ dữ liệu ngày càng gia tăng liên quan đến việc áp dụng AI

đọc thêm

DI System ra mắt nền tảng đào tạo AI Pijetre

0:00 22/4/26

DI System vừa công bố ra mắt nền tảng đào tạo dựa trên trí tuệ nhân tạo (AI) mang tên “Pijetre”, được phát triển bởi công ty con của họ.

đọc thêm

Chia sẻ bài viết này:

Danh mục

Trình nâng cao hình ảnh AI

Trình tạo mã AI

Quản lý tác vụ AI

Không có mã/mã thấp

Trình tạo thiết kế đồ họa AI

Trình tạo minh họa/nghệ thuật AI

Tất cả công cụ

Tin tức

AI và luật/hệ thống/kinh tế/xã hội

Các công ty/sản phẩm/công nghệ AI

AI công nghệ lớn

OpenAI/ChatGPT

AI thế hệ sáng tạo

AI thế hệ dựa trên văn bản

AI sáng tạo của Nhật Bản

Cơ bản về AI sáng tạo

Hướng dẫn ứng dụng AI cơ bản

Hồ sơ công ty

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng trang web

Công ty điều hành

Hãy theo dõi chúng tôi

Ngôn ngữ

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Hãy theo dõi chúng tôi

Ngôn ngữ

Danh mục

Tất cả công cụ

Quản lý tác vụ AI

Trình tạo thiết kế đồ họa AI

Không có mã/mã thấp

Trình tạo mã AI

Trình nâng cao hình ảnh AI

Trình tạo minh họa/nghệ thuật AI

AI và luật/hệ thống/kinh tế/xã hội

Các công ty/sản phẩm/công nghệ AI

AI công nghệ lớn

OpenAI/ChatGPT

AI thế hệ sáng tạo

AI thế hệ dựa trên văn bản

AI sáng tạo của Nhật Bản

Cơ bản về AI tạo ra

Hướng dẫn ứng dụng AI cơ bản

Tin tức

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng của trang web

Công ty điều hành

Hồ sơ công ty

Tin tức mới nhất

Solpac ra mắt dịch vụ IBM i được quản lý bằng AI.

0:00 22/4/26

Solpac vừa công bố ra mắt i_RODOR_i, một dịch vụ được quản lý bằng trí tuệ nhân tạo (AI) được thiết kế cho môi trường IBM i, tích hợp điện toán đám mây, tự động hóa và hỗ trợ vận hành.

đọc thêm

Hitachi Solutions ra mắt mitoco AI dành cho Salesforce.

0:00 22/4/26

Hitachi Solutions vừa công bố ra mắt "mitoco AI", một dịch vụ trí tuệ nhân tạo tạo sinh tích hợp với Salesforce nhằm nâng cao khả năng sử dụng dữ liệu doanh nghiệp

đọc thêm

TIS ra mắt dịch vụ quản lý bảo vệ dữ liệu bằng trí tuệ nhân tạo.

0:00 22/4/26

TIS vừa công bố ra mắt dịch vụ quản lý bảo vệ dữ liệu sẵn sàng cho AI, được thiết kế để giải quyết các rủi ro rò rỉ dữ liệu ngày càng gia tăng liên quan đến việc áp dụng AI

đọc thêm

DI System ra mắt nền tảng đào tạo AI Pijetre

0:00 22/4/26

DI System vừa công bố ra mắt nền tảng đào tạo dựa trên trí tuệ nhân tạo (AI) mang tên “Pijetre”, được phát triển bởi công ty con của họ.

đọc thêm