top of page

Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

logo.png

NVIDIA công bố công cụ AI giúp nâng cao Insight về tài liệu

Generatived

0:00 26/11/25

NVIDIA đã công bố Trợ lý Nghiên cứu AI-Q và Bản thiết kế Enterprise RAG, sử dụng các mô hình AI tăng cường tìm kiếm (RAG) và suy luận Nemotron để nâng cao khả năng hiểu tài liệu và trích xuất thông tin chi tiết. Các công cụ này được thiết kế để tự động hóa quy trình phân tích và báo cáo từ các tập dữ liệu lớn và yêu cầu một cơ sở hạ tầng AI mạnh mẽ để triển khai. NVIDIA đã trình bày chi tiết quy trình triển khai trên Amazon Elastic Kubernetes Service (EKS) trên AWS, tận dụng các dịch vụ bổ sung như cơ sở dữ liệu vector không cần máy chủ Amazon OpenSearch, Amazon S3 cho lưu trữ và Karpenter cho khả năng mở rộng GPU động.

Blueprint Trợ lý Nghiên cứu AI-Q được xây dựng dựa trên Blueprint RAG Doanh nghiệp, đóng vai trò là thành phần cốt lõi. Hệ thống tận dụng các dịch vụ vi mô NVIDIA NIM, một bộ chứa suy luận được tối ưu hóa cho các mô hình AI trên GPU. Blueprint AI-Q nâng cao nền tảng RAG với các thành phần tiên tiến như mô hình ngôn ngữ quy mô lớn để tạo báo cáo chi tiết và tích hợp tìm kiếm web cho thông tin thời gian thực.

Kiến trúc giải pháp trên AWS triển khai các vi dịch vụ NVIDIA NIM dưới dạng các pod trên cụm Kubernetes và cung cấp động các phiên bản GPU để tối ưu hóa chi phí và hiệu suất. Blueprint AI-Q bổ sung một lớp "agent" để điều phối các quy trình công việc phức tạp—lập kế hoạch, xây dựng và phản ánh—để tạo ra các báo cáo toàn diện. Blueprint Enterprise RAG có các đường ống song song để trích xuất và truy xuất dữ liệu, đồng thời tích hợp với OpenSearch để cung cấp các câu trả lời theo ngữ cảnh.

Giải pháp AWS của NVIDIA cung cấp một môi trường toàn diện, tự động hóa việc thiết lập cơ sở hạ tầng và các thành phần bảo mật. Giải pháp này tận dụng Amazon EKS để quản lý các dịch vụ container, Amazon S3 cho kho dữ liệu, Amazon OpenSearch Serverless để nhúng tài liệu và Karpenter để tự động mở rộng các nút GPU. Quy trình triển khai được tinh giản bằng các tập lệnh tự động và bao gồm một ngăn xếp khả năng quan sát với các công cụ giám sát như Prometheus, Grafana, Zipkin và NVIDIA DCGM.

Tóm lại, Trợ lý Nghiên cứu AI-Q và Bản thiết kế Enterprise RAG của NVIDIA cung cấp các ứng dụng AI có khả năng mở rộng và hiệu quả cho doanh nghiệp. Được triển khai trên AWS, các công cụ này xử lý và tích hợp thông tin chi tiết từ lượng dữ liệu khổng lồ, chuyển đổi dữ liệu doanh nghiệp thành thông tin tình báo an toàn và hữu ích. Người dùng có thể triển khai các bản thiết kế này trên Amazon EKS để khai thác sức mạnh của AI tạo sinh trong hoạt động kinh doanh của mình.

Chia sẻ bài viết này:

Tin tức mới nhất
GladCube bắt đầu phát triển AI đua ngựa tại Hoa Kỳ

GladCube bắt đầu phát triển AI đua ngựa tại Hoa Kỳ

0:00 17/11/25

Glad Cube (Chuo-ku, Osaka) đã bắt đầu phát triển "StableGenius", một dịch vụ dự đoán AI dành cho thị trường đua ngựa Hoa Kỳ, hợp tác với SPAIA, Inc.

GPT Invest ra mắt nền tảng giao dịch đa tài sản nâng cao

GPT Invest ra mắt nền tảng giao dịch đa tài sản nâng cao

0:00 17/11/25

GPT Invest đã nổi lên như một công ty đáng chú ý trong lĩnh vực công nghệ giao dịch bằng cách cung cấp cơ sở hạ tầng tiên tiến đáp ứng nhu cầu của cả nhà đầu tư tổ chức và cá nhân.

Havana ra mắt nền tảng AI để tuyển sinh sinh viên

Havana ra mắt nền tảng AI để tuyển sinh sinh viên

0:00 17/11/25

Havana đã ra mắt một nền tảng mới sử dụng AI nhằm mục đích hợp lý hóa nỗ lực tuyển sinh sinh viên cho các cơ sở giáo dục đại học.

NeosAI của AssemblyTech giành được Giải thưởng AI của LegalTech

NeosAI của AssemblyTech giành được Giải thưởng AI của LegalTech

0:00 17/11/25

Sản phẩm sáng tạo NeosAI của Assembly Software đã được trao giải "Giải pháp Generative AI của năm" tại chương trình Giải thưởng đột phá của LegalTech.

Copyright © 2024 Generatived - All right Reserved.

Chia sẻ bài viết này:

Chia sẻ bài viết này:

Generatived AI Logo

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

  • Facebook
  • X

Hãy theo dõi chúng tôi

Ngôn ngữ

Tin tức mới nhất
GladCube bắt đầu phát triển AI đua ngựa tại Hoa Kỳ

GladCube bắt đầu phát triển AI đua ngựa tại Hoa Kỳ

0:00 17/11/25

Glad Cube (Chuo-ku, Osaka) đã bắt đầu phát triển "StableGenius", một dịch vụ dự đoán AI dành cho thị trường đua ngựa Hoa Kỳ, hợp tác với SPAIA, Inc.

GPT Invest ra mắt nền tảng giao dịch đa tài sản nâng cao

GPT Invest ra mắt nền tảng giao dịch đa tài sản nâng cao

0:00 17/11/25

GPT Invest đã nổi lên như một công ty đáng chú ý trong lĩnh vực công nghệ giao dịch bằng cách cung cấp cơ sở hạ tầng tiên tiến đáp ứng nhu cầu của cả nhà đầu tư tổ chức và cá nhân.

Havana ra mắt nền tảng AI để tuyển sinh sinh viên

Havana ra mắt nền tảng AI để tuyển sinh sinh viên

0:00 17/11/25

Havana đã ra mắt một nền tảng mới sử dụng AI nhằm mục đích hợp lý hóa nỗ lực tuyển sinh sinh viên cho các cơ sở giáo dục đại học.

NeosAI của AssemblyTech giành được Giải thưởng AI của LegalTech

NeosAI của AssemblyTech giành được Giải thưởng AI của LegalTech

0:00 17/11/25

Sản phẩm sáng tạo NeosAI của Assembly Software đã được trao giải "Giải pháp Generative AI của năm" tại chương trình Giải thưởng đột phá của LegalTech.

bottom of page