top of page

Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

logo.png

NVIDIA AIBlueprint cung cấp năng lượng cho các đường ống tìm kiếm có khả năng mở rộng

Generatived

5:00 31/1/25

NVIDIA đã công bố AIBlueprint cho RAG được thiết kế để giúp các nhà phát triển xây dựng các đường ống tìm kiếm có thể tùy chỉnh và có thể mở rộng. Bản thiết kế đóng vai trò là công cụ nền tảng để tạo ra các ứng dụng cung cấp phản hồi theo ngữ cảnh bằng cách liên kết các mô hình ngôn ngữ quy mô lớn với dữ liệu doanh nghiệp mở rộng, với mục tiêu cải thiện quá trình ra quyết định và năng suất bằng cách cho phép đưa ra thông tin chi tiết có thể hành động dựa trên thông tin có liên quan.

AIBlueprint tự hào về khả năng tương thích với OpenAI API và hỗ trợ các tính năng như hội thoại nhiều lượt, thu thập nhiều lần, nhiều phiên và tìm kiếm nhiều ngôn ngữ. Nó cũng cung cấp khả năng lưu trữ dữ liệu được tối ưu hóa, lựa chọn NVIDIA Inference Manager (NIM) và các tùy chọn có thể định cấu hình điểm cuối, cũng như khả năng xếp hạng lại. Các nhà phát triển có thể sử dụng các bản thiết kế được cung cấp theo nguyên trạng hoặc tích hợp chúng với các bản thiết kế NVIDIA khác để tạo ra các ứng dụng phức tạp hơn như trợ lý dịch vụ khách hàng do AI điều khiển.

Khi triển khai bản thiết kế, yêu cầu phần cứng tối thiểu để tự lưu trữ các dịch vụ vi mô NIM là một hệ thống có năm GPU H100 hoặc A100. Bản thiết kế được thiết kế để chạy trên HĐH Ubuntu 22.04 và có thể triển khai bằng Docker hoặc Kubernetes. Nó kết hợp NeMo Retriever và Llama 3.1 70B Instruct NIM của NVIDIA, cũng như phần mềm của bên thứ ba như cơ sở dữ liệu LangChain và Milvus, và được hỗ trợ bởi NVIDIA cuVS.

NVIDIA nhấn mạnh tầm quan trọng của AI đáng tin cậy và khuyến khích các nhà phát triển tuân thủ các tiêu chuẩn đạo đức. Công ty đã thiết lập các chính sách để hỗ trợ phát triển nhiều ứng dụng AI. Các nhà phát triển được kỳ vọng sẽ làm việc với nhóm mô hình để đảm bảo compliance các yêu cầu của ngành và giảm thiểu khả năng sử dụng sai mục đích. Các mô hình có trong bản thiết kế được quản lý bởi NVIDIA AI Foundation Models Community License.

Chia sẻ bài viết này:

Tin tức mới nhất
Cerence AI ra mắt trợ lý hội thoại mới dành cho ngành ô tô.

Cerence AI ra mắt trợ lý hội thoại mới dành cho ngành ô tô.

0:00 15/12/25

Cerence AI đã mở rộng danh mục sản phẩm của mình với việc giới thiệu hai trợ lý AI đàm thoại mới nhằm cải thiện trải nghiệm khách hàng trong ngành công nghiệp ô tô.

Snowflake và AT&T Ventures đầu tư vào sự phát triển của Trí tuệ nhân tạo quan hệ

Snowflake và AT&T Ventures đầu tư vào sự phát triển của Trí tuệ nhân tạo quan hệ

0:00 15/12/25

SAN FRANCISCO – Snowflake Ventures và AT&T Ventures đã đầu tư 22,5 triệu đô la vào RelationalAI để thúc đẩy sự phát triển của hệ thống trí tuệ quyết định tiên tiến của công ty.

OpenAI phát hành GPT-5.2 trên nền tảng AI của NVIDIA.

OpenAI phát hành GPT-5.2 trên nền tảng AI của NVIDIA.

0:00 15/12/25

OpenAI vừa công bố GPT-5.2, được quảng cáo là dòng mô hình tiên tiến nhất dành cho công việc trí tuệ chuyên nghiệp.

Bộ công cụ phát triển AI NVIDIA Jetson Edge đã được phát hành.

Bộ công cụ phát triển AI NVIDIA Jetson Edge đã được phát hành.

0:00 15/12/25

NVIDIA Jetson đáp ứng nhu cầu ngày càng tăng về trí tuệ nhân tạo biên (edge ​​AI) và trí thông minh thời gian thực trong robot bằng các mô-đun tăng tốc GPU nhỏ gọn và bộ dụng cụ phát triển.

Copyright © 2024 Generatived - All right Reserved.

Chia sẻ bài viết này:

Chia sẻ bài viết này:

Generatived AI Logo

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

  • Facebook
  • X

Hãy theo dõi chúng tôi

Ngôn ngữ

Tin tức mới nhất
Cerence AI ra mắt trợ lý hội thoại mới dành cho ngành ô tô.

Cerence AI ra mắt trợ lý hội thoại mới dành cho ngành ô tô.

0:00 15/12/25

Cerence AI đã mở rộng danh mục sản phẩm của mình với việc giới thiệu hai trợ lý AI đàm thoại mới nhằm cải thiện trải nghiệm khách hàng trong ngành công nghiệp ô tô.

Snowflake và AT&T Ventures đầu tư vào sự phát triển của Trí tuệ nhân tạo quan hệ

Snowflake và AT&T Ventures đầu tư vào sự phát triển của Trí tuệ nhân tạo quan hệ

0:00 15/12/25

SAN FRANCISCO – Snowflake Ventures và AT&T Ventures đã đầu tư 22,5 triệu đô la vào RelationalAI để thúc đẩy sự phát triển của hệ thống trí tuệ quyết định tiên tiến của công ty.

OpenAI phát hành GPT-5.2 trên nền tảng AI của NVIDIA.

OpenAI phát hành GPT-5.2 trên nền tảng AI của NVIDIA.

0:00 15/12/25

OpenAI vừa công bố GPT-5.2, được quảng cáo là dòng mô hình tiên tiến nhất dành cho công việc trí tuệ chuyên nghiệp.

Bộ công cụ phát triển AI NVIDIA Jetson Edge đã được phát hành.

Bộ công cụ phát triển AI NVIDIA Jetson Edge đã được phát hành.

0:00 15/12/25

NVIDIA Jetson đáp ứng nhu cầu ngày càng tăng về trí tuệ nhân tạo biên (edge ​​AI) và trí thông minh thời gian thực trong robot bằng các mô-đun tăng tốc GPU nhỏ gọn và bộ dụng cụ phát triển.

bottom of page