Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo
%20(1).webp)
NVIDIA hé lộ chi tiết về cơ sở hạ tầng cho Trí tuệ nhân tạo tác nhân (Agentic AI).
Generatived
0:00 8/5/26
NVIDIA đã phác thảo cách thức các tác vụ AI tạo sinh đang chuyển dịch từ tương tác chatbot tiêu chuẩn sang các hệ thống tác nhân tự động quản lý các công cụ, bộ nhớ và các tác nhân con, làm tăng mức tiêu thụ token và độ phức tạp của cơ sở hạ tầng.
Công ty cho biết các ứng dụng AI dựa trên tác nhân có thể tiêu thụ số lượng token nhiều hơn tới 15 lần so với các hệ thống trò chuyện truyền thống. Việc mở rộng cửa sổ ngữ cảnh, hành vi gọi công cụ và quy trình làm việc song song của các tác nhân phụ đang tạo ra những yêu cầu cao hơn về latency, dung lượng bộ nhớ và hiệu quả suy luận.
NVIDIA cũng nhấn mạnh chiến lược nền tảng Vera Rubin của mình, kết hợp các công nghệ mạng Vera Rubin NVL72, Groq 3 LPX, NVLink 6, BlueField-4 và Spectrum-X để hỗ trợ suy luận ngữ cảnh lớn và giảm chi phí phân bổ token cho các mô hình AI tiên tiến.
Bộ phần mềm bao gồm các công nghệ Dynamo, TRT-LLM WideEP, NVFP4 và Giải mã suy đoán nhằm mục đích cải thiện thông lượng và giảm latency cho các mô hình hỗn hợp chuyên gia nghìn tỷ tham số hoạt động với ngữ cảnh lớn tới 400.000 token.
Chia sẻ bài viết này:
Tin tức mới nhất
Microsoft chia sẻ các phương pháp đánh giá rủi ro doanh nghiệp.
0:00 1/5/26
Microsoft cho biết Phó Giám đốc An ninh Thông tin (CISO) Rico Mariani đã vạch ra các phương pháp chính để đánh giá rủi ro doanh nghiệp khi hoạt động đe dọa mạng gia tăng cùng
NVIDIA mở rộng hướng dẫn về kiến trúc nhà máy AI dành cho doanh nghiệp.
0:00 1/5/26
NVIDIA đã trình bày chi tiết Kiến trúc Tham chiếu Doanh nghiệp và cấu hình nhà máy AI được thiết kế để hỗ trợ triển khai hệ thống AI tác nhân và AI tạo sinh trong môi trường tại chỗ.
OpenAI mở rộng cơ sở hạ tầng AI Stargate trên toàn quốc.
0:00 1/5/26
OpenAI cho biết họ đã đẩy nhanh tiến độ phát triển sáng kiến cơ sở hạ tầng AI "Stargate", vượt qua các mục tiêu triển khai điện toán dài hạn sớm hơn dự kiến do nhu cầu về hệ thống AI
Copyright © 2024 Generatived - All right Reserved.
Chia sẻ bài viết này:
Chia sẻ bài viết này:
Danh mục
Tin tức
AI và luật/hệ thống/kinh tế/xã hội
Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.
Tin tức mới nhất
Microsoft chia sẻ các phương pháp đánh giá rủi ro doanh nghiệp.
0:00 1/5/26
Microsoft cho biết Phó Giám đốc An ninh Thông tin (CISO) Rico Mariani đã vạch ra các phương pháp chính để đánh giá rủi ro doanh nghiệp khi hoạt động đe dọa mạng gia tăng cùng
NVIDIA mở rộng hướng dẫn về kiến trúc nhà máy AI dành cho doanh nghiệp.
0:00 1/5/26
NVIDIA đã trình bày chi tiết Kiến trúc Tham chiếu Doanh nghiệp và cấu hình nhà máy AI được thiết kế để hỗ trợ triển khai hệ thống AI tác nhân và AI tạo sinh trong môi trường tại chỗ.
OpenAI mở rộng cơ sở hạ tầng AI Stargate trên toàn quốc.
0:00 1/5/26
OpenAI cho biết họ đã đẩy nhanh tiến độ phát triển sáng kiến cơ sở hạ tầng AI "Stargate", vượt qua các mục tiêu triển khai điện toán dài hạn sớm hơn dự kiến do nhu cầu về hệ thống AI

%20(1).webp)
%20(1).webp)
%20(1).webp)

