Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

NVIDIA ra mắt Groq 3 LPX dành cho hệ thống AI tác nhân.

Generatived

0:00 18/3/26

NVIDIA vừa ra mắt Groq 3 LPX, một bộ tăng tốc suy luận quy mô rack mới được thiết kế riêng cho nhu cầu của các hệ thống tác nhân. LPX được thiết kế để hoạt động song song với NVIDIA Vera Rubin NVL72, cung cấp một công cụ chuyên dụng để tạo mã thông báo nhanh chóng, điều cần thiết cho các ứng dụng AI yêu cầu latency thấp. Mặt khác, Vera Rubin NVL72 tiếp tục đóng vai trò là giải pháp đa năng cho cả tác vụ huấn luyện và suy luận, có khả năng xử lý nhiều quy trình với thông lượng cao.

Sự hợp tác giữa Vera Rubin NVL72 và LPX đóng vai trò then chốt cho tương lai của trí tuệ nhân tạo dựa trên tác nhân (agentic AI), nơi tốc độ tương tác dự kiến sẽ đạt tới 1.000 token mỗi giây cho mỗi người dùng. Khả năng tăng tốc này cho phép các hệ thống AI tham gia vào quá trình suy luận, mô phỏng và phản hồi liên tục, mô phỏng sự hợp tác theo thời gian thực thay vì giao tiếp theo lượt. Khả năng phối hợp các nhóm tác nhân cũng nâng cao tiềm năng thực hiện các nhiệm vụ phức tạp, tương tự như cách xã hội loài người tận dụng trí tuệ tập thể.

Để đáp ứng các yêu cầu cao cấp của các hệ thống này, cần có một cơ sở hạ tầng mạnh mẽ có khả năng cung cấp cả thông lượng cao và latency thấp. Kiến trúc đa dạng kết hợp Vera Rubin NVL72 và LPX đáp ứng nhu cầu này bằng cách kết hợp hiệu năng của nhà máy AI quy mô lớn với khả năng tạo mã thông báo nhanh chóng cần thiết cho các hệ thống tác nhân hoạt động liên tục và các ứng dụng AI tiên tiến.

Hệ thống NVIDIA Groq 3 LPX được xây dựng dựa trên 256 bộ tăng tốc kết nối với nhau và nhấn mạnh vào khả năng thực thi xác định và băng thông SRAM trên chip cao. Thiết kế này đảm bảo rằng quá trình suy luận tương tác vẫn phản hồi nhanh nhạy ở các mức độ đồng thời và độ phức tạp của yêu cầu khác nhau. Khi được triển khai với Vera Rubin NVL72, LPX đặc biệt tăng tốc các phần nhạy cảm với độ trễ của vòng lặp giải mã, trong khi các GPU Rubin quản lý việc điền trước và chú ý giải mã, tạo ra một đường dẫn phục vụ không đồng nhất giúp tăng cường khả năng phản hồi tương tác mà không ảnh hưởng đến thông lượng của nhà máy AI.

Nguồn: Blog nhà phát triển NVIDIA

Chia sẻ bài viết này:

Tin tức mới nhất

Evri nâng cao dịch vụ chuyển phát bưu kiện với công nghệ AI Amazon.

0:00 18/3/26

Tập đoàn Evri chuẩn bị nâng cao dịch vụ giao nhận bưu kiện bằng cách tích hợp công nghệ trí tuệ nhân tạo (AI) từ Amazon Web Services.

đọc thêm

NVIDIA ra mắt Dynamo 1.0 để nâng cao hiệu năng AI.

0:00 18/3/26

NVIDIA vừa ra mắt Dynamo 1.0, một khung AI mới được thiết kế để nâng cao hiệu suất của các mô hình AI tạo sinh và suy luận trong môi trường phân tán.

đọc thêm

NVIDIA ra mắt Groq 3 LPX dành cho hệ thống AI tác nhân.

0:00 18/3/26

NVIDIA vừa ra mắt Groq 3 LPX, một bộ tăng tốc suy luận quy mô rack mới được thiết kế riêng cho nhu cầu của các hệ thống tác nhân.

đọc thêm

Microsoft mở rộng nền tảng AI với sự hợp tác cùng NVIDIA.

0:00 18/3/26

Microsoft vừa công bố mở rộng khả năng trí tuệ nhân tạo (AI) thông qua hợp tác với NVIDIA, nâng cấp nền tảng Microsoft Foundry để hỗ trợ triển khai và vận hành các tác nhân AI

đọc thêm

Chia sẻ bài viết này:

Danh mục

Trình nâng cao hình ảnh AI

Trình tạo mã AI

Quản lý tác vụ AI

Không có mã/mã thấp

Trình tạo thiết kế đồ họa AI

Trình tạo minh họa/nghệ thuật AI

Tất cả công cụ

Tin tức

AI và luật/hệ thống/kinh tế/xã hội

Các công ty/sản phẩm/công nghệ AI

AI công nghệ lớn

OpenAI/ChatGPT

AI thế hệ sáng tạo

AI thế hệ dựa trên văn bản

AI sáng tạo của Nhật Bản

Cơ bản về AI sáng tạo

Hướng dẫn ứng dụng AI cơ bản

Hồ sơ công ty

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng trang web

Công ty điều hành

Hãy theo dõi chúng tôi

Ngôn ngữ

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Hãy theo dõi chúng tôi

Ngôn ngữ

Danh mục

Tất cả công cụ

Quản lý tác vụ AI

Trình tạo thiết kế đồ họa AI

Không có mã/mã thấp

Trình tạo mã AI

Trình nâng cao hình ảnh AI

Trình tạo minh họa/nghệ thuật AI

AI và luật/hệ thống/kinh tế/xã hội

Các công ty/sản phẩm/công nghệ AI

AI công nghệ lớn

OpenAI/ChatGPT

AI thế hệ sáng tạo

AI thế hệ dựa trên văn bản

AI sáng tạo của Nhật Bản

Cơ bản về AI tạo ra

Hướng dẫn ứng dụng AI cơ bản

Tin tức

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng của trang web

Công ty điều hành

Hồ sơ công ty

Tin tức mới nhất

Evri nâng cao dịch vụ chuyển phát bưu kiện với công nghệ AI Amazon.

0:00 18/3/26

Tập đoàn Evri chuẩn bị nâng cao dịch vụ giao nhận bưu kiện bằng cách tích hợp công nghệ trí tuệ nhân tạo (AI) từ Amazon Web Services.

đọc thêm

NVIDIA ra mắt Dynamo 1.0 để nâng cao hiệu năng AI.

0:00 18/3/26

NVIDIA vừa ra mắt Dynamo 1.0, một khung AI mới được thiết kế để nâng cao hiệu suất của các mô hình AI tạo sinh và suy luận trong môi trường phân tán.

đọc thêm

NVIDIA ra mắt Groq 3 LPX dành cho hệ thống AI tác nhân.

0:00 18/3/26

NVIDIA vừa ra mắt Groq 3 LPX, một bộ tăng tốc suy luận quy mô rack mới được thiết kế riêng cho nhu cầu của các hệ thống tác nhân.

đọc thêm

Microsoft mở rộng nền tảng AI với sự hợp tác cùng NVIDIA.

0:00 18/3/26

Microsoft vừa công bố mở rộng khả năng trí tuệ nhân tạo (AI) thông qua hợp tác với NVIDIA, nâng cấp nền tảng Microsoft Foundry để hỗ trợ triển khai và vận hành các tác nhân AI

đọc thêm