top of page

Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

logo.png

NVIDIA ra mắt Groq 3 LPX dành cho hệ thống AI tác nhân.

Generatived

0:00 18/3/26

NVIDIA vừa ra mắt Groq 3 LPX, một bộ tăng tốc suy luận quy mô rack mới được thiết kế riêng cho nhu cầu của các hệ thống tác nhân. LPX được thiết kế để hoạt động song song với NVIDIA Vera Rubin NVL72, cung cấp một công cụ chuyên dụng để tạo mã thông báo nhanh chóng, điều cần thiết cho các ứng dụng AI yêu cầu latency thấp. Mặt khác, Vera Rubin NVL72 tiếp tục đóng vai trò là giải pháp đa năng cho cả tác vụ huấn luyện và suy luận, có khả năng xử lý nhiều quy trình với thông lượng cao.

Sự hợp tác giữa Vera Rubin NVL72 và LPX đóng vai trò then chốt cho tương lai của trí tuệ nhân tạo dựa trên tác nhân (agentic AI), nơi tốc độ tương tác dự kiến ​​sẽ đạt tới 1.000 token mỗi giây cho mỗi người dùng. Khả năng tăng tốc này cho phép các hệ thống AI tham gia vào quá trình suy luận, mô phỏng và phản hồi liên tục, mô phỏng sự hợp tác theo thời gian thực thay vì giao tiếp theo lượt. Khả năng phối hợp các nhóm tác nhân cũng nâng cao tiềm năng thực hiện các nhiệm vụ phức tạp, tương tự như cách xã hội loài người tận dụng trí tuệ tập thể.

Để đáp ứng các yêu cầu cao cấp của các hệ thống này, cần có một cơ sở hạ tầng mạnh mẽ có khả năng cung cấp cả thông lượng cao và latency thấp. Kiến trúc đa dạng kết hợp Vera Rubin NVL72 và LPX đáp ứng nhu cầu này bằng cách kết hợp hiệu năng của nhà máy AI quy mô lớn với khả năng tạo mã thông báo nhanh chóng cần thiết cho các hệ thống tác nhân hoạt động liên tục và các ứng dụng AI tiên tiến.

Hệ thống NVIDIA Groq 3 LPX được xây dựng dựa trên 256 bộ tăng tốc kết nối với nhau và nhấn mạnh vào khả năng thực thi xác định và băng thông SRAM trên chip cao. Thiết kế này đảm bảo rằng quá trình suy luận tương tác vẫn phản hồi nhanh nhạy ở các mức độ đồng thời và độ phức tạp của yêu cầu khác nhau. Khi được triển khai với Vera Rubin NVL72, LPX đặc biệt tăng tốc các phần nhạy cảm với độ trễ của vòng lặp giải mã, trong khi các GPU Rubin quản lý việc điền trước và chú ý giải mã, tạo ra một đường dẫn phục vụ không đồng nhất giúp tăng cường khả năng phản hồi tương tác mà không ảnh hưởng đến thông lượng của nhà máy AI.

Chia sẻ bài viết này:

Tin tức mới nhất
Evri nâng cao dịch vụ chuyển phát bưu kiện với công nghệ AI Amazon.

Evri nâng cao dịch vụ chuyển phát bưu kiện với công nghệ AI Amazon.

0:00 18/3/26

Tập đoàn Evri chuẩn bị nâng cao dịch vụ giao nhận bưu kiện bằng cách tích hợp công nghệ trí tuệ nhân tạo (AI) từ Amazon Web Services.

NVIDIA ra mắt Dynamo 1.0 để nâng cao hiệu năng AI.

NVIDIA ra mắt Dynamo 1.0 để nâng cao hiệu năng AI.

0:00 18/3/26

NVIDIA vừa ra mắt Dynamo 1.0, một khung AI mới được thiết kế để nâng cao hiệu suất của các mô hình AI tạo sinh và suy luận trong môi trường phân tán.

NVIDIA ra mắt Groq 3 LPX dành cho hệ thống AI tác nhân.

NVIDIA ra mắt Groq 3 LPX dành cho hệ thống AI tác nhân.

0:00 18/3/26

NVIDIA vừa ra mắt Groq 3 LPX, một bộ tăng tốc suy luận quy mô rack mới được thiết kế riêng cho nhu cầu của các hệ thống tác nhân.

Microsoft mở rộng nền tảng AI với sự hợp tác cùng NVIDIA.

Microsoft mở rộng nền tảng AI với sự hợp tác cùng NVIDIA.

0:00 18/3/26

Microsoft vừa công bố mở rộng khả năng trí tuệ nhân tạo (AI) thông qua hợp tác với NVIDIA, nâng cấp nền tảng Microsoft Foundry để hỗ trợ triển khai và vận hành các tác nhân AI

Copyright © 2024 Generatived - All right Reserved.

Chia sẻ bài viết này:

Chia sẻ bài viết này:

Generatived AI Logo

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

  • Facebook
  • X

Hãy theo dõi chúng tôi

Ngôn ngữ

Tin tức mới nhất
Evri nâng cao dịch vụ chuyển phát bưu kiện với công nghệ AI Amazon.

Evri nâng cao dịch vụ chuyển phát bưu kiện với công nghệ AI Amazon.

0:00 18/3/26

Tập đoàn Evri chuẩn bị nâng cao dịch vụ giao nhận bưu kiện bằng cách tích hợp công nghệ trí tuệ nhân tạo (AI) từ Amazon Web Services.

NVIDIA ra mắt Dynamo 1.0 để nâng cao hiệu năng AI.

NVIDIA ra mắt Dynamo 1.0 để nâng cao hiệu năng AI.

0:00 18/3/26

NVIDIA vừa ra mắt Dynamo 1.0, một khung AI mới được thiết kế để nâng cao hiệu suất của các mô hình AI tạo sinh và suy luận trong môi trường phân tán.

NVIDIA ra mắt Groq 3 LPX dành cho hệ thống AI tác nhân.

NVIDIA ra mắt Groq 3 LPX dành cho hệ thống AI tác nhân.

0:00 18/3/26

NVIDIA vừa ra mắt Groq 3 LPX, một bộ tăng tốc suy luận quy mô rack mới được thiết kế riêng cho nhu cầu của các hệ thống tác nhân.

Microsoft mở rộng nền tảng AI với sự hợp tác cùng NVIDIA.

Microsoft mở rộng nền tảng AI với sự hợp tác cùng NVIDIA.

0:00 18/3/26

Microsoft vừa công bố mở rộng khả năng trí tuệ nhân tạo (AI) thông qua hợp tác với NVIDIA, nâng cấp nền tảng Microsoft Foundry để hỗ trợ triển khai và vận hành các tác nhân AI

bottom of page