top of page

Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

logo.png

NVIDIA ra mắt Groq 3 LPX dành cho hệ thống AI tác nhân.

Generatived

0:00 18/3/26

NVIDIA vừa ra mắt Groq 3 LPX, một bộ tăng tốc suy luận quy mô rack mới được thiết kế riêng cho nhu cầu của các hệ thống tác nhân. LPX được thiết kế để hoạt động song song với NVIDIA Vera Rubin NVL72, cung cấp một công cụ chuyên dụng để tạo mã thông báo nhanh chóng, điều cần thiết cho các ứng dụng AI yêu cầu latency thấp. Mặt khác, Vera Rubin NVL72 tiếp tục đóng vai trò là giải pháp đa năng cho cả tác vụ huấn luyện và suy luận, có khả năng xử lý nhiều quy trình với thông lượng cao.

Sự hợp tác giữa Vera Rubin NVL72 và LPX đóng vai trò then chốt cho tương lai của trí tuệ nhân tạo dựa trên tác nhân (agentic AI), nơi tốc độ tương tác dự kiến ​​sẽ đạt tới 1.000 token mỗi giây cho mỗi người dùng. Khả năng tăng tốc này cho phép các hệ thống AI tham gia vào quá trình suy luận, mô phỏng và phản hồi liên tục, mô phỏng sự hợp tác theo thời gian thực thay vì giao tiếp theo lượt. Khả năng phối hợp các nhóm tác nhân cũng nâng cao tiềm năng thực hiện các nhiệm vụ phức tạp, tương tự như cách xã hội loài người tận dụng trí tuệ tập thể.

Để đáp ứng các yêu cầu cao cấp của các hệ thống này, cần có một cơ sở hạ tầng mạnh mẽ có khả năng cung cấp cả thông lượng cao và latency thấp. Kiến trúc đa dạng kết hợp Vera Rubin NVL72 và LPX đáp ứng nhu cầu này bằng cách kết hợp hiệu năng của nhà máy AI quy mô lớn với khả năng tạo mã thông báo nhanh chóng cần thiết cho các hệ thống tác nhân hoạt động liên tục và các ứng dụng AI tiên tiến.

Hệ thống NVIDIA Groq 3 LPX được xây dựng dựa trên 256 bộ tăng tốc kết nối với nhau và nhấn mạnh vào khả năng thực thi xác định và băng thông SRAM trên chip cao. Thiết kế này đảm bảo rằng quá trình suy luận tương tác vẫn phản hồi nhanh nhạy ở các mức độ đồng thời và độ phức tạp của yêu cầu khác nhau. Khi được triển khai với Vera Rubin NVL72, LPX đặc biệt tăng tốc các phần nhạy cảm với độ trễ của vòng lặp giải mã, trong khi các GPU Rubin quản lý việc điền trước và chú ý giải mã, tạo ra một đường dẫn phục vụ không đồng nhất giúp tăng cường khả năng phản hồi tương tác mà không ảnh hưởng đến thông lượng của nhà máy AI.

Chia sẻ bài viết này:

Tin tức mới nhất
Dịch vụ huấn luyện nhập vai bằng AI của Reflect đã được công bố.

Dịch vụ huấn luyện nhập vai bằng AI của Reflect đã được công bố.

0:00 18/3/26

Công ty Reflect (quận Shibuya, Tokyo) đã ra mắt dịch vụ đào tạo nhập vai bằng trí tuệ nhân tạo, "Gói Nhập vai AI", vào ngày 17 tháng 3.

Phiên bản Beta c��ủa FeedForce AI Search MCP hiện đã có sẵn.

Phiên bản Beta của FeedForce AI Search MCP hiện đã có sẵn.

0:00 18/3/26

Feedforce (Minato-ku, Tokyo) đã ra mắt phiên bản beta của chức năng máy chủ MCP cho "Answer IO", một công cụ trực quan hóa điểm số thương hiệu từ tìm kiếm AI.

Baby Calendar ra mắt dịch vụ tư vấn chuyên gia dựa trên trí tuệ nhân tạo.

Baby Calendar ra mắt dịch vụ tư vấn chuyên gia dựa trên trí tuệ nhân tạo.

0:00 18/3/26

Ứng dụng Lịch Sinh Con (Baby Calendar, Shibuya-ku, Tokyo) vừa ra mắt tính năng mới "Trợ lý Tư vấn Chuyên gia AI" cho ứng dụng thông tin về thai kỳ

Nile AI Partners ra mắt chương trình hỗ trợ.

Nile AI Partners ra mắt chương trình hỗ trợ.

0:00 18/3/26

Nyle (Shinagawa-ku, Tokyo) đã ra mắt "Nyle AI Partners", một dịch vụ cung cấp nhân tài AI theo dự án để hỗ trợ các công ty trong việc sử dụng AI, Digital Transformation(Digital Transformation)

Copyright © 2024 Generatived - All right Reserved.

Chia sẻ bài viết này:

Chia sẻ bài viết này:

Generatived AI Logo

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

  • Facebook
  • X

Hãy theo dõi chúng tôi

Ngôn ngữ

Tin tức mới nhất
Dịch vụ huấn luyện nhập vai bằng AI của Reflect đã được công bố.

Dịch vụ huấn luyện nhập vai bằng AI của Reflect đã được công bố.

0:00 18/3/26

Công ty Reflect (quận Shibuya, Tokyo) đã ra mắt dịch vụ đào tạo nhập vai bằng trí tuệ nhân tạo, "Gói Nhập vai AI", vào ngày 17 tháng 3.

Phiên bản Beta của FeedForce AI Search MCP hiện đã có sẵn.

Phiên bản Beta của FeedForce AI Search MCP hiện đã có sẵn.

0:00 18/3/26

Feedforce (Minato-ku, Tokyo) đã ra mắt phiên bản beta của chức năng máy chủ MCP cho "Answer IO", một công cụ trực quan hóa điểm số thương hiệu từ tìm kiếm AI.

Baby Calendar ra mắt dịch vụ tư vấn chuyên gia dựa trên trí tuệ nhân tạo.

Baby Calendar ra mắt dịch vụ tư vấn chuyên gia dựa trên trí tuệ nhân tạo.

0:00 18/3/26

Ứng dụng Lịch Sinh Con (Baby Calendar, Shibuya-ku, Tokyo) vừa ra mắt tính năng mới "Trợ lý Tư vấn Chuyên gia AI" cho ứng dụng thông tin về thai kỳ

Nile AI Partners ra mắt chương trình hỗ trợ.

Nile AI Partners ra mắt chương trình hỗ trợ.

0:00 18/3/26

Nyle (Shinagawa-ku, Tokyo) đã ra mắt "Nyle AI Partners", một dịch vụ cung cấp nhân tài AI theo dự án để hỗ trợ các công ty trong việc sử dụng AI, Digital Transformation(Digital Transformation)

bottom of page