Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

NVIDIA GB200 NVL72 cải thiện hiệu suất của các mô hình MoE

Generatived

0:00 5/12/25

10 mô hình mã nguồn mở thông minh hàng đầu, bao gồm Kimi K2 Thinking và DeepSeek-R1, sử dụng kiến trúc Hỗn hợp Chuyên gia (MoE), mô phỏng hoạt động kích hoạt vùng tác vụ cụ thể trong não người. Kiến trúc này cho phép tạo mã thông báo hiệu quả bằng cách chỉ kích hoạt các "chuyên gia" cần thiết cho mỗi mã thông báo AI, cải thiện hiệu suất mà không làm tăng đáng kể tải tính toán.

Hệ thống GB200 NVL72 của NVIDIA đóng vai trò quan trọng trong việc mở rộng quy mô các mô hình MoE, cung cấp các tối ưu hóa phần cứng và phần mềm giúp tăng cường hiệu suất và hiệu quả cao. Ví dụ, mô hình Kimi K2 Thinking đã đạt được hiệu suất cải thiện gấp 10 lần trên GB200 NVL72 so với các hệ thống trước đó, chứng minh tính hiệu quả của nền tảng suy luận toàn khối của NVIDIA trong việc tối ưu hóa kiến trúc MoE.

Mặc dù việc mở rộng quy mô các mô hình MoE thường gặp nhiều thách thức do tính phức tạp và quy mô lớn, hệ thống GB200 NVL72 của NVIDIA đã giải quyết những thách thức này thông qua thiết kế đồng bộ cực đại. Hệ thống này có 72 GPU được kết nối với nhau, cho phép xử lý song song ở cấp độ chuyên gia và giảm áp lực băng thông bộ nhớ. Thiết kế này cải thiện đáng kể khả năng giao tiếp giữa các chuyên gia và nâng cao hiệu suất tổng thể.

Các nhà cung cấp dịch vụ đám mây hàng đầu và đối tác đám mây của NVIDIA đã triển khai GB200 NVL72 và đang gặt hái những lợi ích trên phạm vi toàn cầu. Các công ty như CoreWeave và DeepL đang tận dụng hệ thống này để cải thiện hiệu suất và hiệu suất của các mô hình AI. Những tiến bộ của NVIDIA trong việc mở rộng các mô hình MoE đã thiết lập một tiêu chuẩn mới cho khả năng AI, hứa hẹn một tương lai mà các hệ thống AI vừa mạnh mẽ vừa hiệu quả.

Nguồn: Blog nhà phát triển NVIDIA

Chia sẻ bài viết này:

Tin tức mới nhất

Công ty xây dựng Toyo Construction tăng cường độ bền cho các công trường xây dựng bằng phân tích video AI.

0:00 13/2/26

Công ty xây dựng Toyo (quận Chiyoda, Tokyo) đã phát triển "Hệ thống phân tích video Generative AI (VL Monitor)" để tăng cường giám sát tại các công trường xây dựng.

đọc thêm

CyCraft Taiwan AI Security đã niêm yết trên sàn chứng khoán.

0:00 13/2/26

Công ty CyCraft (Đài Loan) chính thức niêm yết trên Sàn giao dịch Chứng khoán Đài Loan (TIB) vào ngày 5 tháng 2 năm 2026.

đọc thêm

Anytime AI ra mắt nền tảng pháp lý "Talk to Teddy".

0:00 13/2/26

Anytime AI vừa công bố sản phẩm cải tiến mới nhất của mình, Anytime AI 2.0. Sản phẩm mới này giới thiệu giao diện trò chuyện mới, "Talk to Teddy".

đọc thêm

Aurora Mobile hợp tác với Ants Asia để mở rộng lĩnh vực trí tuệ nhân tạo (AI).

0:00 13/2/26

Công ty Aurora Mobile Limited mới đây đã công bố hợp tác chiến lược với Ants Asia Limited, nhằm mục đích tăng cường các giải pháp trí tuệ nhân tạo (AI) trên phạm vi toàn cầu.

đọc thêm

Chia sẻ bài viết này:

Danh mục

Trình nâng cao hình ảnh AI

Trình tạo mã AI

Quản lý tác vụ AI

Không có mã/mã thấp

Trình tạo thiết kế đồ họa AI

Trình tạo minh họa/nghệ thuật AI

Tất cả công cụ

Tin tức

AI và luật/hệ thống/kinh tế/xã hội

Các công ty/sản phẩm/công nghệ AI

AI công nghệ lớn

OpenAI/ChatGPT

AI thế hệ sáng tạo

AI thế hệ dựa trên văn bản

AI sáng tạo của Nhật Bản

Cơ bản về AI sáng tạo

Hướng dẫn ứng dụng AI cơ bản

Hồ sơ công ty

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng trang web

Công ty điều hành

Hãy theo dõi chúng tôi

Ngôn ngữ

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Hãy theo dõi chúng tôi

Ngôn ngữ

Danh mục

Tất cả công cụ

Quản lý tác vụ AI

Trình tạo thiết kế đồ họa AI

Không có mã/mã thấp

Trình tạo mã AI

Trình nâng cao hình ảnh AI

Trình tạo minh họa/nghệ thuật AI

AI và luật/hệ thống/kinh tế/xã hội

Các công ty/sản phẩm/công nghệ AI

AI công nghệ lớn

OpenAI/ChatGPT

AI thế hệ sáng tạo

AI thế hệ dựa trên văn bản

AI sáng tạo của Nhật Bản

Cơ bản về AI tạo ra

Hướng dẫn ứng dụng AI cơ bản

Tin tức

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng của trang web

Công ty điều hành

Hồ sơ công ty

Tin tức mới nhất

Công ty xây dựng Toyo Construction tăng cường độ bền cho các công trường xây dựng bằng phân tích video AI.

0:00 13/2/26

Công ty xây dựng Toyo (quận Chiyoda, Tokyo) đã phát triển "Hệ thống phân tích video Generative AI (VL Monitor)" để tăng cường giám sát tại các công trường xây dựng.

đọc thêm

CyCraft Taiwan AI Security đã niêm yết trên sàn chứng khoán.

0:00 13/2/26

Công ty CyCraft (Đài Loan) chính thức niêm yết trên Sàn giao dịch Chứng khoán Đài Loan (TIB) vào ngày 5 tháng 2 năm 2026.

đọc thêm

Anytime AI ra mắt nền tảng pháp lý "Talk to Teddy".

0:00 13/2/26

Anytime AI vừa công bố sản phẩm cải tiến mới nhất của mình, Anytime AI 2.0. Sản phẩm mới này giới thiệu giao diện trò chuyện mới, "Talk to Teddy".

đọc thêm

Aurora Mobile hợp tác với Ants Asia để mở rộng lĩnh vực trí tuệ nhân tạo (AI).

0:00 13/2/26

Công ty Aurora Mobile Limited mới đây đã công bố hợp tác chiến lược với Ants Asia Limited, nhằm mục đích tăng cường các giải pháp trí tuệ nhân tạo (AI) trên phạm vi toàn cầu.

đọc thêm