Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

NVIDIA công bố hiệu suất nâng cao của các mô hình AI Llama 4

Generatived

0:00 7/4/25

Các phiên bản mới nhất của mô hình AI Llama, Llama 4 Scout và Llama 4 Maverick, đã được công bố, với những cải tiến đáng kể về hiệu suất. Được hỗ trợ bởi phần mềm nguồn mở của NVIDIA, các mô hình này có thể xử lý hơn 40.000 mã thông báo đầu ra mỗi giây khi chạy trên GPU NVIDIA Blackwell B200. Hiện tại, chúng có sẵn để thử nghiệm dưới dạng dịch vụ vi mô thông qua NVIDIA NIM, cung cấp cái nhìn thoáng qua về tiềm năng của chúng trong nhiều ứng dụng khác nhau.

Những tiến bộ trong Llama 4 bao gồm khả năng đa phương thức và đa ngôn ngữ gốc với kiến trúc chuyên gia hỗn hợp. Với 109 tỷ tham số và 16 chuyên gia, mô hình Llama 4 Scout đặc biệt phù hợp để xử lý các tác vụ như tóm tắt nhiều tài liệu và phân tích hoạt động của người dùng mở rộng. Trong khi đó, với 400 tỷ tham số và 128 chuyên gia, mô hình Llama 4 Maverick vượt trội về khả năng hiểu hình ảnh và văn bản hiệu suất cao.

Cả hai mô hình đều được tinh chỉnh cho NVIDIA TensorRT-LLM, một thư viện nguồn mở được thiết kế để cải thiện hiệu suất suy luận cho các mô hình ngôn ngữ lớn trên GPU NVIDIA. Tối ưu hóa này mang lại thông lượng đáng kinh ngạc trên GPU Blackwell B200, với Llama 4 Scout đạt hơn 40.000 mã thông báo mỗi giây và Llama 4 Maverick đạt hơn 30.000 mã thông báo mỗi giây.

Sự hợp tác của NVIDIA với Meta tiếp tục thúc đẩy sự phát triển của các mô hình mở, thúc đẩy tính minh bạch của AI và cho phép nhiều người dùng đóng góp vào tính an toàn và khả năng phục hồi của AI. Ngoài ra, khuôn khổ NeMo của NVIDIA giúp tinh chỉnh các mô hình Llama dễ dàng hơn với dữ liệu doanh nghiệp và hợp lý hóa quy trình điều chỉnh các mô hình này cho các ứng dụng AI. Để đơn giản hóa việc triển khai, NVIDIA NIM đóng gói các mô hình Llama 4 dưới dạng các dịch vụ vi mô, đảm bảo tích hợp dễ dàng vào cơ sở hạ tầng được tăng tốc bằng GPU trong khi vẫn duy trì quyền riêng tư và bảo mật dữ liệu.

Nguồn: Blog nhà phát triển NVIDIA

Chia sẻ bài viết này:

Tin tức mới nhất

Nền tảng Mavericks NoLang mở rộng với bốn ngôn ngữ Đông Âu.

0:00 6/7/26

Mavericks thông báo rằng dịch vụ tạo video bằng trí tuệ nhân tạo (AI) NoLang của họ hiện đã hỗ trợ tiếng Croatia, Bulgaria, Ukraina và Hy Lạp.

đọc thêm

josanshi ra mắt nền tảng tiếp thị chuyên nghiệp dành cho ngành chăm sóc sức khỏe Coepo.

0:00 6/7/26

Josanshi vừa chính thức ra mắt Coepo, một nền tảng kết nối các chuyên gia chăm sóc sức khỏe với các công ty phát triển sản phẩm chăm sóc bà mẹ và trẻ em.

đọc thêm

Các khóa học AI của Tech Mentor giúp bạn đạt được chứng chỉ đào tạo của chính phủ.

0:00 6/7/26

Thông báo cho biết hai chương trình liên quan đến Trí tuệ Nhân tạo của Tech Mentor sẽ được chứng nhận theo chương trình Giáo dục

đọc thêm

iFLYTEK ra mắt nền tảng AI mở khu vực Trung Á.

0:00 6/7/26

Trong một sự kiện tại Tashkent, Uzbekistan, iFLYTEK đã ra mắt Nền tảng Mở iFLYTEK Trung Á, đánh dấu sự mở rộng chính thức của công ty vào thị trường Trung Á.

đọc thêm

Chia sẻ bài viết này:

Danh mục

Trình nâng cao hình ảnh AI

Trình tạo mã AI

Quản lý tác vụ AI

Không có mã/mã thấp

Trình tạo thiết kế đồ họa AI

Trình tạo minh họa/nghệ thuật AI

Tất cả công cụ

Tin tức

AI và luật/hệ thống/kinh tế/xã hội

Các công ty/sản phẩm/công nghệ AI

AI công nghệ lớn

OpenAI/ChatGPT

AI thế hệ sáng tạo

AI thế hệ dựa trên văn bản

AI sáng tạo của Nhật Bản

Cơ bản về AI sáng tạo

Hướng dẫn ứng dụng AI cơ bản

Hồ sơ công ty

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng trang web

Công ty điều hành

Hãy theo dõi chúng tôi

Ngôn ngữ

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Hãy theo dõi chúng tôi

Ngôn ngữ

Danh mục

Tất cả công cụ

Quản lý tác vụ AI

Trình tạo thiết kế đồ họa AI

Không có mã/mã thấp

Trình tạo mã AI

Trình nâng cao hình ảnh AI

Trình tạo minh họa/nghệ thuật AI

AI và luật/hệ thống/kinh tế/xã hội

Các công ty/sản phẩm/công nghệ AI

AI công nghệ lớn

OpenAI/ChatGPT

AI thế hệ sáng tạo

AI thế hệ dựa trên văn bản

AI sáng tạo của Nhật Bản

Cơ bản về AI tạo ra

Hướng dẫn ứng dụng AI cơ bản

Tin tức

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng của trang web

Công ty điều hành

Hồ sơ công ty

Tin tức mới nhất

Nền tảng Mavericks NoLang mở rộng với bốn ngôn ngữ Đông Âu.

0:00 6/7/26

Mavericks thông báo rằng dịch vụ tạo video bằng trí tuệ nhân tạo (AI) NoLang của họ hiện đã hỗ trợ tiếng Croatia, Bulgaria, Ukraina và Hy Lạp.

đọc thêm

josanshi ra mắt nền tảng tiếp thị chuyên nghiệp dành cho ngành chăm sóc sức khỏe Coepo.

0:00 6/7/26

Josanshi vừa chính thức ra mắt Coepo, một nền tảng kết nối các chuyên gia chăm sóc sức khỏe với các công ty phát triển sản phẩm chăm sóc bà mẹ và trẻ em.

đọc thêm

Các khóa học AI của Tech Mentor giúp bạn đạt được chứng chỉ đào tạo của chính phủ.

0:00 6/7/26

Thông báo cho biết hai chương trình liên quan đến Trí tuệ Nhân tạo của Tech Mentor sẽ được chứng nhận theo chương trình Giáo dục

đọc thêm

iFLYTEK ra mắt nền tảng AI mở khu vực Trung Á.

0:00 6/7/26

Trong một sự kiện tại Tashkent, Uzbekistan, iFLYTEK đã ra mắt Nền tảng Mở iFLYTEK Trung Á, đánh dấu sự mở rộng chính thức của công ty vào thị trường Trung Á.

đọc thêm