top of page

Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

logo.png

Nền tảng NVIDIA Jetson Thor tăng cường hiệu suất Generative AI

Generatived

0:00 17/10/25

NVIDIA đã công bố những cải tiến hiệu suất đáng kể cho nền tảng Jetson AGX Thor, tăng thông Generative AI sinh lên đến 7 lần kể từ khi ra mắt. Những nỗ lực tối ưu hóa phần mềm của NVIDIA đã dẫn đến những cải tiến này, mang lại lợi ích cho các nhà phát triển đang làm việc với các mô hình như Llama và DeepSeek. NVIDIA thường cung cấp hỗ trợ cho các mô hình AI mới chỉ vài ngày sau khi phát hành, cho phép các nhà phát triển nhanh chóng tích hợp các công nghệ mới nhất vào dự án của họ.

Nền tảng Jetson Thor cũng tích hợp hỗ trợ cho các định dạng lượng tử hóa hàng đầu, bao gồm NVFP4 từ kiến ​​trúc GPU NVIDIA Blackwell. Khả năng bổ sung này, kết hợp với các kỹ thuật như giải mã suy đoán, giúp tối ưu hóa hơn nữa suy luận AI, đặc biệt là trong các ứng dụng điện toán biên. Bộ chứa vLLM mới được phát hành cho thấy hiệu suất cải thiện tới 3,5 lần so với các mô hình hiện có, thể hiện cam kết của NVIDIA trong việc nâng cao hệ sinh thái phần mềm của mình.

Nền tảng Jetson Thor của NVIDIA hiện hỗ trợ giải mã suy đoán cho Eagle 3 trong các container vLLM, cải thiện đáng kể tốc độ của các mô hình Generative AI . Ví dụ, mô hình Llama 3.3 70B với giải mã suy đoán đạt tốc độ đầu ra 88,62 token mỗi giây, cải thiện đáng kể hiệu suất so với số liệu phát hành ban đầu, thể hiện cam kết của NVIDIA trong việc cung cấp cho các nhà phát triển các công cụ mạnh mẽ để tăng tốc khối lượng công việc AI tại biên.

Hỗ trợ ngay từ ngày đầu cho các mô hình AI tạo sinh mới nhất trên nền tảng Jetson Thor cho phép các nhà phát triển tiếp cận ngay lập tức với công nghệ tiên tiến. Phương pháp lượng tử hóa và giải mã suy đoán của NVIDIA hướng dẫn các nhà phát triển tối đa hóa hiệu suất AI tạo sinh trên nền tảng. Với việc phát hành một container vLLM độc lập với các bản cập nhật hàng tháng, NVIDIA đơn giản hóa quy trình tối ưu hóa và đánh giá chuẩn các mô hình AI cho các nhà phát triển, củng cố vai trò của mình trong việc thúc đẩy công nghệ AI tại các vùng biên.

Chia sẻ bài viết này:

Tin tức mới nhất
Phiên bản mới của máy chủ AI hiệu suất cao Iole

Phiên bản mới của máy chủ AI hiệu suất cao Iole

0:00 3/12/25

Iole (Chuo-ku, Tokyo) đã hợp tác với Digital Dynamic (Minato-ku, Tokyo) để công bố ra mắt máy chủ hiệu năng cao mới.

Hỗ trợ thu hút khách hàng địa phương bằng AI của Webcocor

Hỗ trợ thu hút khách hàng địa phương bằng AI của Webcocor

0:00 3/12/25

Webcocol (Thành phố Fukuoka) đã ra mắt "Tư vấn LLMO thống trị địa phương" hỗ trợ "Tổng quan về AI", "ChatGPT" và "Gemini" của Google.

Máy chủ AI mới của Digital Dynamic được công bố

Máy chủ AI mới của Digital Dynamic được công bố

0:00 3/12/25

Digital Dynamic (Minato-ku, Tokyo) thông báo rằng họ sẽ bắt đầu bán máy chủ hiệu suất cao được trang bị NVIDIA RTX PRO 6000 Blackwell Server Edition

Nâng cao bảo mật AI của EpicAI Nhật Bản

Nâng cao bảo mật AI của EpicAI Nhật Bản

0:00 3/12/25

EpicAI vừa công bố một sáng kiến ​​mới nhằm cải thiện tính bảo mật của Trí tuệ Generative AI).

Copyright © 2024 Generatived - All right Reserved.

Chia sẻ bài viết này:

Chia sẻ bài viết này:

Generatived AI Logo

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

  • Facebook
  • X

Hãy theo dõi chúng tôi

Ngôn ngữ

Tin tức mới nhất
Phiên bản mới của máy chủ AI hiệu suất cao Iole

Phiên bản mới của máy chủ AI hiệu suất cao Iole

0:00 3/12/25

Iole (Chuo-ku, Tokyo) đã hợp tác với Digital Dynamic (Minato-ku, Tokyo) để công bố ra mắt máy chủ hiệu năng cao mới.

Hỗ trợ thu hút khách hàng địa phương bằng AI của Webcocor

Hỗ trợ thu hút khách hàng địa phương bằng AI của Webcocor

0:00 3/12/25

Webcocol (Thành phố Fukuoka) đã ra mắt "Tư vấn LLMO thống trị địa phương" hỗ trợ "Tổng quan về AI", "ChatGPT" và "Gemini" của Google.

Máy chủ AI mới của Digital Dynamic được công bố

Máy chủ AI mới của Digital Dynamic được công bố

0:00 3/12/25

Digital Dynamic (Minato-ku, Tokyo) thông báo rằng họ sẽ bắt đầu bán máy chủ hiệu suất cao được trang bị NVIDIA RTX PRO 6000 Blackwell Server Edition

Nâng cao bảo mật AI của EpicAI Nhật Bản

Nâng cao bảo mật AI của EpicAI Nhật Bản

0:00 3/12/25

EpicAI vừa công bố một sáng kiến ​​mới nhằm cải thiện tính bảo mật của Trí tuệ Generative AI).

bottom of page