top of page

Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

logo.png

NVIDIA công bố cập nhật phần mềm và mô hình DGX Spark.

Generatived

0:00 7/1/26

NVIDIA đã nâng cấp DGX Spark với Grace Blackwell, mang lại những cải tiến hiệu năng đáng kể trên nhiều tác vụ AI khác nhau. Những cải tiến phần mềm và sự tận tâm với các mối quan hệ đối tác đang thúc đẩy những tiến bộ trong suy luận, huấn luyện và quy trình làm việc sáng tạo. Tại CES 2026, NVIDIA đã công bố bản cập nhật phần mềm mới nhất cho DGX Spark. Bản cập nhật này, cùng với các bản cập nhật mô hình mới và thư viện mã nguồn mở, cải thiện hiệu năng cho cả DGX Spark và các hệ thống OEM tương thích.

DGX Spark được thiết kế để dễ dàng xử lý các mô hình lớn với bộ nhớ hợp nhất 128GB ở định dạng máy tính để bàn. Việc kết nối hai hệ thống cung cấp quyền truy cập vào 256GB bộ nhớ, tạo điều kiện thuận lợi cho việc vận hành cục bộ các mô hình lớn hơn. Hệ thống sử dụng mạng ConnectX-7 để kết nối tốc độ cao, độ trễ thấp. Nó cũng hỗ trợ định dạng dữ liệu NVFP4 của NVIDIA, giảm mức sử dụng bộ nhớ và cải thiện thông lượng. Ví dụ, chạy mô hình Qwen-235B với độ chính xác NVFP4 mang lại tốc độ nhanh hơn tới 2,6 lần so với việc thực thi FP8 trên cấu hình DGX Spark kép.

Sự hợp tác với cộng đồng mã nguồn mở đã thúc đẩy hơn nữa những cải tiến hiệu năng của NVIDIA. Bản cập nhật cho Llama.cpp cải thiện hiệu năng của các mô hình Mixture-of-Experts trên DGX Spark lên 35%. Cải tiến này mang lại lợi ích cho nhiều quy trình làm việc mã nguồn mở. Ngoài ra, người tạo nội dung có thể tận dụng khả năng máy tính để bàn mạnh mẽ của DGX Spark để giảm tải các tác vụ AI và duy trì khả năng phản hồi của hệ thống trong quá trình tạo nội dung. Dung lượng bộ nhớ lớn của nền tảng cho phép làm việc với các mô hình lớn mà không ảnh hưởng đến chất lượng, và các mô hình khuếch tán chính sử dụng NVFP4 để tối đa hóa hiệu năng đồng thời giảm thiểu mức sử dụng bộ nhớ.

NVIDIA đã tích hợp DGX Spark vào chương trình Hệ thống được chứng nhận của NVIDIA, đảm bảo hiệu năng đã được kiểm chứng trên nhiều loại khối lượng công việc khác nhau. Việc đưa DGX Spark và các hệ thống OEM dựa trên GB10 vào chương trình này chứng minh độ tin cậy của nó trong phát triển AI và tạo nội dung. Để giúp các nhà phát triển bắt đầu nhanh chóng, NVIDIA đã phát hành một bộ tài liệu hướng dẫn DGX Spark mới, cung cấp các quy trình làm việc và hướng dẫn thực tiễn. Ngoài ra, với NVIDIA Brev, người dùng có thể truy cập DGX Spark từ xa và triển khai nó trong môi trường kết hợp cục bộ-đám mây. Sự hợp tác của NVIDIA với Hugging Face cho phép tạo ra một trợ lý AI cá nhân, thể hiện tiềm năng của DGX Spark trong xử lý dữ liệu riêng tư.

Chia sẻ bài viết này:

Tin tức mới nhất
Chủ tịch M-Mart công bố ứng dụng thực tiễn của trí tuệ nhân tạo (AI).

Chủ tịch M-Mart công bố ứng dụng thực tiễn của trí tuệ nhân tạo (AI).

0:00 14/1/26

Ngày 7 tháng 1, M Mart (Shinjuku-ku, Tokyo) thông báo về việc phát triển và ứng dụng thực tiễn "Trí tuệ nhân tạo Chủ tịch (Phiên bản nội bộ)"

Hỗ trợ phương pháp phát triển đầu tiên trên thực địa FYBE

Hỗ trợ phương pháp phát triển đầu tiên trên thực địa FYBE

0:00 14/1/26

FYBE (Minato-ku, Tokyo) chủ trương phương pháp phát triển "ưu tiên hiện trường" để giải quyết các thách thức tại chỗ trong các doanh nghiệp mới và ứng dụng AI.

Nghiên cứu tối ưu hóa chi phí Generative AI của Largegate

Nghiên cứu tối ưu hóa chi phí Generative AI của Largegate

0:00 14/1/26

Công ty Largegate (Tokyo) đã tiến hành "Khảo sát về chi phí và tối ưu hóa Generative AI " với sự tham gia của 550 nhà quản lý doanh nghiệp sử dụng Generative AI .

Hệ thống kế toán AI của FocusFirstAdvisors vừa được công bố.

Hệ thống kế toán AI của FocusFirstAdvisors vừa được công bố.

0:00 14/1/26

FocusFirstAdvisors (quận Shibuya, Tokyo) đã công bố hệ thống kế toán AI mua một lần duy nhất mang thương hiệu "AI Flow Digital Transformation

Copyright © 2024 Generatived - All right Reserved.

Chia sẻ bài viết này:

Chia sẻ bài viết này:

Generatived AI Logo

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

  • Facebook
  • X

Hãy theo dõi chúng tôi

Ngôn ngữ

Tin tức mới nhất
Chủ tịch M-Mart công bố ứng dụng thực tiễn của trí tuệ nhân tạo (AI).

Chủ tịch M-Mart công bố ứng dụng thực tiễn của trí tuệ nhân tạo (AI).

0:00 14/1/26

Ngày 7 tháng 1, M Mart (Shinjuku-ku, Tokyo) thông báo về việc phát triển và ứng dụng thực tiễn "Trí tuệ nhân tạo Chủ tịch (Phiên bản nội bộ)"

Hỗ trợ phương pháp phát triển đầu tiên trên thực địa FYBE

Hỗ trợ phương pháp phát triển đầu tiên trên thực địa FYBE

0:00 14/1/26

FYBE (Minato-ku, Tokyo) chủ trương phương pháp phát triển "ưu tiên hiện trường" để giải quyết các thách thức tại chỗ trong các doanh nghiệp mới và ứng dụng AI.

Nghiên cứu tối ưu hóa chi phí Generative AI của Largegate

Nghiên cứu tối ưu hóa chi phí Generative AI của Largegate

0:00 14/1/26

Công ty Largegate (Tokyo) đã tiến hành "Khảo sát về chi phí và tối ưu hóa Generative AI " với sự tham gia của 550 nhà quản lý doanh nghiệp sử dụng Generative AI .

Hệ thống kế toán AI của FocusFirstAdvisors vừa được công bố.

Hệ thống kế toán AI của FocusFirstAdvisors vừa được công bố.

0:00 14/1/26

FocusFirstAdvisors (quận Shibuya, Tokyo) đã công bố hệ thống kế toán AI mua một lần duy nhất mang thương hiệu "AI Flow Digital Transformation

bottom of page