Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

NVIDIA、GPU向けAI最適化技術を発表

Generatived

0:00 11/12/25

NVIDIA vừa công bố một loạt các kỹ thuật tối ưu hóa mô hình nhằm cải thiện hiệu quả và khả năng mở rộng của việc triển khai AI trên GPU. Các kỹ thuật này giải quyết sự phức tạp ngày càng tăng của các mô hình và kiến trúc AI, hướng đến mục tiêu cải thiện hiệu suất và tổng chi phí sở hữu (TCO) của các hệ thống AI. Một kỹ thuật đáng chú ý là lượng tử hóa sau huấn luyện (PTQ), giúp nén các mô hình hiện có thành định dạng có độ chính xác thấp hơn, ngay lập tức cải thiện latency và thông lượng.

Một kỹ thuật quan trọng khác là huấn luyện có nhận thức lượng tử hóa (QAT), bao gồm giai đoạn tinh chỉnh để điều chỉnh mô hình cho các lỗi độ chính xác thấp. Kỹ thuật này đặc biệt hiệu quả khi PTQ đơn thuần không thể đáp ứng yêu cầu về độ chính xác. Ngoài ra, NVIDIA đã phát triển phương pháp chưng cất có nhận thức lượng tử hóa (QAD), giúp cải thiện hơn nữa độ chính xác của mô hình bằng cách kết hợp tổn thất chưng cất vào quá trình huấn luyện và phù hợp với các tác vụ nhạy cảm với sự suy giảm hiệu suất sau khi lượng tử hóa.

NVIDIA cũng cung cấp giải mã suy đoán, một kỹ thuật giúp tăng tốc quá trình tạo bằng cách đề xuất trước nhiều token và xác thực chúng song song. Điều này giúp giảm latency mà không cần sửa đổi trọng số của mô hình. Cuối cùng, một chiến lược tối ưu hóa cấu trúc kết hợp giữa cắt tỉa và chưng cất kiến thức được trình bày. Chiến lược này không chỉ giảm kích thước mô hình mà còn huấn luyện mô hình đã được cắt tỉa để bắt chước hành vi của một mô hình "giáo viên" lớn hơn.

Các kỹ thuật tối ưu hóa này có thể áp dụng ngay lập tức và có thể giảm đáng kể chi phí, cải thiện hiệu suất và tăng tốc độ suy luận ở quy mô lớn cho các nhóm sử dụng GPU của NVIDIA. Đối với những người quan tâm đến việc triển khai các tối ưu hóa này, NVIDIA cung cấp mô tả kỹ thuật chi tiết, thông tin chi tiết về hiệu suất và hướng dẫn từng bước bằng Jupyter Notebook để hướng dẫn người dùng thực hiện quy trình.

Nguồn: Blog nhà phát triển NVIDIA

Chia sẻ bài viết này:

Tin tức mới nhất

Khảo sát nhận thức cộng đồng của R&G về các quy định công nghệ trí tuệ nhân tạo

0:00 27/1/26

Công ty R&G (thành phố Saitama) đã tiến hành khảo sát ý kiến công chúng về sự phát triển của công nghệ trí tuệ nhân tạo (AI) và xếp hạng kết quả.

đọc thêm

Số người dùng Hanji AI Tutor Knock vượt mốc 250.000.

0:00 27/1/26

Công ty Hanji (quận Shinagawa, Tokyo) thông báo rằng trợ lý ảo AI "Knock" của họ đã vượt mốc 250.000 người dùng nhân dịp kỷ niệm một năm ra mắt.

đọc thêm

AISmiley ra mắt bản đồ AI nhằm giải quyết tình trạng thiếu hụt lao động.

0:00 27/1/26

Ngày 26 tháng 1, AISmiley (quận Shibuya, Tokyo) đã phát hành "Bản đồ hỗn loạn AI vật lý" để giải quyết vấn đề thiếu hụt lao động.

đọc thêm

Khóa đào tạo quy trình làm việc AI hữu ích bắt đầu.

0:00 27/1/26

Công ty Useful (Chiyoda-ku, Tokyo) đã ra mắt chương trình "Đào tạo xây dựng quy trình làm việc bằng AI" nhằm mục đích nâng cao năng suất doanh nghiệp.

đọc thêm

Chia sẻ bài viết này:

Danh mục

Trình nâng cao hình ảnh AI

Trình tạo mã AI

Quản lý tác vụ AI

Không có mã/mã thấp

Trình tạo thiết kế đồ họa AI

Trình tạo minh họa/nghệ thuật AI

Tất cả công cụ

Tin tức

AI và luật/hệ thống/kinh tế/xã hội

Các công ty/sản phẩm/công nghệ AI

AI công nghệ lớn

OpenAI/ChatGPT

AI thế hệ sáng tạo

AI thế hệ dựa trên văn bản

AI sáng tạo của Nhật Bản

Cơ bản về AI sáng tạo

Hướng dẫn ứng dụng AI cơ bản

Hồ sơ công ty

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng trang web

Công ty điều hành

Hãy theo dõi chúng tôi

Ngôn ngữ

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Hãy theo dõi chúng tôi

Ngôn ngữ

Danh mục

Tất cả công cụ

Quản lý tác vụ AI

Trình tạo thiết kế đồ họa AI

Không có mã/mã thấp

Trình tạo mã AI

Trình nâng cao hình ảnh AI

Trình tạo minh họa/nghệ thuật AI

AI và luật/hệ thống/kinh tế/xã hội

Các công ty/sản phẩm/công nghệ AI

AI công nghệ lớn

OpenAI/ChatGPT

AI thế hệ sáng tạo

AI thế hệ dựa trên văn bản

AI sáng tạo của Nhật Bản

Cơ bản về AI tạo ra

Hướng dẫn ứng dụng AI cơ bản

Tin tức

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng của trang web

Công ty điều hành

Hồ sơ công ty

Tin tức mới nhất

Khảo sát nhận thức cộng đồng của R&G về các quy định công nghệ trí tuệ nhân tạo

0:00 27/1/26

Công ty R&G (thành phố Saitama) đã tiến hành khảo sát ý kiến công chúng về sự phát triển của công nghệ trí tuệ nhân tạo (AI) và xếp hạng kết quả.

đọc thêm

Số người dùng Hanji AI Tutor Knock vượt mốc 250.000.

0:00 27/1/26

Công ty Hanji (quận Shinagawa, Tokyo) thông báo rằng trợ lý ảo AI "Knock" của họ đã vượt mốc 250.000 người dùng nhân dịp kỷ niệm một năm ra mắt.

đọc thêm

AISmiley ra mắt bản đồ AI nhằm giải quyết tình trạng thiếu hụt lao động.

0:00 27/1/26

Ngày 26 tháng 1, AISmiley (quận Shibuya, Tokyo) đã phát hành "Bản đồ hỗn loạn AI vật lý" để giải quyết vấn đề thiếu hụt lao động.

đọc thêm

Khóa đào tạo quy trình làm việc AI hữu ích bắt đầu.

0:00 27/1/26

Công ty Useful (Chiyoda-ku, Tokyo) đã ra mắt chương trình "Đào tạo xây dựng quy trình làm việc bằng AI" nhằm mục đích nâng cao năng suất doanh nghiệp.

đọc thêm