top of page

Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

logo.png

NVIDIA AI tạo ra mô hình năng lượng cho thế hệ hạt nhân GPU

Generatived

4:30 13/2/25

Để giải quyết thách thức tạo ra các hạt nhân chú ý GPU mà không cần lập trình rõ ràng, các kỹ sư NVIDIA đã tiến hành thử nghiệm với mô hình AI DeepSeek-R1 nguồn mở. Bằng cách tận dụng sức mạnh tính toán bổ sung trong giai đoạn suy luận, mô hình đã có thể tạo ra các hạt nhân, trong một số trường hợp, vượt trội hơn các hạt nhân do các kỹ sư giàu kinh nghiệm tạo ra. Phương pháp này, được gọi là mở rộng thời gian thử nghiệm, cải thiện hiệu suất AI bằng cách xem xét nhiều kết quả trước khi chọn kết quả hiệu quả nhất.

Khái niệm chú ý đã đóng vai trò quan trọng trong sự phát triển của các mô hình ngôn ngữ quy mô lớn (LLM), cho phép AI tập trung vào các phân đoạn dữ liệu có liên quan để nâng cao dự đoán và khám phá các mẫu ẩn. Tuy nhiên, độ phức tạp của các hoạt động chú ý tăng theo độ dài của chuỗi đầu vào, đòi hỏi các hạt nhân GPU được tối ưu hóa để đạt hiệu quả và tránh các vấn đề về thời gian chạy. Các kỹ sư thường kết hợp các biến thể chú ý khác nhau để giải quyết các tác vụ cụ thể, làm phức tạp thêm việc tạo ra các hạt nhân được tối ưu hóa này.

Để giải quyết những phức tạp này, các kỹ sư NVIDIA đã thiết kế một quy trình làm việc kết hợp mô hình DeepSeek-R1 với một công cụ xác thực chạy trên GPU NVIDIA H100. Được khởi tạo bằng lời nhắc thủ công, hệ thống vòng kín này tinh chỉnh mã GPU được tạo theo từng bước. Quá trình kéo dài 15 phút đã tạo ra các hạt nhân chính xác về mặt số cho tất cả các vấn đề Cấp độ 1 và 96% các vấn đề Cấp độ 2, theo chuẩn KernelBench của Đại học Stanford.

Kết quả từ các thí nghiệm của chúng tôi cho thấy việc tận dụng khả năng mở rộng thời gian thử nghiệm có thể cải thiện đáng kể việc tạo ra các hạt nhân GPU được tối ưu hóa. Khả năng tự động tạo ra các hạt nhân chú ý hiệu quả của mô hình DeepSeek-R1 cho thấy tiềm năng của lĩnh vực nghiên cứu mới này. Mặc dù cần nhiều công sức hơn để đạt được kết quả tốt một cách nhất quán trên nhiều vấn đề hơn, nhưng kết quả ban đầu rất hứa hẹn. Các bên quan tâm có thể tìm hiểu thêm tại dịch vụ vi mô DeepSeek-R1 NIM.

Chia sẻ bài viết này:

Tin tức mới nhất
AnyReach ra mắt nền tảng tối ưu hóa tìm kiếm bằng AI.

AnyReach ra mắt nền tảng tối ưu hóa tìm kiếm bằng AI.

0:00 15/5/26

AnyReach vừa công bố ra mắt “AnyLLMO”, một nền tảng cơ sở hạ tầng tập trung vào tối ưu hóa mô hình ngôn ngữ quy mô lớn cho môi trường tìm kiếm được hỗ trợ bởi trí tuệ nhân tạo.

Imacrea ra mắt gói AI cho Chuo

Imacrea ra mắt gói AI cho Chuo

0:00 15/5/26

Imacrea đã thông báo ra mắt gói vận hành “exaBase Generative AI for Municipalities” tại thành phố Chuo, Tokyo

Bajji ra mắt dịch vụ hệ thống AI gốc.

Bajji ra mắt dịch vụ hệ thống AI gốc.

0:00 15/5/26

Bajji vừa công bố ra mắt “PontWorks”, một dịch vụ phát triển hệ thống dựa trên trí tuệ nhân tạo (AI) theo hình thức đăng ký thuê bao dành cho các doanh nghiệp vừa và nhỏ.

GVA TECH hợp nhất các dịch vụ AI pháp lý.

GVA TECH hợp nhất các dịch vụ AI pháp lý.

0:00 15/5/26

GVA TECH thông báo rằng các dịch vụ AI tập trung vào luật sư của họ sẽ được hợp nhất dưới thương hiệu mới “Benpal”.

Copyright © 2024 Generatived - All right Reserved.

Chia sẻ bài viết này:

Chia sẻ bài viết này:

Generatived AI Logo

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

  • Facebook
  • X

Hãy theo dõi chúng tôi

Ngôn ngữ

Tin tức mới nhất
AnyReach ra mắt nền tảng tối ưu hóa tìm kiếm bằng AI.

AnyReach ra mắt nền tảng tối ưu hóa tìm kiếm bằng AI.

0:00 15/5/26

AnyReach vừa công bố ra mắt “AnyLLMO”, một nền tảng cơ sở hạ tầng tập trung vào tối ưu hóa mô hình ngôn ngữ quy mô lớn cho môi trường tìm kiếm được hỗ trợ bởi trí tuệ nhân tạo.

Imacrea ra mắt gói AI cho Chuo

Imacrea ra mắt gói AI cho Chuo

0:00 15/5/26

Imacrea đã thông báo ra mắt gói vận hành “exaBase Generative AI for Municipalities” tại thành phố Chuo, Tokyo

Bajji ra mắt dịch vụ hệ thống AI gốc.

Bajji ra mắt dịch vụ hệ thống AI gốc.

0:00 15/5/26

Bajji vừa công bố ra mắt “PontWorks”, một dịch vụ phát triển hệ thống dựa trên trí tuệ nhân tạo (AI) theo hình thức đăng ký thuê bao dành cho các doanh nghiệp vừa và nhỏ.

GVA TECH hợp nhất các dịch vụ AI pháp lý.

GVA TECH hợp nhất các dịch vụ AI pháp lý.

0:00 15/5/26

GVA TECH thông báo rằng các dịch vụ AI tập trung vào luật sư của họ sẽ được hợp nhất dưới thương hiệu mới “Benpal”.

bottom of page