top of page

Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

logo.png

NVIDIA NeMo-RL: Thư viện học tăng cường AI nguồn mở

Generatived

0:00 14/7/25

NVIDIA vừa công bố NeMo-RL, một thư viện hậu huấn luyện mã nguồn mở hỗ trợ phát triển AI tương tác thông qua học tăng cường (RL). Thư viện này là một thành phần của nền tảng NVIDIA NeMo và được thiết kế để hỗ trợ nhiều kích thước mô hình, từ nguyên mẫu GPU đơn đến các mô hình lớn với tối đa 32 tỷ tham số. NeMo-RL tự hào tích hợp sẵn với mô hình Hugging Face , đào tạo được tối ưu hóa, các thuật toán phổ biến như DPO và GRPO, cùng khả năng điều phối dựa trên Ray để quản lý các đường ống RL phức tạp.

Kiến trúc backend linh hoạt của thư viện là một tính năng đặc biệt, cho phép sử dụng nhiều backend huấn luyện và triển khai. Hiện tại, thư viện hỗ trợ mô hình Hugging Face với tính năng song song gốc của PyTorch, và dự kiến sẽ giới thiệu backend Megatron-Core cho các mô hình lớn hơn. Backend vLLM của NeMo-RL được sử dụng để tạo backend, với tiềm năng mở rộng sang các backend khác như NVIDIA TensorRT-LLM và SGLang. Thiết kế này cho phép dễ dàng mở rộng trên các cấu hình GPU khác nhau, mà không cần gắn các triển khai thuật toán cấp cao vào chi tiết của một backend cụ thể.

NeMo-RL của NVIDIA cũng thân thiện với người dùng và đơn giản hóa quy trình huấn luyện cho các mô hình suy luận chuỗi suy nghĩ dài. Bằng cách làm theo công thức DeepScaleR, người dùng có thể huấn luyện các mô hình như Qwen-1.5B bằng thuật toán GRPO và đạt được hiệu suất cạnh tranh trên các chuẩn như AIME24. Quy trình huấn luyện được cấu trúc theo từng giai đoạn, bắt đầu với độ dài chuỗi tối đa ngắn và tăng dần để quản lý hiệu quả việc phân phối độ dài chuỗi triển khai.

Đối với các nhà phát triển và nhà nghiên cứu muốn bắt đầu một dự án học tăng cường, kho lưu trữ NVIDIA NeMo-RL trên GitHub cung cấp nhiều tài nguyên, bao gồm tài liệu, tập lệnh mẫu, tệp cấu hình, v.v. Thư viện được tích hợp với Hugging Face và thiết kế mô-đun của nó cung cấp nền tảng vững chắc để đào tạo và mở rộng hiệu quả các mô hình học tăng cường.

Chia sẻ bài viết này:

Tin tức mới nhất
SentinelOne ra mắt bộ sản phẩm bảo mật AI mới.

SentinelOne ra mắt bộ sản phẩm bảo mật AI mới.

0:00 14/4/26

SentinelOne đã công bố một loạt sản phẩm bảo mật AI mới được thiết kế để tăng cường cả khả năng bảo vệ hệ thống AI và tự động hóa các hoạt động bảo mật.

Opentone cập nhật tính năng tư vấn AI về thông tin du lịch.

Opentone cập nhật tính năng tư vấn AI về thông tin du lịch.

0:00 14/4/26

Opentone vừa công bố bản cập nhật lớn cho tính năng tư vấn AI của nền tảng Trí tuệ Du lịch.

Sales Marker Orcha được Ngân hàng MUFG áp dụng.

Sales Marker Orcha được Ngân hàng MUFG áp dụng.

0:00 14/4/26

Sales Marker thông báo rằng Ngân hàng Mitsubishi UFJ đã áp dụng hệ thống trợ lý ảo đa năng “Orcha” của họ sau giai đoạn thử nghiệm.

NTT West hợp tác với Nara để phát triển video du lịch sử dụng trí tuệ nhân tạo.

NTT West hợp tác với Nara để phát triển video du lịch sử dụng trí tuệ nhân tạo.

0:00 14/4/26

Tập đoàn NTT West vừa công bố sản xuất video quảng bá du lịch sử dụng trí tuệ nhân tạo (generative AI) với sự hợp tác của tỉnh Nara và một viện thiết kế khu vực.

Copyright © 2024 Generatived - All right Reserved.

Chia sẻ bài viết này:

Chia sẻ bài viết này:

Generatived AI Logo

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

  • Facebook
  • X

Hãy theo dõi chúng tôi

Ngôn ngữ

Tin tức mới nhất
SentinelOne ra mắt bộ sản phẩm bảo mật AI mới.

SentinelOne ra mắt bộ sản phẩm bảo mật AI mới.

0:00 14/4/26

SentinelOne đã công bố một loạt sản phẩm bảo mật AI mới được thiết kế để tăng cường cả khả năng bảo vệ hệ thống AI và tự động hóa các hoạt động bảo mật.

Opentone cập nhật tính năng tư vấn AI về thông tin du lịch.

Opentone cập nhật tính năng tư vấn AI về thông tin du lịch.

0:00 14/4/26

Opentone vừa công bố bản cập nhật lớn cho tính năng tư vấn AI của nền tảng Trí tuệ Du lịch.

Sales Marker Orcha được Ngân hàng MUFG áp dụng.

Sales Marker Orcha được Ngân hàng MUFG áp dụng.

0:00 14/4/26

Sales Marker thông báo rằng Ngân hàng Mitsubishi UFJ đã áp dụng hệ thống trợ lý ảo đa năng “Orcha” của họ sau giai đoạn thử nghiệm.

NTT West hợp tác với Nara để phát triển video du lịch sử dụng trí tuệ nhân tạo.

NTT West hợp tác với Nara để phát triển video du lịch sử dụng trí tuệ nhân tạo.

0:00 14/4/26

Tập đoàn NTT West vừa công bố sản xuất video quảng bá du lịch sử dụng trí tuệ nhân tạo (generative AI) với sự hợp tác của tỉnh Nara và một viện thiết kế khu vực.

bottom of page