top of page

Generatived(Beta)|生成AIの最新ニュースとトレンドを提供

logo.png

NVIDIA NeMo-RL: オープンソースの AI 強化学習ライブラリ

Generatived

25/7/14 0:00

NVIDIAは、強化学習(RL)によるインタラクティブAI開発を支援するオープンソースの学習後ライブラリ「NeMo-RL」を発表しました。このライブラリはNVIDIA NeMoフレームワークのコンポーネントであり、シングルGPUプロトタイプから最大320億パラメータの大規模モデルまで、幅広いモデルサイズをサポートするように設計されています。NeMo-RLは、 Hugging Faceモデルとのネイティブ統合、最適化された学習、DPOやGRPOなどの一般的なアルゴリズム、そして複雑なRLパイプラインを管理するためのRayベースのオーケストレーションを誇ります。

このライブラリの柔軟なバックエンドアーキテクチャは際立った特徴であり、複数のトレーニングおよびロールアウトバックエンドの利用を可能にします。現在、PyTorchネイティブ並列処理を備えたHugging Faceモデルをサポートしており、より大規模なモデル向けにMegatron-Coreバックエンドを導入する予定です。生成にはNeMo-RLのvLLMバックエンドが使用され、NVIDIA TensorRT-LLMやSGLangなどの他のバックエンドにも拡張できる可能性があります。この設計により、高レベルアルゴリズムの実装が特定のバックエンドの詳細に縛られることなく、異なるGPU構成間での容易なスケーリングが可能になります。

NVIDIAのNeMo-RLもユーザーフレンドリーで、長い思考連鎖推論モデルの学習プロセスを簡素化します。DeepScaleRレシピに従うことで、ユーザーはGRPOアルゴリズムを用いてQwen-1.5Bのようなモデルを学習し、AIME24などのベンチマークで競争力のあるパフォーマンスを実現できます。学習プロセスは段階的に構成され、最初は短い最大シーケンス長から徐々に長めにすることで、ロールアウトシーケンス長の分布を効果的に管理します。

強化学習プロジェクトに積極的に取り組みたい開発者や研究者のために、 GitHub上の NVIDIA NeMo-RL リポジトリには、ドキュメント、サンプルスクリプト、設定ファイルなど、豊富なリソースが用意されています。このライブラリはHugging Faceと統合されており、モジュール設計によって、強化学習モデルを効率的にトレーニングおよびスケーリングするための堅牢な基盤を提供します。

この記事を共有:

最新のニュース
ピネアルAI記事制作サービス提�供開始

ピネアルAI記事制作サービス提供開始

26/4/14 0:00

ピネアル(東京都港区)は、SEO記事ライティング自動化AIツール『UPRESS』を活用し、ワン・パブリッシングと共同で「AIオウンドメディアサービス by UPRESS」を4月13日より提供開始したと発表した。

ワンパブリッシングAIメディア支�援サービス開始提供

ワンパブリッシングAIメディア支援サービス開始提供

26/4/14 0:00

ワン・パブリッシング(東京都港区)は、ピネアルと共同開発した「AIオウンドメディアサービス by UPRESS」を4月13日から提供開始したと発表した。

GAIWAYA mooz動画生成機能公開

GAIWAYA mooz動画生成機能公開

26/4/14 0:00

GAIWAYA(東京都目黒区)は、AI画像生成アプリ「mooz.ai」のメジャーアップデートv3.0を公開したと発表した。

プロフェトAIとZentera提携強化

プロフェトAIとZentera提携強化

26/4/14 0:00

Profet AI(台北)は、Zentera Systemsとエージェント型AI活用の安全性向上に向けた市場展開パートナーシップを締結したと発表した。

Copyright © 2024 Generatived - All right Reserved.

この記事を共有:

この記事を共有:

Generatived AI Logo

Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。

  • Facebook
  • X

フォローをお願いします

言語

最新のニュース
ピネアルAI記事制作サービス提供開始

ピネアルAI記事制作サービス提供開始

26/4/14 0:00

ピネアル(東京都港区)は、SEO記事ライティング自動化AIツール『UPRESS』を活用し、ワン・パブリッシングと共同で「AIオウンドメディアサービス by UPRESS」を4月13日より提供開始したと発表した。

ワンパブリッシングAIメディア支援サービス開始提供

ワンパブリッシングAIメディア支援サービス開始提供

26/4/14 0:00

ワン・パブリッシング(東京都港区)は、ピネアルと共同開発した「AIオウンドメディアサービス by UPRESS」を4月13日から提供開始したと発表した。

GAIWAYA mooz動画生成機能公開

GAIWAYA mooz動画生成機能公開

26/4/14 0:00

GAIWAYA(東京都目黒区)は、AI画像生成アプリ「mooz.ai」のメジャーアップデートv3.0を公開したと発表した。

プロフェトAIとZentera提携強化

プロフェトAIとZentera提携強化

26/4/14 0:00

Profet AI(台北)は、Zentera Systemsとエージェント型AI活用の安全性向上に向けた市場展開パートナーシップを締結したと発表した。

bottom of page