Generatived（Beta）｜生成AIの最新ニュースとトレンドを提供

NVIDIA、生成AIモデルでロボットトレーニングを簡素化

Generatived

25/7/18 0:00

NVIDIAの最新の研究は、ロボットを新しいタスクに訓練する際の複雑さに対処し、膨大なデータ収集とラベリングの必要性を最小限に抑えることで、プロセスを簡素化することを目指しています。NVIDIA Cosmosなどの生成AIと世界基盤モデルを、NVIDIA Isaac GR00T-MimicやGR00T-Dreamsといったデータ生成ブループリントと併せて革新的に活用することで、合成データの作成とロボットモデルの訓練ワークフローを効率化します。

膨大な実世界データで訓練されたCosmos世界基盤モデルの予測機能は、この取り組みの中核を成しています。これらのモデルは、1枚の画像から将来の出来事を予測することができ、ロボット訓練のための多様でリアルな合成データを生成する上で重要な役割を果たします。この手法により、従来ロボットの学習に必要とされていた時間と労力が、数ヶ月から数時間へと大幅に短縮されると期待されています。

合成データ生成パイプラインであるDreamGenは、NVIDIAの戦略におけるもう1つの重要な要素です。このアプローチは、世界基盤モデルを活用して大量の合成ロボット軌道データを生成することで、人間の手による遠隔操作によるデータ収集といった労働集約的な作業を排除します。このアプローチは、様々な行動、環境、そしてロボットの形態におけるスケーラブルなロボット学習と幅広い汎化を可能にすると期待されています。

さらに、NVIDIAは、実データ、人間データ、合成データの組み合わせから学習することで、ロボットに汎用的なスキルを身につけさせるように設計されたオープン基盤モデル「GR00T N1」を発表しました。人間の認知能力に着想を得たこのモデルは、視覚、言語、行動を統合し、ロボットが動的な状況下で指示を理解し、複雑なタスクを実行できるようにします。

これらの進歩に加えて、NVIDIAの研究には、大規模なビデオからロボットに関連する動作を手動によるラベル付けなしに学習する教師なし学習手法である「Latent Action Pretraining from Videos (LAPA)」が含まれています。Sim-and-Real Co-Trainingアプローチもまた際立っており、シミュレーションデータと実世界のデータを融合することで、より適応性の高いロボットポリシーを開発します。

これらのイノベーションは、産業用ロボットやヒューマノイドロボットの能力向上のために、既に様々な組織で採用されています。NVIDIAは、Robotics Research and Development Digest (R2D2) を通じて知見やリソースを共有し続け、無料のコースや研究コミュニティへのアクセスを提供することで、開発者が研究に積極的に参加できるよう促しています。

ソース：NVIDIA Developer Blog