Generatived(Beta)|生成AIの最新ニュースとトレンドを提供
%20(1).webp)
NVIDIA、革新的な研究でロボット操作を強化
Generatived
25/12/16 0:00
NVIDIAの最新版Robotics Research and Development Digestでは、ロボットの操作能力の向上について深く掘り下げています。この出版物では、ロボットが動的な環境と相互作用し、複雑なタスクをより器用に実行できる能力を向上させることを目的とした、3つの革新的な研究プロジェクトについて解説しています。これらのプロジェクトには、高度な推論と行動実行を統合するThinkAct、シミュレーションデータと実世界のデータ間のギャップを埋める共同トレーニングアプローチ、そしてロボットツールのジェネレーティブデザインに焦点を当てたRobotSmithが含まれます。
ThinkActは、強化視覚潜在計画とマルチモーダル大規模言語モデルを組み合わせたデュアルシステムフレームワークを導入しています。このアプローチにより、ロボットは視覚フィードバックに基づいて推論計画を作成し、それに従うことができ、計画が理論的に妥当であるだけでなく、物理的に実現可能であることが保証されます。その後の行動モデルは、推論計画から導き出された潜在軌道によって導かれ、ロボットが様々な状況でタスクを実行する能力を向上させます。
共同トレーニング手法は、シミュレーションから実世界のアプリケーションへのポリシーの移行という課題に取り組んでいます。このフレームワークは、両ドメインからの観測データを共有潜在空間に整合させ、最適な転送技術を用いることで、ロボットがシミュレーション環境と実環境の両方で効果的な行動を学習することを可能にします。このアプローチは、トレーニングデータが主にシミュレーションに基づくものであっても、実世界のシナリオを一般化する上で有望性を示しています。
RobotSmithのフレームワークは、視覚言語モデルを用いて、特定の操作タスクに最適化されたツールを自動設計します。このプロセスでは、2つのVLMエージェントが協調してツールの形状を生成し、その後、シミュレーションにおける共同最適化によってツールの設計と操作軌跡の両方を改良します。この手法は、パンケーキを焼くといった複雑なタスクのためのツールの作成に成功しており、長期的なタスクパフォーマンスへの可能性を実証しています。
これらの研究活動に加えて、NVIDIAのCosmos Cookbookは、物理AIコミュニティ向けのオープンソースリソースとして注目されています。Cosmosモデルをロボティクスや自律システムに導入するための実用的な知識、事例、ワークフローを提供します。このクックブックは、現実世界のアプリケーションにおけるロボットポリシーの堅牢性を向上させる、現実的な合成データセットの作成を容易にすることを目的としています。
NVIDIA のロボティクス分野における継続的な研究開発は、NeurIPS 2025 で発表されたこれらのプロジェクトを通じて紹介されています。NVIDIA は、物理 AI とロボティクスに関する知見とブレークスルーを共有し続け、この分野の発展に関心を持つ開発者にリソースとトレーニングを提供しています。
最新のニュース
TechSuite AI記事代行ヤマダデンキ効果
25/12/16 0:00
TechSuite(本社所在地)は、生成AIを活用したコンテンツマーケティング支援サービス「バクヤスAI 記事代行」の導入効果について、ヤマダデンキ(本社所在地)の星野様にインタビューし、その動画を公開した。
Copyright © 2024 Generatived - All right Reserved.
ニュース
Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。
最新のニュース
TechSuite AI記事代行ヤマダデンキ効果
25/12/16 0:00
TechSuite(本社所在地)は、生成AIを活用したコンテンツマーケティング支援サービス「バクヤスAI 記事代行」の導入効果について、ヤマダデンキ(本社所在地)の星野様にインタビューし、その動画を公開した。



%20(1).webp)


