Generatived(Beta)|生成AIの最新ニュースとトレンドを提供
%20(1).webp)
DeepMind RT-2:ロボット制御のための視覚-言語-行動モデル
Generatived
23/7/31 9:57
Google DeepMindは7月28日、「RT-2: 新しいモデルはビジョンと言語を行動に変換する」というブログ記事を投稿しました。以下は記事の要旨です。DeepMind の記事では、Web データとロボティクス データを組み合わせてロボット制御の命令を生成する、Robotic Transformer 2 (RT-2) と呼ばれる新しいビジョン言語アクション (VLA) モデルの開発について説明しています。ウェブスケールのデータセットでトレーニングされた大容量の視覚言語モデル (VLM) は、視覚と言語のパターンを認識するのに効果的であることが証明されていますが、ロボットが同様の能力を達成するには直接のデータが必要です。RT-2 は、オフィスのキッチン環境で 17 か月にわたって収集されたロボット データに関するマルチタスク デモンストレーションとトレーニングを組み込むことにより、以前のモデルである Robotic Transformer 1 (RT-1) をベースに構築されています。 RT-2 は、改良された一般化機能と、新しいコマンドを解釈して基本的な推論を実行する機能を示しています。このモデルは、アクションをモデルの出力内のトークンとして表すことにより、VLM をロボット制御に適応させます。 RT-2 はロボット工学と Web データに合わせて微調整されており、視覚的意味論的な理解とロボット制御を必要とするさまざまなタスクを実行できます。このモデルは、以前のベースラインと比較して汎化パフォーマンスの向上を示し、これまでに見たことのないオブジェクト、背景、環境を含むタスクにおいて他のモデルを上回っています。 RT-2 は、シミュレーションと現実世界のシナリオの両方で高い成功率を実現します。このモデルには、単一モデル内で長期的な計画と低レベルのスキルを可能にする思考連鎖推論も組み込まれています。 RT-2 は、現実世界でロボットを制御し、さまざまなタスクを実行する VLA モデルの可能性を実証します。
最新のニュース
APコミュニケーションズAI技術者育成プログラム
25/12/15 0:00
エーピーコミュニケーションズ(東京都千代田区)は、2026年1月から「クラウドネイティブBootCamp ~AI時代を支えるPlatform Engineering~」という新しいプログラムを開始する。
GMOメディア生成AIスクール地図公開
25/12/15 0:00
GMOメディア(東京都渋谷区)は、プログラミング・Webデザインスクール検索サイト「コエテコキャンパス byGMO」にて、生成AIを学べるスクールを整理した『生成AIスクール カオスマップ』を公開した。
イー・ガーディアン海外展開支援ツール導入
25/12/15 0:00
イー・ガーディアン(東京都港区)は、フリットジャパン(東京都渋谷区)の海外展開コンテンツの品質チェックに「Typesetting Checker」を導入したと発表。
Copyright © 2024 Generatived - All right Reserved.
ニュース
Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。
最新のニュース
APコミュニケーションズAI技術者育成プログラム
25/12/15 0:00
エーピーコミュニケーションズ(東京都千代田区)は、2026年1月から「クラウドネイティブBootCamp ~AI時代を支えるPlatform Engineering~」という新しいプログラムを開始する。
GMOメディア生成AIスクール地図公開
25/12/15 0:00
GMOメディア(東京都渋谷区)は、プログラミング・Webデザインスクール検索サイト「コエテコキャンパス byGMO」にて、生成AIを学べるスクールを整理した『生成AIスクール カオスマップ』を公開した。
イー・ガーディアン海外展開支援ツール導入
25/12/15 0:00
イー・ガーディアン(東京都港区)は、フリットジャパン(東京都渋谷区)の海外展開コンテンツの品質チェックに「Typesetting Checker」を導入したと発表。



%20(1).webp)


