最近の技術レポートでは、SIMA (Scalable Instructable Multiworld Agent)として知られる新しいAIエージェントが導入され、ビデオゲームの分野における人工知能研究に大きな変化をもたらした。このエージェントは、人間が操作するのと同じように、自然言語の指示に基づいてさまざまな3D仮想環境でタスクを理解し、実行するように訓練されている。このコラボレーションには8つのゲームスタジオが関与し、エージェントは9つの異なるビデオゲームでテストされ、多様なインタラクティブな世界に適応し、幅広いスキルを実行できる能力が実証された。

SIMAの設計には、事前トレーニングされたビジョンモデルと、キーボードとマウスのアクションを生成できるメモリーを備えたメイン モデルが含まれている。以前のAIシステムとは異なり、SIMAはゲームのソースコードや特殊なAPIにアクセスする必要がない。ゲーム画面からの視覚入力とユーザーが提供する簡単な言語での指示を使用して操作する。このアプローチにより、SIMAは人間のプレーヤーと同じ入力を使用してあらゆる仮想環境と潜在的に対話できるようになる。

SIMAの機能は、ナビゲーション、オブジェクトの操作、メニューの使用法など、600の基本スキルにわたって評価された。エージェントは、約10秒以内に完了できるタスクを実行するように訓練された。しかし、目標は、戦略的計画を必要とする複雑な複数ステップのタスクを処理できる将来のエージェントを開発することだ。この研究では、SIMAがその学習を一般化し、不慣れなゲームにおいて、そのゲーム用に特別に訓練されたエージェントとほぼ同じパフォーマンスを発揮できることが実証された。

研究チームは、SIMAをより多くのトレーニング環境に公開し、より洗練されたモデルを統合することで、SIMAを進化させ続けることを目指している。これにより、エージェントの複雑な言語命令の理解と実行が強化される。最終的な目標は、幅広いタスクを安全かつ効果的に実行できる汎用AIシステムを作成し、オンラインと現実世界の両方のシナリオでユーザーを支援できる可能性があることだ。

ソース:DeepMind Blog