Wayveのブログによると、同社のGAIA-1は自律性を考慮して設計された生成AIモデルだ。このモデルはビデオ、テキスト、アクション入力を利用してリアルな運転ビデオを作成し、自車両の動作やシーンの特徴をきめ細かく制御できるという。

GAIA-1は、ラベルを必要とせずにビデオシーケンスの後続のフレームを予測する方法を学習するマルチモーダルアプローチを採用している。Wayveの広範な実際の英国都市部の運転データを活用し、大規模言語モデル(LLM)と同様の自己回帰予測を生成できるそうだ。GAIA-1を際立たせているのは、車両、歩行者、道路レイアウト、建物、信号機などの運転概念を理解して解きほぐす能力であり、自家車両の動作やシーンのダイナミクスに比類のない柔軟性を提供するという。

Wayveは、GAIA-1の驚くべき点は、現実世界を支える生成規則の現出だと述べている。トレーニング中にさまざまな運転データを合成することにより、モデルは世界に固有の構造とパターンを捉え、非常に現実的で多様な運転シーンを実現する。この成果により、人工システムが世界と対話するだけでなく、そのルールや行動を理解して再現する、身体化されたAIの実現に近づくことができる。

GAIA-1の機能:

  • 長く納得のいく未来の生成:GAIA-1は、数秒間のビデオに基づいて数分先の未来を予測し、世界の根底にあるルールの理解を示す。最初のフレームのものが最終フレームに存在しない運転シーンを生成できる。
  • 複数のもっともらしい未来の生成:コンテキストを開始してからわずか数秒で、GAIA-1はいくつかの考えられる複数の将来のシナリオを創造できる。同じビデオプロンプトに基づいて異なる結果が発生する可能性があることを認識する。
  • 特定の運転シーンの制御:GAIA-1は、ビデオと自然言語プロンプトを使用して調整し、妥当な将来のシナリオを生成できる。このコントロールを使用すると、シミュレーションでシーンのダイナミクスと自車両の動作を操作できる。
  • トレーニングデータを超えた外挿:GAIA-1は、トレーニングされたことのないシナリオで運転シーンを想像し、予測できる。間違った運転行動をシミュレートし、運転モデル​​の評価と改善に役立つ。

GAIA-1の重要な利点の1つは、最後の外挿機能だろう。この機能は、現実世界では危険すぎてテストできないコーナーケースやエッジケースのシミュレーションテストを可能にするため、安全性評価にも役立つかもしれない。