Twitter投稿によると、Google DeepMindはYouTubeと協力してYouTubeショートのレコメンデーションを改善しており、Flamingoと呼ばれる強力な視覚言語モデルを導入。ユーザーがYouTubeショートに参加する方法を変える上で重要な役割を果たしている。

Flamingoは、特にYouTubeショート内のビジュアルおよびオーディオコンテンツを理解するためにDeepMindによって開発された高度なAIモデルだ。Flamingoは最先端の機能を備えており、視覚要素、音声キュー、テキストのコンテキストなど、短い動画の複雑な特徴を分析して理解できる。Flamingoは、YouTubeショート動画に「熟練したスケートボーダーが、にぎやかな都市環境で難なく滑走してトリックを披露する様子」や「カラフルな環境で魅惑的なダンスルーティンを披露する様子」などの説明的なキャプションを提供する。

Flamingoの機能は個々の動画の分析だけでなく、より広範な文脈の理解も備えている。さまざまな動画間の関係、ユーザーの好み、世界的な人気トレンドなどの要素が考慮され、より多様でバランスのとれたおすすめが得ることができる。