top of page

Generatived(Beta)|生成AIの最新ニュースとトレンドを提供

logo.png

Meta が Chameleon、JASCO、AudioSeal の AI モデルを発表

Generatived

24/6/19 4:48

Metaは、この分野におけるイノベーションと責任ある進歩を促進することを目指して、いくつかのAI研究モデルを世界のAIコミュニティーにリリースすると発表した。共有モデルの中には、画像とテキストの両方を理解して生成できる混合モーダルモデルであるChameleonがある。Chameleonは、テキストと画像の組み合わせを処理できる能力が際立っており、キャプションの生成や新しいシーンの作成などのクリエーティブアプリケーション向けの多目的ツールを提供する。

言語モデルの効率性を高めるために、Metaはマルチトークン予測アプローチを導入した。この方法では、AIモデルをトレーニングして一度に複数の単語を予測する。これは、従来の単語予測とは大きく異なる。コード補完タスクの改善を目的としたこのアプローチの事前トレーニング済みモデルは、現在、研究専用ライセンスで利用できる。

同社はまた、AI生成音楽の制御を高める新しいモデルであるJASCOを発表した。主にテキスト入力を使用していた以前のモデルとは異なり、JASCOはコード、ビート、その他の音楽要素を組み込むことができ、より多用途で制御された音楽生成エクスペリエンスを提供する。このイノベーションにより、ユーザーは音楽制作プロセスで記号と音声をシームレスに融合できる。

AI生成音声の検出という課題に対処するため、MetaはAudioSealを開発した。これは、オーディオクリップ内の合成音声を局所的に検出できる透かし技術だ。AudioSealの効率的な検出機能はリアルタイムアプリケーション向けに設計されており、従来の方法よりも大幅に高速だ。このツールは、生成AIの悪用を防止するというMetaの取り組みの一環であり、商用ライセンスの下でリリースされている。

最後に、Metaは、地理的格差を減らすことを目的とした評価コードと注釈をリリースすることで、テキストから画像への生成システムの多様性に貢献している。同社の研究には、AI生成画像における地理的表現の地域的認識をより深く理解するための大規模な注釈研究が含まれている。この取り組みは、コミュニティーが生成モデルにおける多様性と表現を強化するのに役立つと期待されている。ソース:

この記事を共有:

最新のニュース
アマン・ジェイン氏がテック大手のインド政策責任者に就任

アマン・ジェイン氏がテック大手のインド政策責任者に就任

25/12/16 0:00

アマン・ジェイン氏が、大手テクノロジー企業のインドにおける政策戦略と取り組みを主導する公共政策部門の新たな責任者に任命されました。

Google翻訳が強化されたテキストとライブ音声機能を発表

Google翻訳が強化されたテキストとライブ音声機能を発表

25/12/16 0:00

Google翻訳は、Geminiテクノロジーを活用し、検索とアプリ内のテキスト翻訳品質を向上させることを発表しました。

BNY、従業員エンゲージメントのためのEliza AI Hubを発表

BNY、従業員エンゲージメントのためのEliza AI Hubを発表

25/12/15 0:00

BNYは、生成型AIを業務に完全統合し、集中型AIハブを設立し、社内AI導入・教育プラットフォーム「Eliza」を立ち上げました。

GMOメディア生成AIスクール地図公開

GMOメディア生成AIスクール地図公開

25/12/15 0:00

GMOメディア(東京都渋谷区)は、プログラミング・Webデザインスクール検索サイト「コエテコキャンパス byGMO」にて、生成AIを学べるスクールを整理した『生成AIスクール カオスマップ』を公開した。

Copyright © 2024 Generatived - All right Reserved.

この記事を共有:

この記事を共有:

Generatived AI Logo

Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。

  • Facebook
  • X

フォローをお願いします

言語

最新のニュース
アマン・ジェイン氏がテック大手のインド政策責任者に就任

アマン・ジェイン氏がテック大手のインド政策責任者に就任

25/12/16 0:00

アマン・ジェイン氏が、大手テクノロジー企業のインドにおける政策戦略と取り組みを主導する公共政策部門の新たな責任者に任命されました。

Google翻訳が強化されたテキストとライブ音声機能を発表

Google翻訳が強化されたテキストとライブ音声機能を発表

25/12/16 0:00

Google翻訳は、Geminiテクノロジーを活用し、検索とアプリ内のテキスト翻訳品質を向上させることを発表しました。

BNY、従業員エンゲージメントのためのEliza AI Hubを発表

BNY、従業員エンゲージメントのためのEliza AI Hubを発表

25/12/15 0:00

BNYは、生成型AIを業務に完全統合し、集中型AIハブを設立し、社内AI導入・教育プラットフォーム「Eliza」を立ち上げました。

GMOメディア生成AIスクール地図公開

GMOメディア生成AIスクール地図公開

25/12/15 0:00

GMOメディア(東京都渋谷区)は、プログラミング・Webデザインスクール検索サイト「コエテコキャンパス byGMO」にて、生成AIを学べるスクールを整理した『生成AIスクール カオスマップ』を公開した。

bottom of page