top of page

Generatived(Beta)|生成AIの最新ニュースとトレンドを提供

logo.png

Segment AnythingがSAM 3とSAM 3Dツールを発表

Generatived

25/11/21 0:00

AI技術の最新技術が、 Segment Anythingコレクションの一部であるSAM 3とSAM 3Dの導入によって明らかになりました。SAM 3は、テキストと視覚的なプロンプトの両方を使用して、画像や動画内のオブジェクトの検出と追跡機能を強化しました。一方、SAM 3Dは、1枚の画像からオブジェクトや人物の3D再構成を可能にすることで、飛躍的な進歩を遂げています。これらのツールは、 Segment Anything Playgroundプラットフォームで実験的にご利用いただけます。

SAM 3はクリエイティブメディアツールの進化における重要な一歩であり、ビジュアルコンテンツとのより直感的なインタラクションを実現します。従来のモデルは基本的なテキストラベルしか入力できませんでしたが、SAM 3はより幅広い詳細なテキストプロンプトに対応し、より正確なセグメンテーションを可能にします。この機能は特にビデオ編集に役立ち、クリエイターは映像内の特定のオブジェクトや人物にエフェクトを適用できます。この技術は、ビデオ作成アプリ「Edits」やMeta AIアプリの「Vibes」機能など、様々なアプリケーションの機能強化に貢献します。

一方、SAM 3Dは、2つのオープンソースモデルにより、AIを活用した3D再構成の新たな基準を確立しています。これらのモデルは、物体やシーンの再構成、そして人体や形状の推定において、堅牢なパフォーマンスを発揮するように設計されています。SAM 3Dのリリースは、よりリアルで厳密な3Dモデリング手法を提供することで、ロボット工学からスポーツ医学まで、幅広い分野にメリットをもたらすと期待されています。さらに、この技術は、 Facebook Marketplaceの「View in Room」機能など、ユーザーエクスペリエンスの向上にも活用されています。この機能では、ユーザーは購入前に自分の空間でアイテムを視覚化できます。

Segment Anything Playgroundプラットフォームは、ユーザーが専門知識を必要とせずにこれらの最先端モデルを探索できるようにしています。ユーザーは画像や動画をアップロードし、SAM 3を使用してシンプルなテキストプロンプトでオブジェクトをセグメント化したり、SAM 3Dを使用して3次元のシーンを操作したりできます。また、モデルの重み、ベンチマークデータセット、研究論文の共有も含まれており、さらなるイノベーションとカスタマイズを促進します。この取り組みは、ユーザーが創造性を探求し、AI技術の可能性を拡大することを目指しています。

この記事を共有:

最新のニュース
Google Cloud、NL2SQLでBIRDBenchmarkを制す

Google Cloud、NL2SQLでBIRDBenchmarkを制す

25/11/18 0:00

Google Cloudは最近、自然言語処理、特にテキストからSQLへの変換分野において新たなベンチマークを達成しました。

BlueCodeAgentがCodeGen AIのセキュリティ対策を強化

BlueCodeAgentがCodeGen AIのセキュリティ対策を強化

25/11/18 0:00

様々な機関の研究者が協力し、自動コード生成における大規模言語モデル(LLM)がもたらすセキュリティ上の課題に取り組んできました。

NVIDIA、RDMA技術でS3ストレージを強化

NVIDIA、RDMA技術でS3ストレージを強化

25/11/18 0:00

NVIDIAは、リモート ダイレクト メモリ アクセス (RDMA) を活用してS3アプリケーション プログラミング インターフェース (API) を高速化することで、S3互換ストレージを強化する新技術を発表しました。

Waze、 Google Cloud Memorystore でインフラストラクチャを強化

Waze、 Google Cloud Memorystore でインフラストラクチャを強化

25/11/18 0:00

Wazeは、ナビゲーション機能に不可欠な膨大なリアルタイムユーザーセッションデータを管理するために、インフラストラクチャを強化しました。

Copyright © 2024 Generatived - All right Reserved.

この記事を共有:

この記事を共有:

Generatived AI Logo

Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。

  • Facebook
  • X

フォローをお願いします

言語

最新のニュース
Google Cloud、NL2SQLでBIRDBenchmarkを制す

Google Cloud、NL2SQLでBIRDBenchmarkを制す

25/11/18 0:00

Google Cloudは最近、自然言語処理、特にテキストからSQLへの変換分野において新たなベンチマークを達成しました。

BlueCodeAgentがCodeGen AIのセキュリティ対策を強化

BlueCodeAgentがCodeGen AIのセキュリティ対策を強化

25/11/18 0:00

様々な機関の研究者が協力し、自動コード生成における大規模言語モデル(LLM)がもたらすセキュリティ上の課題に取り組んできました。

NVIDIA、RDMA技術でS3ストレージを強化

NVIDIA、RDMA技術でS3ストレージを強化

25/11/18 0:00

NVIDIAは、リモート ダイレクト メモリ アクセス (RDMA) を活用してS3アプリケーション プログラミング インターフェース (API) を高速化することで、S3互換ストレージを強化する新技術を発表しました。

Waze、 Google Cloud Memorystore でインフラストラクチャを強化

Waze、 Google Cloud Memorystore でインフラストラクチャを強化

25/11/18 0:00

Wazeは、ナビゲーション機能に不可欠な膨大なリアルタイムユーザーセッションデータを管理するために、インフラストラクチャを強化しました。

bottom of page