AI MMCTAgent mendukung analisis video berdurasi panjang 4/3934

Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif

AI MMCTAgent mendukung analisis video berdurasi panjang

Generatived

14/11/25, 00.00

MMCTAgent telah mengumumkan sistem AI baru yang dirancang untuk meningkatkan analisis data video dan gambar berdurasi panjang. GitHub di GitHub dan ditampilkan di Azure AI Foundry Labs, sistem ini dibangun di atas sistem multi-agen AutoGen Microsoft dan menyediakan arsitektur perencana-kritikus untuk tanya jawab multimodal. Arsitektur ini dirancang untuk memfasilitasi perencanaan, refleksi, dan penalaran berbasis alat, yang secara efektif mengoordinasikan bahasa, visi, dan pemahaman temporal untuk mengubah tugas multimodal statis menjadi alur kerja penalaran dinamis.

MMCTAgent bekerja dengan agen-agen yang spesifik terhadap modalitas seperti ImageAgent dan VideoAgent untuk melakukan inferensi iteratif menggunakan alat-alat seperti get_relevant_query_frames() dan object_detection-tool(). Pendekatan ini memungkinkan agen-agen untuk memilih alat yang tepat untuk setiap modalitas, mengevaluasi hasil antara, dan menyempurnakan kesimpulan mereka melalui siklus kritik. Proses iteratif ini memungkinkan MMCTAgent untuk menganalisis kueri-kueri kompleks di seluruh pustaka video dan gambar yang luas dengan cara yang mudah dijelaskan, diperluas, dan diskalakan.

Fungsionalitas MMCTAgent digerakkan oleh dua agen kolaboratif, Planner dan Critic, yang bekerja sama melalui AutoGen. Agen Planner menguraikan kueri pengguna, mengidentifikasi alat penalaran, melakukan operasi multimoda, dan membuat jawaban awal. Agen Critic meninjau rantai penalaran Planner, memverifikasi integritas bukti, dan menyempurnakan jawaban untuk memastikan akurasi dan konsistensi faktual. Siklus penalaran iteratif ini memungkinkan MMCTAgent untuk meningkatkan jawabannya melalui evaluasi diri terstruktur, menggabungkan refleksi ke dalam penalaran AI-nya, dan meningkatkan kemampuan adaptasinya terhadap berbagai domain.

Komponen VideoAgent dari sistem ini memperluas arsitekturnya ke inferensi video berdurasi panjang, dengan mengimplementasikan operasi dua tahap: penyerapan video dan pembuatan pustaka, diikuti oleh inferensi waktu kueri. Pendekatan terstruktur ini, dikombinasikan dengan evaluasi keluaran inferensi oleh alat Critic, memungkinkan MMCTAgent untuk memberikan wawasan yang akurat dan dapat diinterpretasikan untuk video yang padat informasi. Demikian pula, ImageAgent menerapkan paradigma Planner-Critic untuk analisis visual statis, memberikan inferensi yang terperinci dan dapat dijelaskan untuk koleksi gambar. Efektivitas MMCTAgent ditunjukkan melalui evaluasi menggunakan beberapa model LLM dasar dan set data tolok ukur, yang menunjukkan bahwa penambahan alat khusus meningkatkan kinerja secara signifikan.

Sumber: Berita terbaru - Sumber, Microsoft

Bagikan artikel ini:

Tin tức mới nhất

GenAi Meluncurkan Layanan Platform Pencocokan Freelance Berbasis AI

30/4/26, 00.00

GenAi mengumumkan peluncuran “Experts Ease,” sebuah platform bermerek yang menghubungkan konsultan lepas dengan proyek AI dan TI

Baca lebih lanjut

MONO BRAIN Memperluas Keamanan dan Pengembangan AI

30/4/26, 00.00

MONO BRAIN mengumumkan perluasan platform keamanan AI-nya dan peluncuran bisnis pengembangan AI berbasis kolaborasi

Baca lebih lanjut

KMS Mengintegrasikan Claude Opus 4.7 ke dalam AI

29/4/26, 00.00

KMS mengumumkan integrasi “Claude Opus 4.7” ke dalam solusi AI-nya yang dibangun di atas Azure AI Foundry

Baca lebih lanjut

Aun Consulting Partners Pemasaran Global untuk Ekspansi

29/4/26, 00.00

Aun Consulting mengumumkan kemitraan bisnis dengan Glocal Marketing untuk memperkuat dukungan pemasaran regional dan global bagi klien korporat.

Baca lebih lanjut

Bagikan artikel ini:

Kategori

Peningkat Gambar AI

Pembuat kode AI

Manajemen tugas AI

Tanpa kode/kode rendah

Generator desain grafis AI

Generator seni/ilustrasi AI

Semua alat

Berita

AI dan hukum/peraturan/masyarakat

Perusahaan/produk/teknologi AI

AI Teknologi Besar

OpenAI/ChatGPT

AI generasi kreatif

AI generasi berbasis teks

AI generatif Jepang

Dasar-dasar AI generatif

Panduan penerapan AI terbaik

Profil perusahaan

Tentang kami

Chính sách quyền riêng tư

Điều khoản sử dụng trang web

Công ty điều hành

Hãy theo dõi chúng tôi

Bahasa

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.

Ikuti kami

Bahasa

Kategori

Semua alat

Manajemen tugas AI

Generator desain grafis AI

Tanpa kode/kode rendah

Pembuat kode AI

Peningkat Gambar AI

Pembuat Seni/Ilustrasi AI

AI dan hukum/sistem/ekonomi/masyarakat

Perusahaan/produk/teknologi AI