Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

MMCTAgent AI hỗ trợ phân tích video dạng dài
Generatived
0:00 14/11/25
MMCTAgent đã công bố một hệ thống AI mới được thiết kế để nâng cao khả năng phân tích dữ liệu video và hình ảnh dạng dài. GitHub trên GitHub và được giới thiệu trong Azure AI Foundry Labs, hệ thống này được xây dựng dựa trên hệ thống đa tác tử AutoGen của Microsoft và cung cấp kiến trúc lập kế hoạch-phê bình cho việc hỏi đáp đa phương thức. Kiến trúc này được thiết kế để hỗ trợ lập kế hoạch, phản biện và lập luận dựa trên công cụ, phối hợp hiệu quả ngôn ngữ, tầm nhìn và hiểu biết về thời gian để chuyển đổi các tác vụ đa phương thức tĩnh thành các quy trình lập luận động.
MMCTAgent hoạt động với các tác nhân chuyên biệt về phương thức như ImageAgent và VideoAgent để thực hiện suy luận lặp lại bằng các công cụ như get_relevant_query_frames() và object_detection-tool(). Phương pháp này cho phép các tác nhân lựa chọn công cụ phù hợp cho từng phương thức, đánh giá kết quả trung gian và tinh chỉnh kết luận thông qua một vòng lặp phê bình. Quy trình lặp lại này cho phép MMCTAgent phân tích các truy vấn phức tạp trên các thư viện video và hình ảnh khổng lồ theo cách dễ hiểu, dễ mở rộng và có khả năng mở rộng.
Chức năng của MMCTAgent được điều khiển bởi hai tác nhân cộng tác, Planner và Critic, hoạt động cùng nhau thông qua AutoGen. Tác nhân Planner phân tích truy vấn của người dùng, xác định các công cụ suy luận, thực hiện các thao tác đa phương thức và tạo ra câu trả lời sơ bộ. Tác nhân Critic xem xét chuỗi suy luận của Planner, xác minh tính toàn vẹn của bằng chứng và tinh chỉnh câu trả lời để đảm bảo tính chính xác và nhất quán về mặt thực tế. Vòng lặp suy luận lặp lại này cho phép MMCTAgent cải thiện câu trả lời thông qua quá trình tự đánh giá có cấu trúc, kết hợp phản biện vào suy luận AI và tăng khả năng thích ứng với nhiều lĩnh vực khác nhau.
Thành phần VideoAgent của hệ thống mở rộng kiến trúc sang suy luận video dạng dài, triển khai hoạt động hai giai đoạn: thu thập video và tạo thư viện, sau đó là suy luận thời gian truy vấn. Cách tiếp cận có cấu trúc này, kết hợp với việc đánh giá kết quả suy luận bằng công cụ Critic, cho phép MMCTAgent cung cấp thông tin chi tiết chính xác và dễ hiểu cho các video chứa nhiều thông tin. Tương tự, ImageAgent áp dụng mô hình Planner-Critic vào phân tích hình ảnh tĩnh, cung cấp suy luận chi tiết và dễ hiểu cho các bộ sưu tập hình ảnh. Hiệu quả của MMCTAgent được chứng minh thông qua các đánh giá sử dụng nhiều mô hình LLM cơ sở và bộ dữ liệu chuẩn, cho thấy việc bổ sung các công cụ chuyên biệt giúp cải thiện đáng kể hiệu suất.
Chia sẻ bài viết này:
Tin tức mới nhất
LegalOn cải tiến phân tích AI hợp đồng đa ngôn ngữ
0:00 14/11/25
LegalOn Technologies (Shibuya-ku, Tokyo) đã tạo ra "LegalOn: Trí tuệ nhân tạo pháp lý hàng đầu thế giới" có khả năng phân tích hợp đồng bằng nhiều ngôn ngữ khác ngoài tiếng Nhật và tiếng Anh.
LDcube tiến hành đào tạo tiếp thị AI cho toàn thể nhân viên
0:00 14/11/25
LDcube (Chiyoda-ku, Tokyo) đã tiến hành đào tạo cho toàn thể nhân viên do Daisuke Nakajima của Merrill, đơn vị điều hành Web Job TV, dẫn đầu.
AI xây dựng "Mirai City 2025" của Arent được công bố
0:00 14/11/25
Arent (Minato-ku, Tokyo) sẽ tham gia triển lãm tại Mirai City 2025 từ ngày 14 tháng 11 năm 2025.
Copyright © 2024 Generatived - All right Reserved.
Chia sẻ bài viết này:
Chia sẻ bài viết này:
Danh mục
Tin tức
AI và luật/hệ thống/kinh tế/xã hội
Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.
Tin tức mới nhất
LegalOn cải tiến phân tích AI hợp đồng đa ngôn ngữ
0:00 14/11/25
LegalOn Technologies (Shibuya-ku, Tokyo) đã tạo ra "LegalOn: Trí tuệ nhân tạo pháp lý hàng đầu thế giới" có khả năng phân tích hợp đồng bằng nhiều ngôn ngữ khác ngoài tiếng Nhật và tiếng Anh.
LDcube tiến hành đào tạo tiếp thị AI cho toàn thể nhân viên
0:00 14/11/25
LDcube (Chiyoda-ku, Tokyo) đã tiến hành đào tạo cho toàn thể nhân viên do Daisuke Nakajima của Merrill, đơn vị điều hành Web Job TV, dẫn đầu.
AI xây dựng "Mirai City 2025" của Arent được công bố
0:00 14/11/25
Arent (Minato-ku, Tokyo) sẽ tham gia triển lãm tại Mirai City 2025 từ ngày 14 tháng 11 năm 2025.



%20(1).webp)


