Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo
%20(1).webp)
UVeye công bố công nghệ kiểm tra xe nâng cao VLM
Generatived
0:00 17/11/25
Những phát triển gần đây đã chứng kiến các hệ thống thị giác máy tính được cải tiến nhờ tích hợp các mô hình ngôn ngữ thị giác (VLM), cho phép hiểu sâu hơn về nội dung thị giác. Các mô hình này có thể kết nối các mô tả văn bản với thông tin không gian-thời gian, cung cấp cho các nhóm những hiểu biết giá trị từ lượng lớn dữ liệu thị giác được thu thập hàng ngày. Bằng cách áp dụng VLM, các tổ chức có thể chuyển đổi các hệ thống cũ, cải thiện khả năng tìm kiếm nội dung thị giác với phụ đề dày đặc, tăng cường cảnh báo với ngữ cảnh chi tiết và tóm tắt các tình huống phức tạp bằng suy luận AI.
Một ví dụ về ứng dụng của công nghệ này là hệ thống kiểm tra xe tự động của UVeye, xử lý hàng triệu hình ảnh độ phân giải cao để phát hiện lỗi với độ chính xác cao. Ứng dụng VLM này chuyển đổi dữ liệu thị giác thành các báo cáo có cấu trúc, nâng cao khả năng tìm kiếm và cải thiện đáng kể tỷ lệ phát hiện lỗi. Tương tự, Relo Metrics tận dụng VLM để đo lường tiếp thị thể thao, cung cấp cho các thương hiệu những hiểu biết theo thời gian thực về giá trị đầu tư truyền thông của họ, cho phép tối ưu hóa chiến lược và tiết kiệm chi phí đáng kể.
Hơn nữa, VLM đang được sử dụng để nâng cao các hệ thống thị giác máy tính dựa trên CNN, cung cấp các khả năng vượt ra ngoài các cảnh báo nhị phân đơn giản. VLM bổ sung một lớp hiểu biết theo ngữ cảnh, chi tiết hóa sự cố. Điều này đặc biệt hữu ích trong các ứng dụng như quản lý giao thông thành phố thông minh với Linker Vision. Phương pháp này tự động hóa việc phân tích sự kiện trên hàng nghìn luồng camera, giảm thiểu kết quả dương tính giả và cải thiện thời gian phản hồi của thành phố.
Cuối cùng, các hệ thống AI tác nhân kết hợp VLM với các mô hình và công nghệ khác có thể xử lý và suy luận các truy vấn phức tạp. Ví dụ: Levatas đã phát triển một giải pháp kiểm tra trực quan tận dụng VLM để tạo báo cáo kiểm tra chi tiết, đơn giản hóa quy trình thủ công trước đây. Những tiến bộ trong AI tác nhân này phần lớn được hỗ trợ bởi công nghệ NVIDIA. NVIDIA cung cấp các công cụ mà các nhà phát triển cần để xây dựng các chỉ mục giàu siêu dữ liệu và tích hợp VLM vào nhiều ứng dụng khác nhau, giúp họ mở rộng quy mô hoạt động và nâng cao khả năng phân tích video.
Chia sẻ bài viết này:
Tin tức mới nhất
Dịch vụ hỗ trợ số hóa tài sản văn hóa dữ liệu AI
0:00 30/10/25
AI Data (Minato-ku, Tokyo) đã bắt đầu cung cấp "AI Heritage on IDX", một dịch vụ hỗ trợ số hóa tài sản văn hóa, nhắm mục tiêu đến các nhà quản lý tài sản văn hóa, phòng trưng bày nghệ thuật
Check Point và NVIDIA công bố AI Cloud Protect
0:00 30/10/25
REDWOOD CITY, California – Check Point Software Technologies Ltd. và NVIDIA đang hợp tác để tăng cường bảo mật tại nhà máy AI.
Crescendo ra mắt AI đa phương thức cho tương tác liền mạch với khách hàng
0:00 30/10/25
SAN FRANCISCO, ngày 28 tháng 10 năm 2025 – Crescendo đã công bố AI đa phương thức, một khả năng tiên phong tích hợp tương tác bằng giọng nói, văn bản và hình ảnh vào các cuộc trò chuyện liền mạch.
Copyright © 2024 Generatived - All right Reserved.
Chia sẻ bài viết này:
Chia sẻ bài viết này:
Danh mục
Tin tức
AI và luật/hệ thống/kinh tế/xã hội
Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.
Tin tức mới nhất
Dịch vụ hỗ trợ số hóa tài sản văn hóa dữ liệu AI
0:00 30/10/25
AI Data (Minato-ku, Tokyo) đã bắt đầu cung cấp "AI Heritage on IDX", một dịch vụ hỗ trợ số hóa tài sản văn hóa, nhắm mục tiêu đến các nhà quản lý tài sản văn hóa, phòng trưng bày nghệ thuật
Check Point và NVIDIA công bố AI Cloud Protect
0:00 30/10/25
REDWOOD CITY, California – Check Point Software Technologies Ltd. và NVIDIA đang hợp tác để tăng cường bảo mật tại nhà máy AI.
Crescendo ra mắt AI đa phương thức cho tương tác liền mạch với khách hàng
0:00 30/10/25
SAN FRANCISCO, ngày 28 tháng 10 năm 2025 – Crescendo đã công bố AI đa phương thức, một khả năng tiên phong tích hợp tương tác bằng giọng nói, văn bản và hình ảnh vào các cuộc trò chuyện liền mạch.



%20(1).webp)
%20(1).webp)

