Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

NVIDIA công bố DOPE để tăng cường tương tác với đối tượng robot
Generatived
10:39 19/1/24
NVIDIA đang giới thiệu Ước tính tư thế đối tượng sâu (DOPE), một mô hình mạng thần kinh được thiết kế để tăng cường tương tác của robot với các đối tượng bằng cách xác định chính xác tư thế sáu bậc tự do (DOF) của các đối tượng từ hình ảnh RGB). Mô hình này đặc biệt hữu ích cho các tác vụ yêu cầu thao tác đối tượng chính xác, chẳng hạn như nhà kho và cơ sở y tế. Hoạt động đào tạo của DOPE chỉ dựa vào dữ liệu tổng hợp, giúp giảm đáng kể chi phí liên quan đến việc thu thập và chú thích dữ liệu.
Mô hình hoạt động ở cấp độ cá thể nên mỗi loại đối tượng đều yêu cầu đào tạo riêng. Tính đặc hiệu này cho phép nó phát hiện và tương tác chính xác hơn với các vật thể khác nhau, ngay cả khi bị che khuất một phần. Kiến trúc của DOPE dựa trên mạng nơ-ron tích chập hoàn chỉnh và nhờ thuật toán PnP (Phối cảnh-n-điểm), nó có thể thích ứng với các tích hợp máy ảnh khác nhau mà không cần phải đào tạo lại.
Để tạo điều kiện thuận lợi cho việc đào tạo DOPE, NVIDIA đã cung cấp cách tạo dữ liệu tổng hợp bằng Isaac Sim. Nó sử dụng các kỹ thuật ngẫu nhiên hóa miền để cải thiện hiệu suất của mô hình trong các tình huống thực tế. Tập dữ liệu được tạo bao gồm hình ảnh và tệp JSON được chú thích nêu chi tiết về lớp, vị trí, hướng và khả năng hiển thị của đối tượng. Cách tiếp cận này giúp thu hẹp khoảng cách giữa môi trường đào tạo tổng hợp và ứng dụng trong thế giới thực.
Sau khi được đào tạo, mô hình DOPE được đánh giá bằng nhiều số liệu khác nhau để đảm bảo độ chính xác của nó. Mô hình đã thể hiện hiệu suất vượt trội so với các phương pháp ước tính tư thế khác, ngay cả khi chỉ được đào tạo trên hình ảnh tổng hợp. Để triển khai trong thế giới thực, Isaac ROS của NVIDIA cung cấp gói cho phép suy luận được tăng tốc bằng GPU, giúp tích hợp DOPE vào hệ thống robot cho các ứng dụng thời gian thực. nước xốt:
Chia sẻ bài viết này:
Tin tức mới nhất
Gemini、 Google AIを活用したカスタムトラック作成を開始
0:00 20/2/26
Geminiは、ユーザーが説明文を入力するか写真をアップロードするだけで、カスタム音楽トラックを作成できる新機能を導入しました。
Google、グローバルAIアクセス強化イニシアチブを発表
0:00 20/2/26
Googleは、AI技術への世界的なアクセス向上への取り組みを発表し、様々な分野における課題解決のためにこれらのツールが広く利用可能であることの重要性を強調しました。
Sarvam AI と NVIDIA が多言語 AI モデルを加速
0:00 20/2/26
インド・ベンガルールのAIスタートアップ企業Sarvam AIは、インドの多様な言語ニーズに応えるため、大規模な多言語基盤モデルを構築するという野心的なプロジェクトに着手しました。
Copyright © 2024 Generatived - All right Reserved.
Chia sẻ bài viết này:
Chia sẻ bài viết này:
Danh mục
Tin tức
AI và luật/hệ thống/kinh tế/xã hội
Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.
Tin tức mới nhất
Gemini、 Google AIを活用したカスタムトラック作成を開始
0:00 20/2/26
Geminiは、ユーザーが説明文を入力するか写真をアップロードするだけで、カスタム音楽トラックを作成できる新機能を導入しました。
Google、グローバルAIアクセス強化イニシアチブを発表
0:00 20/2/26
Googleは、AI技術への世界的なアクセス向上への取り組みを発表し、様々な分野における課題解決のためにこれらのツールが広く利用可能であることの重要性を強調しました。
Sarvam AI と NVIDIA が多言語 AI モデルを加速
0:00 20/2/26
インド・ベンガルールのAIスタートアップ企業Sarvam AIは、インドの多様な言語ニーズに応えるため、大規模な多言語基盤モデルを構築するという野心的なプロジェクトに着手しました。




%20(1).webp)

