Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

NVIDIA công bố DOPE để tăng cường tương tác với đối tượng robot

Generatived

10:39 19/1/24

NVIDIA đang giới thiệu Ước tính tư thế đối tượng sâu (DOPE), một mô hình mạng thần kinh được thiết kế để tăng cường tương tác của robot với các đối tượng bằng cách xác định chính xác tư thế sáu bậc tự do (DOF) của các đối tượng từ hình ảnh RGB). Mô hình này đặc biệt hữu ích cho các tác vụ yêu cầu thao tác đối tượng chính xác, chẳng hạn như nhà kho và cơ sở y tế. Hoạt động đào tạo của DOPE chỉ dựa vào dữ liệu tổng hợp, giúp giảm đáng kể chi phí liên quan đến việc thu thập và chú thích dữ liệu.

Mô hình hoạt động ở cấp độ cá thể nên mỗi loại đối tượng đều yêu cầu đào tạo riêng. Tính đặc hiệu này cho phép nó phát hiện và tương tác chính xác hơn với các vật thể khác nhau, ngay cả khi bị che khuất một phần. Kiến trúc của DOPE dựa trên mạng nơ-ron tích chập hoàn chỉnh và nhờ thuật toán PnP (Phối cảnh-n-điểm), nó có thể thích ứng với các tích hợp máy ảnh khác nhau mà không cần phải đào tạo lại.

Để tạo điều kiện thuận lợi cho việc đào tạo DOPE, NVIDIA đã cung cấp cách tạo dữ liệu tổng hợp bằng Isaac Sim. Nó sử dụng các kỹ thuật ngẫu nhiên hóa miền để cải thiện hiệu suất của mô hình trong các tình huống thực tế. Tập dữ liệu được tạo bao gồm hình ảnh và tệp JSON được chú thích nêu chi tiết về lớp, vị trí, hướng và khả năng hiển thị của đối tượng. Cách tiếp cận này giúp thu hẹp khoảng cách giữa môi trường đào tạo tổng hợp và ứng dụng trong thế giới thực.

Sau khi được đào tạo, mô hình DOPE được đánh giá bằng nhiều số liệu khác nhau để đảm bảo độ chính xác của nó. Mô hình đã thể hiện hiệu suất vượt trội so với các phương pháp ước tính tư thế khác, ngay cả khi chỉ được đào tạo trên hình ảnh tổng hợp. Để triển khai trong thế giới thực, Isaac ROS của NVIDIA cung cấp gói cho phép suy luận được tăng tốc bằng GPU, giúp tích hợp DOPE vào hệ thống robot cho các ứng dụng thời gian thực. nước xốt:

Nguồn: Blog nhà phát triển NVIDIA

Chia sẻ bài viết này:

Tin tức mới nhất

Gemini、 Google AIを活用したカスタムトラック作成を開始

0:00 20/2/26

Geminiは、ユーザーが説明文を入力するか写真をアップロードするだけで、カスタム音楽トラックを作成できる新機能を導入しました。

đọc thêm

Google、グローバルAIアクセス強化イニシアチブを発表

0:00 20/2/26

Googleは、AI技術への世界的なアクセス向上への取り組みを発表し、様々な分野における課題解決のためにこれらのツールが広く利用可能であることの重要性を強調しました。

đọc thêm

Sarvam AI と NVIDIA が多言語 AI モデルを加速

0:00 20/2/26

インド・ベンガルールのAIスタートアップ企業Sarvam AIは、インドの多様な言語ニーズに応えるため、大規模な多言語基盤モデルを構築するという野心的なプロジェクトに着手しました。

đọc thêm

NVIDIA と Nebius が GPU 部分割り当てのメリットを紹介

0:00 20/2/26

NVIDIA は Nebius 社と協力し、大規模言語モデル (LLM) 推論における NVIDIA Run:ai の部分的 GPU 割り当てによるパフォーマンス向上を評価しました。

đọc thêm

Chia sẻ bài viết này:

Danh mục

Trình nâng cao hình ảnh AI

Trình tạo mã AI

Quản lý tác vụ AI

Không có mã/mã thấp

Trình tạo thiết kế đồ họa AI

Trình tạo minh họa/nghệ thuật AI

Tất cả công cụ

Tin tức

AI và luật/hệ thống/kinh tế/xã hội

Các công ty/sản phẩm/công nghệ AI

AI công nghệ lớn

OpenAI/ChatGPT

AI thế hệ sáng tạo

AI thế hệ dựa trên văn bản

AI sáng tạo của Nhật Bản

Cơ bản về AI sáng tạo

Hướng dẫn ứng dụng AI cơ bản

Hồ sơ công ty

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng trang web

Công ty điều hành

Hãy theo dõi chúng tôi

Ngôn ngữ

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.