NVIDIA TensorRT Edge-LLM Meningkatkan AI Kendaraan Otonom

Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif

NVIDIA TensorRT Edge-LLM Meningkatkan AI Kendaraan Otonom

Generatived

16/3/26, 00.00

Evolusi Kecerdasan Buatan Fisik (Physical AI) mengalami lompatan signifikan dengan diperkenalkannya NVIDIA TensorRT Edge-LLM, sebuah runtime inferensi C++ berkinerja tinggi. Perangkat lunak ini dirancang untuk meningkatkan kemampuan kendaraan otonom dan robot humanoid dengan memungkinkan penalaran berakurasi tinggi dan interaksi multimodal waktu nyata dalam batasan daya dan latency. Rilis terbaru ini memperluas kemampuan fundamental untuk platform NVIDIA DRIVE AGX Thor dan NVIDIA Jetson Thor, memperkenalkan arsitektur edge canggih dan dukungan yang dioptimalkan untuk keluarga model terbuka NVIDIA Nemotron.

Efisiensi dalam komputasi sedang didefinisikan ulang karena TensorRT Edge-LLM sepenuhnya memungkinkan dukungan Mixture of Experts (MoE) di edge, mengoptimalkan model seperti Qwen3 MoE. Pendekatan ini memungkinkan perangkat edge untuk memanfaatkan kekuatan penalaran model yang lebih besar sambil mempertahankan latency inferensi dan jejak komputasi yang lebih rendah. Pergeseran ini sangat penting untuk menerapkan penalaran dengan fidelitas tinggi pada platform seperti NVIDIA DRIVE AGX Thor dan NVIDIA Jetson Thor, memungkinkan pengembang untuk meningkatkan kecerdasan sistem otonom tanpa melampaui ambang batas daya dan latency .

TensorRT Edge-LLM juga menghadirkan dukungan untuk NVIDIA Nemotron 2 Nano, memfasilitasi kelas baru penalaran Sistem 2 pada chipset tertanam. Ini sangat bermanfaat bagi pengembang yang menciptakan asisten AI canggih atau agen dialog robotik, karena mengatasi tantangan memori dan latency yang terkait dengan penerapan model bahasa besar di edge. Runtime menyediakan kernel yang dioptimalkan yang mempercepat lapisan hibrida, memungkinkan penggunaan jendela konteks yang besar untuk pipeline generasi yang kompleks dengan peningkatan pengambilan data di edge sambil tetap menjaga jejak memori perangkat tetap terkendali.

Selain kemampuan penalaran, TensorRT Edge-LLM kini mendukung Qwen3-TTS dan Qwen3-ASR untuk interaksi model multimodal asli, menyederhanakan pemrosesan ucapan ujung-ke-ujung. Optimalisasi ini mengurangi latency dan memungkinkan sintesis suara alami langsung pada chip, meningkatkan interaksi antara pengemudi dan kendaraan otonom. Lebih lanjut, runtime mendukung Cosmos Reason 2, VLM penalaran terbuka yang dibangun untuk AI fisik dan robotika, memberdayakan robot humanoid untuk bernalar dengan akal sehat fisik dan merencanakan tindakan secara real-time.

NVIDIA juga bersiap untuk memperkenalkan Alpamayo 1, sebuah alur kerja yang menggabungkan pemikiran rasional Sistem 2 ke dalam perangkat edge. Kemajuan ini akan memungkinkan kendaraan otonom untuk merencanakan lintasan yang tepat, melampaui regresi sederhana untuk menghasilkan beragam lintasan masa depan dengan akurasi tinggi. Dengan latensi yang layak produksi pada DRIVE Thor, Alpamayo 1 mewakili pergeseran signifikan menuju model VLA (Vehicle-to-Access) ujung-ke-ujung dalam produksi kendaraan otonom.

Para pengembang yang tertarik memanfaatkan kemajuan ini dapat menjelajahi fitur dan contoh baru di repositori GitHub TensorRT Edge-LLM yang telah diperbarui atau melalui rilis NVIDIA DriveOS terbaru. Runtime ini dirancang untuk menjadi landasan dalam membangun generasi mesin otonom berikutnya, menghilangkan ketergantungan Python dan memastikan jejak memori yang dapat diprediksi untuk aplikasi otomotif dan robotika.

Sumber: Blog Pengembang NVIDIA

Bagikan artikel ini:

Tin tức mới nhất

Nextorage - Layanan dukungan implementasi Generative AI diluncurkan.

16/3/26, 00.00

Nextorage (Kota Kawasaki, Prefektur Kanagawa) telah meluncurkan "Layanan Dukungan Implementasi Generative AI " menggunakan aiDAPTIV+ dari Phison Electronics

Baca lebih lanjut

Memperkenalkan AI otentik "Nano Banana 2"

16/3/26, 00.00

Authentic AI (Minato-ku, Tokyo) mengumumkan bahwa mereka telah memperkenalkan Google Nano Banana 2 ke platform Generative AI mereka, Maison AI.

Baca lebih lanjut

Fitur Koreksi Tata Bahasa Baru Nishika AI Transcription

16/3/26, 00.00

Nishika (Minato-ku, Tokyo) telah menambahkan fungsi baru "Pemeriksaan Ejaan yang Dipersonalisasi" ke layanan transkripsi ucapan ke teks berbasis AI-nya, "SecureMemoCloud."

Baca lebih lanjut

Genspark AI Workspace 3.0 Diluncurkan

16/3/26, 00.00

Genspark (Silicon Valley) telah mengumumkan versi 3.0 dari ruang kerja AI-nya.

Baca lebih lanjut

Bagikan artikel ini:

Kategori

Peningkat Gambar AI

Pembuat kode AI

Manajemen tugas AI

Tanpa kode/kode rendah

Generator desain grafis AI

Generator seni/ilustrasi AI

Semua alat

Berita

AI dan hukum/peraturan/masyarakat

Perusahaan/produk/teknologi AI

AI Teknologi Besar

OpenAI/ChatGPT

AI generasi kreatif

AI generasi berbasis teks

AI generatif Jepang

Dasar-dasar AI generatif

Panduan penerapan AI terbaik

Profil perusahaan

Tentang kami

Chính sách quyền riêng tư

Điều khoản sử dụng trang web

Công ty điều hành

Hãy theo dõi chúng tôi

Bahasa

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.

Ikuti kami

Bahasa

Kategori

Semua alat

Manajemen tugas AI

Generator desain grafis AI

Tanpa kode/kode rendah

Pembuat kode AI

Peningkat Gambar AI

Pembuat Seni/Ilustrasi AI

AI dan hukum/sistem/ekonomi/masyarakat

Perusahaan/produk/teknologi AI

AI berteknologi besar

OpenAI/ChatGPT

AI generasi inovatif

AI generasi berbasis teks

AI inovatif Jepang

Dasar-dasar AI generatif

Petunjuk dasar aplikasi AI

Tin tức

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng của trang web

Công ty điều hành

Hồ sơ công ty

Berita terkini

Nextorage - Layanan dukungan implementasi Generative AI diluncurkan.

16/3/26, 00.00

Nextorage (Kota Kawasaki, Prefektur Kanagawa) telah meluncurkan "Layanan Dukungan Implementasi Generative AI " menggunakan aiDAPTIV+ dari Phison Electronics

Baca lebih lanjut

Memperkenalkan AI otentik "Nano Banana 2"

16/3/26, 00.00

Authentic AI (Minato-ku, Tokyo) mengumumkan bahwa mereka telah memperkenalkan Google Nano Banana 2 ke platform Generative AI mereka, Maison AI.

Baca lebih lanjut

Fitur Koreksi Tata Bahasa Baru Nishika AI Transcription

16/3/26, 00.00

Nishika (Minato-ku, Tokyo) telah menambahkan fungsi baru "Pemeriksaan Ejaan yang Dipersonalisasi" ke layanan transkripsi ucapan ke teks berbasis AI-nya, "SecureMemoCloud."

Baca lebih lanjut

Genspark AI Workspace 3.0 Diluncurkan

16/3/26, 00.00

Genspark (Silicon Valley) telah mengumumkan versi 3.0 dari ruang kerja AI-nya.

Baca lebih lanjut