NVIDIA Memperkenalkan Pemrosesan Paralel Helix untuk Enhance AI 2/3943

Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif

NVIDIA Memperkenalkan Pemrosesan Paralel Helix untuk Enhance AI

Generatived

10/7/25, 00.00

Sistem Blackwell NVIDIA mengatasi tantangan aplikasi AI modern yang membutuhkan pengelolaan data dalam jumlah besar dan respons yang cepat. Pengenalan Helix Parallelism, yang dikembangkan bekerja sama dengan Blackwell, merupakan kemajuan besar dalam teknologi AI. Teknik baru ini secara signifikan meningkatkan jumlah pengguna yang dapat ditangani oleh agen AI secara bersamaan, meningkatkan kapasitas pemrosesan pengguna bersamaan hingga 32 kali lipat pada latency tertentu dibandingkan dengan teknik pemrosesan paralel tradisional.

Efisiensi dekode real-time sistem AI terhambat oleh dua hambatan utama: streaming cache kunci-nilai (KV) dan pemuatan bobot jaringan umpan maju (FFN) dari DRAM. Strategi paralelisasi tradisional kesulitan mengoptimalkan hambatan ini secara bersamaan. Namun, Helix Parallelism memecahkan masalah ini dengan menerapkan strategi sharding hibrida yang memisahkan strategi paralelisasi atensi dan FFN ke dalam alur temporal. Pendekatan ini secara efektif mengatasi tantangan streaming cache KV dan pemuatan hambatan bobot FFN yang muncul saat mendekode konteks dengan jutaan token.

Alur eksekusi Helix Parallelism dirancang untuk memaksimalkan pemanfaatan GPU dan meminimalkan latency. Dengan melakukan sharding cache KV dan menerapkan Tensor Parallelism dengan cara yang menghindari duplikasi antar GPU, Helix mencapai komputasi atensi yang efisien. Strategi ini juga mencakup Helix Overlapped Pipeline Batchwise (HOP-B), sebuah teknik pipelining yang sangat teliti, untuk lebih mengurangi latency antar-token dengan melakukan komunikasi dan komputasi yang tumpang tindih. Pada fase FFN, GPU yang sama digunakan kembali untuk mengeksekusi blok FFN tanpa waktu idle, menunjukkan fleksibilitas dan efisiensi strategi Helix.

Hasil simulasi pada perangkat keras Blackwell NVIDIA menunjukkan bahwa Helix Parallelism menetapkan tolok ukur performa baru dalam dekode model bahasa skala besar (LLM) konteks panjang. Teknik ini mencapai throughput tinggi dengan latency rendah, yang secara signifikan meningkatkan interaksi pengguna dan skalabilitas sistem. Seiring NVIDIA terus menyempurnakan optimasi ini untuk kerangka kerja inferensi, Helix Parallelism merupakan pengembangan yang menjanjikan untuk melayani model AI yang skalabel tanpa mengorbankan performa real-time.

Sumber: Blog Pengembang NVIDIA

Bagikan artikel ini:

Tin tức mới nhất

Nemotron Merilis AI yang Ditingkatkan untuk Sistem Multi-Agen

13/3/26, 00.00

Model AI baru, Nemotron 3 Super, telah diperkenalkan untuk meningkatkan kemampuan sistem multi-agen dalam aplikasi kompleks seperti pengembangan perangkat lunak

Baca lebih lanjut

Wayfair Meningkatkan Dukungan Katalog dan Pemasok dengan OpenAI

13/3/26, 00.00

Wayfair telah berhasil mengintegrasikan model OpenAI ke dalam sistem internalnya, meningkatkan dukungan pemasok dan manajemen katalog produk.

Baca lebih lanjut

ChatGPT Meningkatkan Keamanan AI Terhadap Injeksi Prompt

13/3/26, 00.00

Agen AI semakin mahir dalam penjelajahan web, pengambilan informasi, dan tindakan otonom, yang, meskipun bermanfaat, membuka jalan baru bagi serangan siber.

Baca lebih lanjut

ShiftPlus memperkenalkan GPT-5.4 ke AI pemerintah daerahnya.

13/3/26, 00.00

ShiftPlus (Nishi-ku, Osaka) telah memperkenalkan GPT-5.4 ke dalam "Municipal AI zevo," yang dikembangkan bekerja sama dengan Kota Miyakonojo.

Baca lebih lanjut

Bagikan artikel ini:

Kategori

Peningkat Gambar AI

Pembuat kode AI

Manajemen tugas AI

Tanpa kode/kode rendah

Generator desain grafis AI

Generator seni/ilustrasi AI

Semua alat

Berita

AI dan hukum/peraturan/masyarakat

Perusahaan/produk/teknologi AI

AI Teknologi Besar

OpenAI/ChatGPT

AI generasi kreatif

AI generasi berbasis teks

AI generatif Jepang

Dasar-dasar AI generatif

Panduan penerapan AI terbaik

Profil perusahaan

Tentang kami

Chính sách quyền riêng tư

Điều khoản sử dụng trang web

Công ty điều hành

Hãy theo dõi chúng tôi

Bahasa

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.

Ikuti kami

Bahasa

Kategori

Semua alat

Manajemen tugas AI

Generator desain grafis AI

Tanpa kode/kode rendah

Pembuat kode AI

Peningkat Gambar AI

Pembuat Seni/Ilustrasi AI

AI dan hukum/sistem/ekonomi/masyarakat

Perusahaan/produk/teknologi AI

AI berteknologi besar

OpenAI/ChatGPT

AI generasi inovatif

AI generasi berbasis teks

AI inovatif Jepang

Dasar-dasar AI generatif

Petunjuk dasar aplikasi AI

Tin tức

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng của trang web

Công ty điều hành

Hồ sơ công ty

Berita terkini

Nemotron Merilis AI yang Ditingkatkan untuk Sistem Multi-Agen

13/3/26, 00.00

Model AI baru, Nemotron 3 Super, telah diperkenalkan untuk meningkatkan kemampuan sistem multi-agen dalam aplikasi kompleks seperti pengembangan perangkat lunak

Baca lebih lanjut

Wayfair Meningkatkan Dukungan Katalog dan Pemasok dengan OpenAI

13/3/26, 00.00

Wayfair telah berhasil mengintegrasikan model OpenAI ke dalam sistem internalnya, meningkatkan dukungan pemasok dan manajemen katalog produk.

Baca lebih lanjut

ChatGPT Meningkatkan Keamanan AI Terhadap Injeksi Prompt

13/3/26, 00.00

Agen AI semakin mahir dalam penjelajahan web, pengambilan informasi, dan tindakan otonom, yang, meskipun bermanfaat, membuka jalan baru bagi serangan siber.

Baca lebih lanjut

ShiftPlus memperkenalkan GPT-5.4 ke AI pemerintah daerahnya.

13/3/26, 00.00

ShiftPlus (Nishi-ku, Osaka) telah memperkenalkan GPT-5.4 ke dalam "Municipal AI zevo," yang dikembangkan bekerja sama dengan Kota Miyakonojo.

Baca lebih lanjut