NVIDIA Memperkenalkan Pemrosesan Paralel Helix untuk Enhance AI

Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif

NVIDIA Memperkenalkan Pemrosesan Paralel Helix untuk Enhance AI

Generatived

10/7/25, 00.00

Sistem Blackwell NVIDIA mengatasi tantangan aplikasi AI modern yang membutuhkan pengelolaan data dalam jumlah besar dan respons yang cepat. Pengenalan Helix Parallelism, yang dikembangkan bekerja sama dengan Blackwell, merupakan kemajuan besar dalam teknologi AI. Teknik baru ini secara signifikan meningkatkan jumlah pengguna yang dapat ditangani oleh agen AI secara bersamaan, meningkatkan kapasitas pemrosesan pengguna bersamaan hingga 32 kali lipat pada latency tertentu dibandingkan dengan teknik pemrosesan paralel tradisional.

Efisiensi dekode real-time sistem AI terhambat oleh dua hambatan utama: streaming cache kunci-nilai (KV) dan pemuatan bobot jaringan umpan maju (FFN) dari DRAM. Strategi paralelisasi tradisional kesulitan mengoptimalkan hambatan ini secara bersamaan. Namun, Helix Parallelism memecahkan masalah ini dengan menerapkan strategi sharding hibrida yang memisahkan strategi paralelisasi atensi dan FFN ke dalam alur temporal. Pendekatan ini secara efektif mengatasi tantangan streaming cache KV dan pemuatan hambatan bobot FFN yang muncul saat mendekode konteks dengan jutaan token.

Alur eksekusi Helix Parallelism dirancang untuk memaksimalkan pemanfaatan GPU dan meminimalkan latency. Dengan melakukan sharding cache KV dan menerapkan Tensor Parallelism dengan cara yang menghindari duplikasi antar GPU, Helix mencapai komputasi atensi yang efisien. Strategi ini juga mencakup Helix Overlapped Pipeline Batchwise (HOP-B), sebuah teknik pipelining yang sangat teliti, untuk lebih mengurangi latency antar-token dengan melakukan komunikasi dan komputasi yang tumpang tindih. Pada fase FFN, GPU yang sama digunakan kembali untuk mengeksekusi blok FFN tanpa waktu idle, menunjukkan fleksibilitas dan efisiensi strategi Helix.

Hasil simulasi pada perangkat keras Blackwell NVIDIA menunjukkan bahwa Helix Parallelism menetapkan tolok ukur performa baru dalam dekode model bahasa skala besar (LLM) konteks panjang. Teknik ini mencapai throughput tinggi dengan latency rendah, yang secara signifikan meningkatkan interaksi pengguna dan skalabilitas sistem. Seiring NVIDIA terus menyempurnakan optimasi ini untuk kerangka kerja inferensi, Helix Parallelism merupakan pengembangan yang menjanjikan untuk melayani model AI yang skalabel tanpa mengorbankan performa real-time.

Sumber: Blog Pengembang NVIDIA

Bagikan artikel ini:

Tin tức mới nhất

Simulasi Keamanan Mengungkap Kelemahan Agen Pengkodean AI

13/3/26, 00.00

DryRun Security telah mengungkap penelitian baru yang menunjukkan bahwa agen pengkodean AI, meskipun mempercepat pengembangan perangkat lunak

Baca lebih lanjut

Opinosis Analytics Meluncurkan Alat Kesiapan Integrasi AI

13/3/26, 00.00

West Jordan, UTAH – Menanggapi tantangan yang dihadapi organisasi dalam memanfaatkan kecerdasan buatan, Opinosis Analytics telah memperkenalkan alat diagnostik baru.

Baca lebih lanjut

Entitas Meluncurkan Empat Chip MTIA Baru yang Dioptimalkan dengan AI

13/3/26, 00.00

Entitas tersebut telah mengumumkan rencana ambisius untuk mengembangkan dan menerapkan empat generasi baru chip silikon khusus dalam dua tahun ke depan

Baca lebih lanjut

Inisiatif Kesehatan AI Meningkatkan Layanan Kesehatan di Daerah Terpencil Australia

13/3/26, 00.00

Lanskap perawatan kesehatan Australia akan mendapat manfaat dari inisiatif baru yang bertujuan untuk meningkatkan hasil kesehatan bagi penduduk di daerah terpencil

Baca lebih lanjut

Bagikan artikel ini:

Kategori

Peningkat Gambar AI

Pembuat kode AI

Manajemen tugas AI

Tanpa kode/kode rendah

Generator desain grafis AI

Generator seni/ilustrasi AI

Semua alat

Berita

AI dan hukum/peraturan/masyarakat

Perusahaan/produk/teknologi AI

AI Teknologi Besar

OpenAI/ChatGPT

AI generasi kreatif

AI generasi berbasis teks

AI generatif Jepang

Dasar-dasar AI generatif

Panduan penerapan AI terbaik

Profil perusahaan

Tentang kami

Chính sách quyền riêng tư

Điều khoản sử dụng trang web

Công ty điều hành

Hãy theo dõi chúng tôi

Bahasa

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.

Ikuti kami

Bahasa

Kategori

Semua alat

Manajemen tugas AI

Generator desain grafis AI

Tanpa kode/kode rendah

Pembuat kode AI

Peningkat Gambar AI

Pembuat Seni/Ilustrasi AI

AI dan hukum/sistem/ekonomi/masyarakat

Perusahaan/produk/teknologi AI

AI berteknologi besar

OpenAI/ChatGPT

AI generasi inovatif

AI generasi berbasis teks

AI inovatif Jepang

Dasar-dasar AI generatif

Petunjuk dasar aplikasi AI

Tin tức

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng của trang web

Công ty điều hành

Hồ sơ công ty

Berita terkini

Simulasi Keamanan Mengungkap Kelemahan Agen Pengkodean AI

13/3/26, 00.00

DryRun Security telah mengungkap penelitian baru yang menunjukkan bahwa agen pengkodean AI, meskipun mempercepat pengembangan perangkat lunak

Baca lebih lanjut

Opinosis Analytics Meluncurkan Alat Kesiapan Integrasi AI

13/3/26, 00.00

West Jordan, UTAH – Menanggapi tantangan yang dihadapi organisasi dalam memanfaatkan kecerdasan buatan, Opinosis Analytics telah memperkenalkan alat diagnostik baru.

Baca lebih lanjut

Entitas Meluncurkan Empat Chip MTIA Baru yang Dioptimalkan dengan AI

13/3/26, 00.00

Entitas tersebut telah mengumumkan rencana ambisius untuk mengembangkan dan menerapkan empat generasi baru chip silikon khusus dalam dua tahun ke depan

Baca lebih lanjut

Inisiatif Kesehatan AI Meningkatkan Layanan Kesehatan di Daerah Terpencil Australia

13/3/26, 00.00

Lanskap perawatan kesehatan Australia akan mendapat manfaat dari inisiatif baru yang bertujuan untuk meningkatkan hasil kesehatan bagi penduduk di daerah terpencil

Baca lebih lanjut