NVIDIA Umumkan Dynamic-CP untuk Pelatihan LLM yang Efisien 10/3958

Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif

NVIDIA Umumkan Dynamic-CP untuk Pelatihan LLM yang Efisien

Generatived

30/1/26, 00.00

NVIDIA telah memperkenalkan teknik penjadwalan baru yang disebut Dynamic Context Parallelism (Dynamic-CP) ke dalam kerangka kerja Megatron Core-nya, yang dirancang untuk meningkatkan efisiensi pelatihan model bahasa skala besar (LLM) dan pembuatan video skala besar. Teknik ini secara dinamis menyesuaikan ukuran paralelisme konteks (CP) dari setiap mikro-batch, memungkinkan pemrosesan yang lebih efisien dari urutan dengan panjang variabel yang umum ditemukan dalam dataset dunia nyata. Implementasi Dynamic-CP menunjukkan peningkatan kecepatan hingga 1,48x pada dataset tersebut, menunjukkan potensinya dalam mengoptimalkan sumber daya komputasi.

Tantangan dalam melatih model skala besar terletak pada variabilitas panjang sekuens dalam data, yang dapat menyebabkan hambatan komputasi. Teknik tradisional seperti pengemasan tingkat sampel mencoba mengatasi masalah ini dengan mengemas sekuens pendek ke dalam satu mikro-batch. Namun, sifat kuadratik dari perhatian produk titik dapat menyebabkan ketidakseimbangan beban kerja komputasi dan GPU yang menganggur. Dynamic-CP mengatasi masalah ini dengan menyesuaikan ukuran CP agar sesuai dengan sekuens yang dikemas, mengurangi inefisiensi komputasi, dan meningkatkan pemanfaatan sumber daya.

Dynamic-CP bekerja dengan memilih ukuran CP yang sesuai untuk setiap micro-batch berdasarkan strategi pengemasan optimal yang ditentukan oleh solver. Solver mempertimbangkan urutan dengan panjang variabel dan menghitung pengemasan dan ukuran CP yang paling efisien sambil tetap memperhatikan batasan memori GPU. Solver bertujuan untuk mengurangi ketidakseimbangan paralelisme data dan inefisiensi CP dengan memodelkan biaya komputasi dan komunikasi. Pendekatan dinamis ini berbeda dengan metode statis, yang menetapkan ukuran CP berdasarkan urutan terpanjang dalam batch, yang seringkali menimbulkan overhead komunikasi CP yang tidak perlu.

Kerangka kerja Megatron Core telah dimodifikasi untuk mendukung Dynamic-CP. Ini melibatkan pembuatan beberapa grup CP per rank dan memperkenalkan data_iterator_wrapper yang ringan untuk mengelola penjadwalan ulang dinamis dan pengemasan data. Pendekatan ini meminimalkan perubahan pada logika penjadwalan yang ada dan memastikan eksekusi yang konsisten di seluruh tahapan pipeline. Manfaat Dynamic-CP terlihat jelas dalam kemampuannya untuk mengurangi gelembung pipeline dan ketidakseimbangan paralel data, secara signifikan meningkatkan kinerja pelatihan model. Repositori GitHub Megatron Core menyediakan sumber daya bagi mereka yang tertarik menggunakan optimasi ini untuk melatih model dengan urutan panjang variabel.

Sumber: Blog Pengembang NVIDIA

Bagikan artikel ini:

Tin tức mới nhất

Zscaler Meluncurkan Rangkaian Solusi Keamanan AI untuk Perusahaan

29/1/26, 00.00

SAN JOSE, California – Zscaler, Inc., pemimpin dalam keamanan cloud, hari ini mengumumkan inovasi keamanan AI baru untuk membantu perusahaan mengamankan penerapan AI mereka

Baca lebih lanjut

FastGen Umumkan Pustaka Akselerasi Model Difusi AI

29/1/26, 00.00

Kemajuan terkini dalam Generative AI telah mengarah pada pengembangan model difusi skala besar yang dapat menghasilkan keluaran berkualitas tinggi dan beragam

Baca lebih lanjut

Google meluncurkan Gemini 3, menghadirkan pencarian AI intuitif ke pasar.

29/1/26, 00.00

Peningkatan terbaru pada fitur Pencarian bertujuan untuk memberikan pengalaman AI yang lebih intuitif dan komunikatif kepada pengguna.

Baca lebih lanjut

Meta Bermitra dengan Corning untuk Ekspansi Serat Optik

29/1/26, 00.00

Meta telah menandatangani kemitraan besar dengan Corning, berkomitmen untuk berinvestasi hingga $6 miliar selama beberapa tahun untuk memperkuat infrastruktur pusat datanya dengan kabel serat optik.

Baca lebih lanjut

Bagikan artikel ini:

Kategori

Peningkat Gambar AI

Pembuat kode AI

Manajemen tugas AI

Tanpa kode/kode rendah

Generator desain grafis AI

Generator seni/ilustrasi AI

Semua alat

Berita

AI dan hukum/peraturan/masyarakat

Perusahaan/produk/teknologi AI

AI Teknologi Besar

OpenAI/ChatGPT

AI generasi kreatif

AI generasi berbasis teks

AI generatif Jepang

Dasar-dasar AI generatif

Panduan penerapan AI terbaik

Profil perusahaan

Tentang kami

Chính sách quyền riêng tư

Điều khoản sử dụng trang web

Công ty điều hành

Hãy theo dõi chúng tôi

Bahasa

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.

Ikuti kami

Bahasa

Kategori

Semua alat

Manajemen tugas AI

Generator desain grafis AI

Tanpa kode/kode rendah

Pembuat kode AI

Peningkat Gambar AI

Pembuat Seni/Ilustrasi AI

AI dan hukum/sistem/ekonomi/masyarakat

Perusahaan/produk/teknologi AI

AI berteknologi besar

OpenAI/ChatGPT

AI generasi inovatif

AI generasi berbasis teks

AI inovatif Jepang

Dasar-dasar AI generatif

Petunjuk dasar aplikasi AI

Tin tức

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng của trang web

Công ty điều hành

Hồ sơ công ty

Berita terkini

Zscaler Meluncurkan Rangkaian Solusi Keamanan AI untuk Perusahaan

29/1/26, 00.00

SAN JOSE, California – Zscaler, Inc., pemimpin dalam keamanan cloud, hari ini mengumumkan inovasi keamanan AI baru untuk membantu perusahaan mengamankan penerapan AI mereka

Baca lebih lanjut

FastGen Umumkan Pustaka Akselerasi Model Difusi AI

29/1/26, 00.00

Kemajuan terkini dalam Generative AI telah mengarah pada pengembangan model difusi skala besar yang dapat menghasilkan keluaran berkualitas tinggi dan beragam

Baca lebih lanjut

Google meluncurkan Gemini 3, menghadirkan pencarian AI intuitif ke pasar.

29/1/26, 00.00

Peningkatan terbaru pada fitur Pencarian bertujuan untuk memberikan pengalaman AI yang lebih intuitif dan komunikatif kepada pengguna.

Baca lebih lanjut

Meta Bermitra dengan Corning untuk Ekspansi Serat Optik

29/1/26, 00.00

Meta telah menandatangani kemitraan besar dengan Corning, berkomitmen untuk berinvestasi hingga $6 miliar selama beberapa tahun untuk memperkuat infrastruktur pusat datanya dengan kabel serat optik.

Baca lebih lanjut