NVIDIA Research Taiwan Mengumumkan Metode Kompresi Model EoRA

Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif

NVIDIA Research Taiwan Mengumumkan Metode Kompresi Model EoRA

Generatived

11/6/25, 00.00

NVIDIA Research Taiwan telah memperkenalkan pendekatan baru yang difokuskan pada perbaikan kesalahan yang umum ditemui dalam kompresi model. Metode yang disebut EoRA ini secara efektif mengurangi hilangnya akurasi yang terjadi selama kompresi model dengan menambahkan jalur residual peringkat rendah menggunakan aproksimasi peringkat rendah eigenspace. Metode ini sangat efektif untuk model bahasa yang besar, dan mencapai pengoptimalan bebas fine-tuning yang dapat dilakukan dengan cepat dengan data kalibrasi yang minimal.

EoRA mengungguli metode sebelumnya, terutama saat menangani model yang telah mengalami kompresi agresif seperti pemangkasan dan kuantisasi. Dalam pengujian yang melibatkan pembuatan bahasa dan tugas inferensi, EoRA menunjukkan peningkatan yang signifikan. Misalnya, dalam pengujian ARC-Challenge dengan model Llama3-8B yang dipangkas 2:4, metode ini mencapai peningkatan lebih dari 4,5%. Metode ini tetap tangguh bahkan dalam kuantisasi 3/4-bit, meminimalkan kehilangan akurasi dan menunjukkan kepraktisannya dalam berbagai aplikasi.

Proses di balik EoRA adalah memproyeksikan kesalahan terkompresi ke dalam ruang eigen dari aktivasi input setiap lapisan dan menerapkan dekomposisi nilai singular dalam ruang ini, yang memungkinkan kesalahan paling kritis ditangani dengan lebih akurat dan memanfaatkan daya ekspresif peringkat rendah model yang terbatas. Seluruh proses pengoptimalan hanya memerlukan waktu beberapa menit, menjadikan EoRA solusi yang hemat waktu untuk menyempurnakan model terkompresi.

EoRA telah diintegrasikan ke dalam pustaka GPTQModel sumber terbuka, yang memudahkan adopsi dan memungkinkan pengguna untuk meningkatkan kinerja model terkuantisasi dengan mudah. Kemajuan ini diharapkan dapat membantu dalam penerapan jaringan saraf berskala besar yang efisien di berbagai bidang, seperti visi komputer dan Generative AI, sekaligus menjaga keseimbangan antara akurasi model dan efisiensi komputasi. Untuk informasi lebih lanjut tentang EoRA dan aplikasinya, silakan lihat sumber daya yang disediakan oleh NVIDIA.

Sumber: Blog Pengembang NVIDIA

Bagikan artikel ini:

Tin tức mới nhất

Evri Meningkatkan Layanan Pengiriman Paket dengan Teknologi AI Amazon

18/3/26, 00.00

Evri Group siap meningkatkan layanan pengiriman paketnya dengan menggabungkan teknologi AI dari Amazon Web Services.

Baca lebih lanjut

NVIDIA Luncurkan Dynamo 1.0 untuk Peningkatan Performa AI

18/3/26, 00.00

NVIDIA telah meluncurkan Dynamo 1.0, sebuah kerangka kerja AI baru yang dirancang untuk meningkatkan kinerja AI generatif dan model penalaran di lingkungan terdistribusi.

Baca lebih lanjut

NVIDIA Meluncurkan Groq 3 LPX untuk Sistem AI Agenik

18/3/26, 00.00

NVIDIA telah memperkenalkan Groq 3 LPX, akselerator inferensi skala rak baru yang dirancang khusus untuk memenuhi kebutuhan sistem berbasis agen.

Baca lebih lanjut

Microsoft Memperluas Platform AI dengan Kolaborasi NVIDIA

18/3/26, 00.00

Microsoft telah mengumumkan perluasan kemampuan AI-nya melalui kolaborasi dengan NVIDIA

Baca lebih lanjut

Bagikan artikel ini:

Kategori

Peningkat Gambar AI

Pembuat kode AI

Manajemen tugas AI

Tanpa kode/kode rendah

Generator desain grafis AI

Generator seni/ilustrasi AI

Semua alat

Berita

AI dan hukum/peraturan/masyarakat

Perusahaan/produk/teknologi AI

AI Teknologi Besar

OpenAI/ChatGPT

AI generasi kreatif

AI generasi berbasis teks

AI generatif Jepang

Dasar-dasar AI generatif

Panduan penerapan AI terbaik

Profil perusahaan

Tentang kami

Chính sách quyền riêng tư

Điều khoản sử dụng trang web

Công ty điều hành

Hãy theo dõi chúng tôi

Bahasa

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.

Ikuti kami

Bahasa

Kategori

Semua alat

Manajemen tugas AI

Generator desain grafis AI

Tanpa kode/kode rendah

Pembuat kode AI

Peningkat Gambar AI

Pembuat Seni/Ilustrasi AI

AI dan hukum/sistem/ekonomi/masyarakat

Perusahaan/produk/teknologi AI

AI berteknologi besar

OpenAI/ChatGPT

AI generasi inovatif

AI generasi berbasis teks

AI inovatif Jepang

Dasar-dasar AI generatif

Petunjuk dasar aplikasi AI

Tin tức

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng của trang web

Công ty điều hành

Hồ sơ công ty

Berita terkini

Evri Meningkatkan Layanan Pengiriman Paket dengan Teknologi AI Amazon

18/3/26, 00.00

Evri Group siap meningkatkan layanan pengiriman paketnya dengan menggabungkan teknologi AI dari Amazon Web Services.

Baca lebih lanjut

NVIDIA Luncurkan Dynamo 1.0 untuk Peningkatan Performa AI

18/3/26, 00.00

NVIDIA telah meluncurkan Dynamo 1.0, sebuah kerangka kerja AI baru yang dirancang untuk meningkatkan kinerja AI generatif dan model penalaran di lingkungan terdistribusi.

Baca lebih lanjut

NVIDIA Meluncurkan Groq 3 LPX untuk Sistem AI Agenik

18/3/26, 00.00

NVIDIA telah memperkenalkan Groq 3 LPX, akselerator inferensi skala rak baru yang dirancang khusus untuk memenuhi kebutuhan sistem berbasis agen.

Baca lebih lanjut

Microsoft Memperluas Platform AI dengan Kolaborasi NVIDIA

18/3/26, 00.00

Microsoft telah mengumumkan perluasan kemampuan AI-nya melalui kolaborasi dengan NVIDIA

Baca lebih lanjut