Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif

NVIDIA Research Taiwan Mengumumkan Metode Kompresi Model EoRA
Generatived
11/6/25, 00.00
NVIDIA Research Taiwan telah memperkenalkan pendekatan baru yang difokuskan pada perbaikan kesalahan yang umum ditemui dalam kompresi model. Metode yang disebut EoRA ini secara efektif mengurangi hilangnya akurasi yang terjadi selama kompresi model dengan menambahkan jalur residual peringkat rendah menggunakan aproksimasi peringkat rendah eigenspace. Metode ini sangat efektif untuk model bahasa yang besar, dan mencapai pengoptimalan bebas fine-tuning yang dapat dilakukan dengan cepat dengan data kalibrasi yang minimal.
EoRA mengungguli metode sebelumnya, terutama saat menangani model yang telah mengalami kompresi agresif seperti pemangkasan dan kuantisasi. Dalam pengujian yang melibatkan pembuatan bahasa dan tugas inferensi, EoRA menunjukkan peningkatan yang signifikan. Misalnya, dalam pengujian ARC-Challenge dengan model Llama3-8B yang dipangkas 2:4, metode ini mencapai peningkatan lebih dari 4,5%. Metode ini tetap tangguh bahkan dalam kuantisasi 3/4-bit, meminimalkan kehilangan akurasi dan menunjukkan kepraktisannya dalam berbagai aplikasi.
Proses di balik EoRA adalah memproyeksikan kesalahan terkompresi ke dalam ruang eigen dari aktivasi input setiap lapisan dan menerapkan dekomposisi nilai singular dalam ruang ini, yang memungkinkan kesalahan paling kritis ditangani dengan lebih akurat dan memanfaatkan daya ekspresif peringkat rendah model yang terbatas. Seluruh proses pengoptimalan hanya memerlukan waktu beberapa menit, menjadikan EoRA solusi yang hemat waktu untuk menyempurnakan model terkompresi.
EoRA telah diintegrasikan ke dalam pustaka GPTQModel sumber terbuka, yang memudahkan adopsi dan memungkinkan pengguna untuk meningkatkan kinerja model terkuantisasi dengan mudah. Kemajuan ini diharapkan dapat membantu dalam penerapan jaringan saraf berskala besar yang efisien di berbagai bidang, seperti visi komputer dan Generative AI, sekaligus menjaga keseimbangan antara akurasi model dan efisiensi komputasi. Untuk informasi lebih lanjut tentang EoRA dan aplikasinya, silakan lihat sumber daya yang disediakan oleh NVIDIA.
Bagikan artikel ini:
Tin tức mới nhất
Evri Meningkatkan Layanan Pengiriman Paket dengan Teknologi AI Amazon
18/3/26, 00.00
Evri Group siap meningkatkan layanan pengiriman paketnya dengan menggabungkan teknologi AI dari Amazon Web Services.
NVIDIA Luncurkan Dynamo 1.0 untuk Peningkatan Performa AI
18/3/26, 00.00
NVIDIA telah meluncurkan Dynamo 1.0, sebuah kerangka kerja AI baru yang dirancang untuk meningkatkan kinerja AI generatif dan model penalaran di lingkungan terdistribusi.
NVIDIA Meluncurkan Groq 3 LPX untuk Sistem AI Agenik
18/3/26, 00.00
NVIDIA telah memperkenalkan Groq 3 LPX, akselerator inferensi skala rak baru yang dirancang khusus untuk memenuhi kebutuhan sistem berbasis agen.
Copyright © 2024 Generatived - All right Reserved.
Bagikan artikel ini:
Bagikan artikel ini:
Kategori
Berita
AI dan hukum/peraturan/masyarakat
Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.
Berita terkini
Evri Meningkatkan Layanan Pengiriman Paket dengan Teknologi AI Amazon
18/3/26, 00.00
Evri Group siap meningkatkan layanan pengiriman paketnya dengan menggabungkan teknologi AI dari Amazon Web Services.
NVIDIA Luncurkan Dynamo 1.0 untuk Peningkatan Performa AI
18/3/26, 00.00
NVIDIA telah meluncurkan Dynamo 1.0, sebuah kerangka kerja AI baru yang dirancang untuk meningkatkan kinerja AI generatif dan model penalaran di lingkungan terdistribusi.
NVIDIA Meluncurkan Groq 3 LPX untuk Sistem AI Agenik
18/3/26, 00.00
NVIDIA telah memperkenalkan Groq 3 LPX, akselerator inferensi skala rak baru yang dirancang khusus untuk memenuhi kebutuhan sistem berbasis agen.



%20(1).webp)


