NVIDIA Umumkan Teknologi Optimasi AI untuk GPU 2/3867

Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif

NVIDIA Umumkan Teknologi Optimasi AI untuk GPU

Generatived

11/12/25, 00.00

NVIDIA telah mengumumkan serangkaian teknik optimasi model yang bertujuan untuk meningkatkan efisiensi dan skalabilitas penerapan AI pada GPU. Teknik-teknik ini mengatasi kompleksitas model dan arsitektur AI yang semakin meningkat, dengan tujuan untuk meningkatkan kinerja dan total biaya kepemilikan (TCO) sistem AI. Salah satu teknik yang menonjol adalah kuantisasi pasca-pelatihan (PTQ), yang mengompres model yang ada ke dalam format presisi yang lebih rendah, sehingga langsung meningkatkan latency dan throughput.

Teknik kunci lainnya adalah pelatihan sadar kuantisasi (QAT), yang mencakup fase penyempurnaan untuk menyesuaikan model terhadap kesalahan presisi rendah. Teknik ini sangat efektif ketika PTQ saja tidak dapat memenuhi persyaratan akurasi. Selain itu, NVIDIA mengembangkan distilasi sadar kuantisasi (QAD), yang lebih meningkatkan akurasi model dengan menggabungkan kerugian distilasi ke dalam proses pelatihan dan cocok untuk tugas-tugas yang sensitif terhadap penurunan kinerja setelah kuantisasi.

NVIDIA juga menawarkan decoding spekulatif, sebuah teknik yang mempercepat proses pembangkitan dengan mengusulkan beberapa token terlebih dahulu dan memvalidasinya secara paralel. Hal ini mengurangi latency tanpa memodifikasi bobot model. Terakhir, strategi optimasi struktural yang menggabungkan pemangkasan dan distilasi pengetahuan disajikan. Strategi ini tidak hanya mengurangi ukuran model, tetapi juga melatih model yang telah dipangkas untuk meniru perilaku model "guru" yang lebih besar.

Teknik optimasi ini dapat langsung diterapkan dan secara signifikan mengurangi biaya, meningkatkan throughput, dan mempercepat inferensi dalam skala besar untuk tim yang memanfaatkan GPU NVIDIA. Bagi mereka yang tertarik untuk menerapkan optimasi ini, NVIDIA menyediakan deskripsi teknis terperinci, wawasan kinerja, dan panduan Jupyter Notebook untuk memandu pengguna melalui proses tersebut.

Sumber: Blog Pengembang NVIDIA

Bagikan artikel ini:

Tin tức mới nhất

Dokumen pengembangan pembayaran berbasis AI GMO-PG

6/2/26, 00.00

GMO-PG (Shibuya-ku, Tokyo) telah menjadi PSP pertama di Jepang yang membangun infrastruktur dokumentasi untuk lingkungan pengembangan pembayaran yang sesuai dengan era AI.

Baca lebih lanjut

Sansan dan Figma meningkatkan pengalaman pengembangan AI.

6/2/26, 00.00

Figma(Chiyoda-ku, Tokyo) mengumumkan bahwa Sansan (Shibuya-ku, Tokyo) telah memperkenalkan "Figma MCP Server," yang memungkinkan pengalaman pengembangan yang memanfaatkan AI.

Baca lebih lanjut

Sky memperluas AI dengan Google Gemini

6/2/26, 00.00

Sky (lokasi kantor pusat) telah mengadopsi "Gemini Enterprise" milik Google LLC.

Baca lebih lanjut

Intel AI PC Era Baru Ekspansi Jepang 2026

6/2/26, 00.00

Intel (California) menggelar "Intel Connection Japan 2026" untuk memperkenalkan awal era PC berbasis AI dan inisiatif perusahaan.

Baca lebih lanjut

Bagikan artikel ini:

Kategori

Peningkat Gambar AI

Pembuat kode AI

Manajemen tugas AI

Tanpa kode/kode rendah

Generator desain grafis AI

Generator seni/ilustrasi AI

Semua alat

Berita

AI dan hukum/peraturan/masyarakat

Perusahaan/produk/teknologi AI

AI Teknologi Besar

OpenAI/ChatGPT

AI generasi kreatif

AI generasi berbasis teks

AI generatif Jepang

Dasar-dasar AI generatif

Panduan penerapan AI terbaik

Profil perusahaan

Tentang kami

Chính sách quyền riêng tư

Điều khoản sử dụng trang web

Công ty điều hành

Hãy theo dõi chúng tôi

Bahasa

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.

Ikuti kami

Bahasa

Kategori

Semua alat

Manajemen tugas AI

Generator desain grafis AI

Tanpa kode/kode rendah

Pembuat kode AI

Peningkat Gambar AI

Pembuat Seni/Ilustrasi AI

AI dan hukum/sistem/ekonomi/masyarakat

Perusahaan/produk/teknologi AI

AI berteknologi besar

OpenAI/ChatGPT

AI generasi inovatif

AI generasi berbasis teks

AI inovatif Jepang

Dasar-dasar AI generatif

Petunjuk dasar aplikasi AI

Tin tức

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng của trang web

Công ty điều hành

Hồ sơ công ty

Berita terkini

Dokumen pengembangan pembayaran berbasis AI GMO-PG

6/2/26, 00.00

GMO-PG (Shibuya-ku, Tokyo) telah menjadi PSP pertama di Jepang yang membangun infrastruktur dokumentasi untuk lingkungan pengembangan pembayaran yang sesuai dengan era AI.

Baca lebih lanjut

Sansan dan Figma meningkatkan pengalaman pengembangan AI.

6/2/26, 00.00

Figma(Chiyoda-ku, Tokyo) mengumumkan bahwa Sansan (Shibuya-ku, Tokyo) telah memperkenalkan "Figma MCP Server," yang memungkinkan pengalaman pengembangan yang memanfaatkan AI.

Baca lebih lanjut

Sky memperluas AI dengan Google Gemini

6/2/26, 00.00

Sky (lokasi kantor pusat) telah mengadopsi "Gemini Enterprise" milik Google LLC.

Baca lebih lanjut

Intel AI PC Era Baru Ekspansi Jepang 2026

6/2/26, 00.00

Intel (California) menggelar "Intel Connection Japan 2026" untuk memperkenalkan awal era PC berbasis AI dan inisiatif perusahaan.

Baca lebih lanjut