Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif

NVIDIA Merilis Model Kuantisasi Nemotron Ultra NVFP4
Generatived
29/6/26, 00.00
NVIDIA mengumumkan checkpoint NVFP4 untuk model Nemotron 3 Ultra dengan 550B parameter, yang dirancang untuk meningkatkan throughput inferensi sambil mempertahankan akurasi yang mendekati versi BF16 asli dan secara signifikan mengurangi kebutuhan memori.
Perusahaan tersebut mengatakan bahwa checkpoint tersebut dibuat dengan NVIDIA Model Optimizer menggunakan teknik termasuk Four-over-Six scaling dan AutoQuantize. Model tersebut secara otomatis berjalan sebagai W4A4 pada GPU Blackwell dan W4A16 pada perangkat keras Hopper.
Alur kerja ini juga mendukung kuantisasi terdistribusi dengan Megatron-LM, mengurangi waktu kalibrasi di seluruh penerapan multi-GPU. Pengembang dapat menyesuaikan perilaku kuantisasi melalui resep YAML atau preset konfigurasi bawaan untuk berbagai kebutuhan penerapan.
NVIDIA menambahkan bahwa pipeline kuantisasi, resep sumber terbuka, laporan teknis, dan checkpoint NVFP4 tersedia melalui GitHub dan Hugging Face, memungkinkan pengembang untuk menerapkan proses yang sama pada model bahasa besar mereka sendiri.
Bagikan artikel ini:
Tin tức mới nhất
CyberAgent Merilis Alat Analisis Intervensi Manusia Berbasis AI
1/7/26, 00.00
CyberAgent mengumumkan peluncuran hitl-harness-improver, sebuah alat GitHub yang menganalisis riwayat eksekusi agen pengkodean untuk mengukur interaksi Manusia-dalam-Loop
Google Menjelaskan Strategi Pengembangan AI Full-Stack
1/7/26, 00.00
Google memaparkan strategi AI full-stack-nya melalui wawancara dengan Richard Seroter, pemimpin pengalaman pengembang Google Cloud
Microsoft Memperingatkan Kampanye Penipuan Ekstensi Perplexity AI
1/7/26, 00.00
Microsoft mengungkap adanya ekstensi peramban Chromium berbahaya yang menyamar sebagai Perplexity AI yang mencegat pencarian peramban sebelum mengarahkan pengguna
Copyright © 2024 Generatived - All right Reserved.
Bagikan artikel ini:
Bagikan artikel ini:
Kategori
Berita
AI dan hukum/peraturan/masyarakat
Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.
Berita terkini
CyberAgent Merilis Alat Analisis Intervensi Manusia Berbasis AI
1/7/26, 00.00
CyberAgent mengumumkan peluncuran hitl-harness-improver, sebuah alat GitHub yang menganalisis riwayat eksekusi agen pengkodean untuk mengukur interaksi Manusia-dalam-Loop
Google Menjelaskan Strategi Pengembangan AI Full-Stack
1/7/26, 00.00
Google memaparkan strategi AI full-stack-nya melalui wawancara dengan Richard Seroter, pemimpin pengalaman pengembang Google Cloud
Microsoft Memperingatkan Kampanye Penipuan Ekstensi Perplexity AI
1/7/26, 00.00
Microsoft mengungkap adanya ekstensi peramban Chromium berbahaya yang menyamar sebagai Perplexity AI yang mencegat pencarian peramban sebelum mengarahkan pengguna



%20(1).webp)


