top of page
Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif
logo.png

NVIDIA Merilis Model Kuantisasi Nemotron Ultra NVFP4

Generatived

29/6/26, 00.00

NVIDIA mengumumkan checkpoint NVFP4 untuk model Nemotron 3 Ultra dengan 550B parameter, yang dirancang untuk meningkatkan throughput inferensi sambil mempertahankan akurasi yang mendekati versi BF16 asli dan secara signifikan mengurangi kebutuhan memori.

Perusahaan tersebut mengatakan bahwa checkpoint tersebut dibuat dengan NVIDIA Model Optimizer menggunakan teknik termasuk Four-over-Six scaling dan AutoQuantize. Model tersebut secara otomatis berjalan sebagai W4A4 pada GPU Blackwell dan W4A16 pada perangkat keras Hopper.

Alur kerja ini juga mendukung kuantisasi terdistribusi dengan Megatron-LM, mengurangi waktu kalibrasi di seluruh penerapan multi-GPU. Pengembang dapat menyesuaikan perilaku kuantisasi melalui resep YAML atau preset konfigurasi bawaan untuk berbagai kebutuhan penerapan.

NVIDIA menambahkan bahwa pipeline kuantisasi, resep sumber terbuka, laporan teknis, dan checkpoint NVFP4 tersedia melalui GitHub dan Hugging Face, memungkinkan pengembang untuk menerapkan proses yang sama pada model bahasa besar mereka sendiri.

Bagikan artikel ini:

Tin tức mới nhất
CyberAgent Merilis Alat Analisis Intervensi Manusia Berbasis AI

CyberAgent Merilis Alat Analisis Intervensi Manusia Berbasis AI

1/7/26, 00.00

CyberAgent mengumumkan peluncuran hitl-harness-improver, sebuah alat GitHub yang menganalisis riwayat eksekusi agen pengkodean untuk mengukur interaksi Manusia-dalam-Loop

Google Menjelaskan Strategi Pengembangan AI Full-Stack

Google Menjelaskan Strategi Pengembangan AI Full-Stack

1/7/26, 00.00

Google memaparkan strategi AI full-stack-nya melalui wawancara dengan Richard Seroter, pemimpin pengalaman pengembang Google Cloud

Microsoft Memperingatkan Kampanye Penipuan Ekstensi Perplexity AI

Microsoft Memperingatkan Kampanye Penipuan Ekstensi Perplexity AI

1/7/26, 00.00

Microsoft mengungkap adanya ekstensi peramban Chromium berbahaya yang menyamar sebagai Perplexity AI yang mencegat pencarian peramban sebelum mengarahkan pengguna

NVIDIA menghadirkan Claude ke platform Azure Foundry.

NVIDIA menghadirkan Claude ke platform Azure Foundry.

1/7/26, 00.00

NVIDIA mengumumkan ketersediaan umum model Claude dari Anthropic di Microsoft Foundry.

Copyright © 2024 Generatived - All right Reserved.

Bagikan artikel ini:

Bagikan artikel ini:

Generatived

Hãy theo dõi chúng tôi

  • Facebook
  • X

Bahasa

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Generatived AI Logo

Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.

  • Facebook
  • X

Ikuti kami

Bahasa

Berita terkini
CyberAgent Merilis Alat Analisis Intervensi Manusia Berbasis AI

CyberAgent Merilis Alat Analisis Intervensi Manusia Berbasis AI

1/7/26, 00.00

CyberAgent mengumumkan peluncuran hitl-harness-improver, sebuah alat GitHub yang menganalisis riwayat eksekusi agen pengkodean untuk mengukur interaksi Manusia-dalam-Loop

Google Menjelaskan Strategi Pengembangan AI Full-Stack

Google Menjelaskan Strategi Pengembangan AI Full-Stack

1/7/26, 00.00

Google memaparkan strategi AI full-stack-nya melalui wawancara dengan Richard Seroter, pemimpin pengalaman pengembang Google Cloud

Microsoft Memperingatkan Kampanye Penipuan Ekstensi Perplexity AI

Microsoft Memperingatkan Kampanye Penipuan Ekstensi Perplexity AI

1/7/26, 00.00

Microsoft mengungkap adanya ekstensi peramban Chromium berbahaya yang menyamar sebagai Perplexity AI yang mencegat pencarian peramban sebelum mengarahkan pengguna

NVIDIA menghadirkan Claude ke platform Azure Foundry.

NVIDIA menghadirkan Claude ke platform Azure Foundry.

1/7/26, 00.00

NVIDIA mengumumkan ketersediaan umum model Claude dari Anthropic di Microsoft Foundry.

bottom of page