top of page
Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif
logo.png

NVIDIA Umumkan NVFP4 untuk Enhance AI

Generatived

10/2/26, 00.00

NVIDIA secara aktif mengejar desain bersama yang ekstrem untuk memenuhi permintaan yang terus meningkat akan kinerja komputasi AI dengan kecepatan yang melampaui kemajuan yang diprediksi oleh Hukum Moore. Dengan mendesain di berbagai chip dan lingkungan perangkat lunak yang luas, NVIDIA bertujuan untuk secara signifikan meningkatkan kinerja dan efisiensi pabrik AI. Pengenalan format AI presisi rendah seperti NVFP4 merupakan inti dari strategi ini, meningkatkan kinerja komputasi dan efisiensi energi sambil mempertahankan akurasi yang tinggi.

Format NVFP4, yang terdapat pada GPU NVIDIA mulai dari seri Blackwell dan seterusnya, menawarkan manfaat presisi floating-point 4-bit. Inovasi ini tidak hanya mempertahankan akurasi yang sebanding dengan format presisi tinggi, tetapi juga memberikan peningkatan kinerja yang dramatis dalam pelatihan dan inferensi AI. Misalnya, GPU Blackwell Ultra mencapai throughput NVFP4 hingga 15 petaFLOPS, memberikan kinerja tiga kali lipat dari presisi FP8 pada perangkat keras yang sama. Peningkatan ini melampaui spesifikasi puncak teoretis dan terlihat jelas dalam kinerja dunia nyata untuk beban kerja pelatihan dan inferensi.

Komitmen NVIDIA terhadap akurasi dengan NVFP4 ditunjukkan oleh berbagai keberhasilannya dalam divisi tertutup dari benchmark pelatihan dan inferensi MLPerf. Benchmark ini mengharuskan model untuk memenuhi ambang batas akurasi tertentu, dan pengajuan NVIDIA menggunakan NVFP4 pada GPU Blackwell dan Blackwell Ultra memenuhi standar ketat ini untuk berbagai model bahasa skala besar. Pencapaian ini menunjukkan kemampuan NVFP4 untuk memberikan akurasi tinggi dalam evaluasi standar industri.

Format NVFP4 semakin banyak diadopsi di ekosistem yang lebih luas, berkat dukungan dari pustaka dan kerangka kerja yang memungkinkan pengembang untuk mengkuantisasi model mereka ke NVFP4 sambil mempertahankan akurasi. Adopsi yang meluas ini mendorong peningkatan throughput inferensi di lingkungan produksi untuk berbagai model. Perusahaan seperti Black Forest Labs, Radical Numerics, Cognition, dan Red Hat memanfaatkan NVFP4 untuk meningkatkan kinerja dan efisiensi dalam penerapan AI. NVIDIA terus berinovasi dan berkolaborasi dengan ekosistem untuk memperluas manfaat pelatihan NVFP4 dan meletakkan dasar bagi pengembangan model AI yang lebih cerdas dan kompleks.

Bagikan artikel ini:

Tin tức mới nhất
AP Communications memulai dukungan perekrutan berbasis AI.

AP Communications memulai dukungan perekrutan berbasis AI.

10/2/26, 00.00

AP Communications (Chiyoda-ku, Tokyo) telah memperkenalkan "exaBase Recruitment Assistant" yang disediakan oleh Exa Enterprise AI (Minato-ku, Tokyo), sebuah perusahaan grup dari ExaWizards.

DATUM STUDIO Snowflake sertifikasi ELITE tingkat tertinggi

DATUM STUDIO Snowflake sertifikasi ELITE tingkat tertinggi

10/2/26, 00.00

DATUM STUDIO (Meguro-ku, Tokyo) mengumumkan bahwa mereka telah disertifikasi sebagai mitra layanan cloud data AI "ELITE" tingkat tertinggi dari Snowflake.

GBP Mendirikan Divisi Pengukuran Daya Pusat Data AI Baru

GBP Mendirikan Divisi Pengukuran Daya Pusat Data AI Baru

10/2/26, 00.00

GBP (Tokyo) telah membentuk divisi baru yang khusus menangani masalah pasokan daya untuk pusat data di era AI.

Penerjemahan AI simultan secara signifikan mengurangi waktu pengiriman.

Penerjemahan AI simultan secara signifikan mengurangi waktu pengiriman.

10/2/26, 00.00

Simul (Chuo-ku, Tokyo) mengumumkan akan meluncurkan layanan baru, "Layanan Terjemahan AI Presentasi," pada Februari 2026.

Copyright © 2024 Generatived - All right Reserved.

Bagikan artikel ini:

Bagikan artikel ini:

Generatived

Hãy theo dõi chúng tôi

  • Facebook
  • X

Bahasa

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Generatived AI Logo

Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.

  • Facebook
  • X

Ikuti kami

Bahasa

Berita terkini
AP Communications memulai dukungan perekrutan berbasis AI.

AP Communications memulai dukungan perekrutan berbasis AI.

10/2/26, 00.00

AP Communications (Chiyoda-ku, Tokyo) telah memperkenalkan "exaBase Recruitment Assistant" yang disediakan oleh Exa Enterprise AI (Minato-ku, Tokyo), sebuah perusahaan grup dari ExaWizards.

DATUM STUDIO Snowflake sertifikasi ELITE tingkat tertinggi

DATUM STUDIO Snowflake sertifikasi ELITE tingkat tertinggi

10/2/26, 00.00

DATUM STUDIO (Meguro-ku, Tokyo) mengumumkan bahwa mereka telah disertifikasi sebagai mitra layanan cloud data AI "ELITE" tingkat tertinggi dari Snowflake.

GBP Mendirikan Divisi Pengukuran Daya Pusat Data AI Baru

GBP Mendirikan Divisi Pengukuran Daya Pusat Data AI Baru

10/2/26, 00.00

GBP (Tokyo) telah membentuk divisi baru yang khusus menangani masalah pasokan daya untuk pusat data di era AI.

Penerjemahan AI simultan secara signifikan mengurangi waktu pengiriman.

Penerjemahan AI simultan secara signifikan mengurangi waktu pengiriman.

10/2/26, 00.00

Simul (Chuo-ku, Tokyo) mengumumkan akan meluncurkan layanan baru, "Layanan Terjemahan AI Presentasi," pada Februari 2026.

bottom of page