Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif

NVIDIA Luncurkan Platform Rubin untuk Meningkatkan Efisiensi AI
Generatived
7/1/26, 00.00
NVIDIA mengumumkan inovasi AI terbarunya, platform Rubin, yang secara signifikan meningkatkan efisiensi dan efektivitas biaya sistem AI. Terdiri dari enam chip baru, platform ini bertujuan untuk mengurangi biaya token inferensi hingga 10 kali lipat dan jumlah GPU yang dibutuhkan untuk melatih Model of Expertise (MoE) hingga 4 kali lipat dibandingkan dengan platform NVIDIA Blackwell. Kemajuan ini diharapkan dapat membuat AI lebih mudah diakses dan mempercepat adopsinya.
Peluncuran platform Rubin sangat tepat waktu mengingat permintaan akan pelatihan dan inferensi komputasi AI yang meningkat pesat. Pendiri dan CEO NVIDIA, Jensen Huang, menyoroti desain bersama (co-design) yang ekstrem dari platform ini, yang terdapat pada enam chip baru, sebagai langkah besar menuju terobosan baru dalam AI. Platform ini dinamai berdasarkan nama Vera Florence Cooper Rubin, seorang astronom Amerika yang telah membuat kemajuan signifikan dalam pemahaman kita tentang alam semesta.
Selain platform Rubin, NVIDIA juga mengumumkan sistem switch Ethernet Photonics NVIDIA Spectrum-X, yang menawarkan efisiensi daya lima kali lebih besar dan waktu operasional yang lebih baik. Selain itu, platform penyimpanan NVIDIA Inference Context Memory yang baru, yang menampilkan prosesor penyimpanan NVIDIA BlueField-4, akan mempercepat inferensi AI berbasis agen. Microsoft sedang bersiap untuk mengintegrasikan sistem skala rak NVIDIA Vera Rubin NVL72 ke dalam Fairwater AI Superfactory generasi berikutnya, yang dapat diskalakan hingga ratusan ribu superchip NVIDIA Vera Rubin.
CoreWeave adalah salah satu perusahaan pertama yang menawarkan platform NVIDIA Rubin, yang dioperasikan melalui CoreWeave Mission Control untuk memastikan fleksibilitas dan kinerja. Selain itu, NVIDIA telah memperluas kolaborasinya dengan Red Hat untuk menghadirkan tumpukan AI komprehensif yang dioptimalkan untuk platform Rubin, termasuk Red Hat Enterprise Linux, Red Hat OpenShift, dan Red Hat AI. Kemitraan ini diharapkan dapat lebih meningkatkan kemampuan dan jangkauan platform tersebut.
Bagikan artikel ini:
Tin tức mới nhất
NVIDIA Umumkan DLSS 4.5, Teknologi RTX, dan Monitor G-SYNC
8/1/26, 00.00
NVIDIA mengumumkan DLSS 4.5 di pameran dagang CES, memperkenalkan peningkatan seperti mode Dynamic Multi- Frame Generation (DMF) dan 6x Multi- Frame Generation (6X MFR).
NVIDIA Umumkan Peningkatan AI untuk GeForce RTX
8/1/26, 00.00
Terobosan besar dalam AI pada komputer pribadi diperkirakan akan berupa peningkatan akurasi model bahasa kecil (SLM) hingga dua kali lipat pada tahun 2025, mendekati kemampuan model bahasa besar (LLM)
NVIDIA Umumkan Penguatan Ekosistem PC AI di CES 2026
8/1/26, 00.00
NVIDIA telah mengumumkan bahwa mereka melihat lonjakan aktivitas pengembang AI di PC, yang didorong oleh peningkatan pada model bahasa kecil dan model difusi seperti FLUX.2 dan GPT-OSS-20B.
Copyright © 2024 Generatived - All right Reserved.
Bagikan artikel ini:
Bagikan artikel ini:
Kategori
Berita
AI dan hukum/peraturan/masyarakat
Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.
Berita terkini
NVIDIA Umumkan DLSS 4.5, Teknologi RTX, dan Monitor G-SYNC
8/1/26, 00.00
NVIDIA mengumumkan DLSS 4.5 di pameran dagang CES, memperkenalkan peningkatan seperti mode Dynamic Multi- Frame Generation (DMF) dan 6x Multi- Frame Generation (6X MFR).
NVIDIA Umumkan Peningkatan AI untuk GeForce RTX
8/1/26, 00.00
Terobosan besar dalam AI pada komputer pribadi diperkirakan akan berupa peningkatan akurasi model bahasa kecil (SLM) hingga dua kali lipat pada tahun 2025, mendekati kemampuan model bahasa besar (LLM)
NVIDIA Umumkan Penguatan Ekosistem PC AI di CES 2026
8/1/26, 00.00
NVIDIA telah mengumumkan bahwa mereka melihat lonjakan aktivitas pengembang AI di PC, yang didorong oleh peningkatan pada model bahasa kecil dan model difusi seperti FLUX.2 dan GPT-OSS-20B.




%20(1).webp)

