top of page
Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif
logo.png

NVIDIA Blackwell Ultra mendukung sistem AI skala besar

Generatived

20/3/25, 04.00

NVIDIA mengumumkan Blackwell Ultra, platform komputasi berkecepatan tinggi baru yang dirancang untuk memenuhi permintaan inferensi AI yang terus meningkat, termasuk penskalaan selama pelatihan, pasca pelatihan, dan pengujian. Platform ini akan didukung oleh sistem NVIDIA GB300 NVL72, yang dilengkapi solusi skala rak berpendingin cairan yang menggabungkan 36 CPU NVIDIA Grace dan 72 GPU Blackwell Ultra. Sistem ini menawarkan bandwidth NVLink sebesar 130 TB/dtk yang mengesankan, menjadikannya sebagai solusi canggih untuk inferensi AI skala besar.

Platform Blackwell Ultra menjanjikan peningkatan kinerja inferensi AI yang penting untuk sistem AI multi-agen secara real-time dan inferensi konteks panjang. Blackwell Ultra Tensor Cores baru secara signifikan meningkatkan FLOPS komputasi AI, dengan model GB300 NVL72 menghadirkan AI FLOPS hingga 70x lebih banyak dibandingkan model sebelumnya. Peningkatan kinerja ini didukung oleh memori HBM3e hingga 288 GB per GPU dan memori koheren berkecepatan tinggi hingga 40 TB per rak untuk menangani model besar dan tugas kompleks secara bersamaan.

Untuk mengoptimalkan kinerja inferensi multi-node berskala besar, Blackwell Ultra dilengkapi konektivitas PCIe Gen6 dan NVIDIA ConnectX-8 800G SuperNIC yang menskalakan bandwidth jaringan hingga 800 Gb/s. Hal ini dilengkapi dengan NVIDIA Dynamo, perpustakaan sumber terbuka yang dirancang untuk meningkatkan layanan AI inferensi di seluruh node GPU. Integrasi dengan platform jaringan NVIDIA Quantum-X800 dan NVIDIA Spectrum-X memungkinkan pabrik AI dan pusat data cloud mengelola tuntutan beban kerja secara efisien yang ditentukan oleh tiga undang-undang penskalaan.

GB300 NVL72 dari NVIDIA diharapkan dapat meningkatkan output pabrik AI secara signifikan, dengan token throughput per detik per pengguna 10x lebih tinggi dan token throughput 5x lebih tinggi per detik per megawatt. Efek gabungan ini berpotensi meningkatkan kinerja output keseluruhan pabrik AI Anda sebanyak 50 kali lipat. Produk Blackwell Ultra diharapkan akan tersedia dari mitra pada akhir tahun 2025 dengan dukungan dari penyedia layanan cloud dan produsen server terkemuka.

Bagikan artikel ini:

Tin tức mới nhất
ROUTE06 mengembangkan AI dan memperkenalkan Newgin untuk mengurangi biaya.

ROUTE06 mengembangkan AI dan memperkenalkan Newgin untuk mengurangi biaya.

8/1/26, 00.00

Acsim, sebuah AI definisi persyaratan yang dikembangkan oleh ROUTE06 (Chiyoda-ku, Tokyo), telah diadopsi oleh Newgin Holdings (Nagoya, Prefektur Aichi).

Percobaan demonstrasi layanan respons Grapher AI

Percobaan demonstrasi layanan respons Grapher AI

8/1/26, 00.00

Grapher (Shibuya-ku, Tokyo) mengumumkan bahwa Distrik Minato (Minato-ku, Tokyo) telah memulai percobaan demonstrasi layanan penjawab telepon menggunakan agen AI.

Aurora Mobile Bermitra dengan Echosen China untuk AI di Bidang Kesehatan

Aurora Mobile Bermitra dengan Echosen China untuk AI di Bidang Kesehatan

8/1/26, 00.00

Aurora Mobile telah mengumumkan kemitraan strategis dengan Echosens China untuk mempromosikan penggunaan teknologi medis di sektor perawatan kesehatan.

i10X mengamankan pendanaan sebesar $1 juta untuk memperluas platform AI-nya.

i10X mengamankan pendanaan sebesar $1 juta untuk memperluas platform AI-nya.

8/1/26, 00.00

SINGAPURA – i10X, penyedia platform AI terintegrasi, telah mengumpulkan pendanaan pra-awal sebesar US$1 juta untuk memajukan pengembangan produk, infrastruktur, dan perluasan timnya.

Copyright © 2024 Generatived - All right Reserved.

Bagikan artikel ini:

Bagikan artikel ini:

Generatived

Hãy theo dõi chúng tôi

  • Facebook
  • X

Bahasa

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Generatived AI Logo

Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.

  • Facebook
  • X

Ikuti kami

Bahasa

Berita terkini
ROUTE06 mengembangkan AI dan memperkenalkan Newgin untuk mengurangi biaya.

ROUTE06 mengembangkan AI dan memperkenalkan Newgin untuk mengurangi biaya.

8/1/26, 00.00

Acsim, sebuah AI definisi persyaratan yang dikembangkan oleh ROUTE06 (Chiyoda-ku, Tokyo), telah diadopsi oleh Newgin Holdings (Nagoya, Prefektur Aichi).

Percobaan demonstrasi layanan respons Grapher AI

Percobaan demonstrasi layanan respons Grapher AI

8/1/26, 00.00

Grapher (Shibuya-ku, Tokyo) mengumumkan bahwa Distrik Minato (Minato-ku, Tokyo) telah memulai percobaan demonstrasi layanan penjawab telepon menggunakan agen AI.

Aurora Mobile Bermitra dengan Echosen China untuk AI di Bidang Kesehatan

Aurora Mobile Bermitra dengan Echosen China untuk AI di Bidang Kesehatan

8/1/26, 00.00

Aurora Mobile telah mengumumkan kemitraan strategis dengan Echosens China untuk mempromosikan penggunaan teknologi medis di sektor perawatan kesehatan.

i10X mengamankan pendanaan sebesar $1 juta untuk memperluas platform AI-nya.

i10X mengamankan pendanaan sebesar $1 juta untuk memperluas platform AI-nya.

8/1/26, 00.00

SINGAPURA – i10X, penyedia platform AI terintegrasi, telah mengumpulkan pendanaan pra-awal sebesar US$1 juta untuk memajukan pengembangan produk, infrastruktur, dan perluasan timnya.

bottom of page