Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif

NVIDIA Luncurkan Dynamo 1.0 untuk Peningkatan Performa AI
Generatived
18/3/26, 00.00
NVIDIA telah meluncurkan Dynamo 1.0, sebuah kerangka kerja AI baru yang dirancang untuk meningkatkan kinerja AI generatif dan model penalaran di lingkungan terdistribusi. Platform ini dirancang untuk menyediakan inferensi terdistribusi dengan latensi rendah dan throughput tinggi, mendukung penerapan AI multi-node tingkat produksi. Dynamo kompatibel dengan berbagai mesin inferensi sumber terbuka dan telah menunjukkan hasil yang mengesankan dalam benchmark, termasuk MLPerf dan SemiAnalysis InferenceX, di mana ia meningkatkan penanganan permintaan hingga tujuh kali lipat pada platform Blackwell NVIDIA.
Perusahaan tersebut melaporkan bahwa Dynamo telah berhasil diintegrasikan ke dalam alur kerja produksi oleh banyak organisasi, menunjukkan kemampuannya untuk meningkatkan inferensi multi-node, mengoptimalkan throughput, dan mengurangi latency. Kerangka kerja ini juga telah diadopsi oleh penyedia cloud utama, memungkinkan penerapan yang lancar di lingkungan Kubernetes terkelola. Kerangka kerja sumber terbuka telah menggunakan komponen Dynamo untuk mempercepat proses-proses penting, dan kontribusi dari komunitas AI telah memperluas kemampuannya.
Dynamo 1.0 memperkenalkan fitur-fitur baru yang bertujuan untuk meningkatkan optimasi inferensi multimodal, khususnya pada beban kerja yang banyak melibatkan gambar. Ia memisahkan proses encoding, prefilling, dan decoding ke dalam tahapan yang berbeda, memungkinkan penskalaan independen dan peningkatan kinerja. Selain itu, framework ini sekarang menawarkan dukungan native untuk model pembuatan video, memungkinkan penyampaian pembuatan video mutakhir secara efisien.
Pembaruan terbaru Dynamo juga berfokus pada peningkatan ketahanan aplikasi AI. Pembaruan ini memperkenalkan fitur deteksi kesalahan dan migrasi permintaan untuk menjaga responsivitas bahkan ketika pekerja individual mengalami masalah. KV Block Manager telah diperbarui untuk mendukung penyimpanan objek dan memancarkan peristiwa KV global, memberikan fleksibilitas dan visibilitas yang lebih besar bagi operator model.
Rencana NVIDIA untuk Dynamo mencakup perluasan kemampuan multimodal, pengembangan model berbasis difusi untuk pembuatan video berkualitas tinggi secara real-time, dan peningkatan skala beban kerja agen dan pembelajaran penguatan. Perusahaan mendorong keterlibatan komunitas dalam pengembangan Dynamo yang sedang berlangsung, mengundang pihak yang berminat untuk menjelajahi kode, berpartisipasi dalam sesi konsultasi, dan membaca blog teknis untuk informasi lebih lanjut.
Bagikan artikel ini:
Tin tức mới nhất
Evri Meningkatkan Layanan Pengiriman Paket dengan Teknologi AI Amazon
18/3/26, 00.00
Evri Group siap meningkatkan layanan pengiriman paketnya dengan menggabungkan teknologi AI dari Amazon Web Services.
NVIDIA Luncurkan Dynamo 1.0 untuk Peningkatan Performa AI
18/3/26, 00.00
NVIDIA telah meluncurkan Dynamo 1.0, sebuah kerangka kerja AI baru yang dirancang untuk meningkatkan kinerja AI generatif dan model penalaran di lingkungan terdistribusi.
NVIDIA Meluncurkan Groq 3 LPX untuk Sistem AI Agenik
18/3/26, 00.00
NVIDIA telah memperkenalkan Groq 3 LPX, akselerator inferensi skala rak baru yang dirancang khusus untuk memenuhi kebutuhan sistem berbasis agen.
Copyright © 2024 Generatived - All right Reserved.
Bagikan artikel ini:
Bagikan artikel ini:
Kategori
Berita
AI dan hukum/peraturan/masyarakat
Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.
Berita terkini
Evri Meningkatkan Layanan Pengiriman Paket dengan Teknologi AI Amazon
18/3/26, 00.00
Evri Group siap meningkatkan layanan pengiriman paketnya dengan menggabungkan teknologi AI dari Amazon Web Services.
NVIDIA Luncurkan Dynamo 1.0 untuk Peningkatan Performa AI
18/3/26, 00.00
NVIDIA telah meluncurkan Dynamo 1.0, sebuah kerangka kerja AI baru yang dirancang untuk meningkatkan kinerja AI generatif dan model penalaran di lingkungan terdistribusi.
NVIDIA Meluncurkan Groq 3 LPX untuk Sistem AI Agenik
18/3/26, 00.00
NVIDIA telah memperkenalkan Groq 3 LPX, akselerator inferensi skala rak baru yang dirancang khusus untuk memenuhi kebutuhan sistem berbasis agen.


%20(1).webp)


