Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif

NVIDIA DGX Spark Meningkatkan Kemampuan Agen AI Otonom
Generatived
18/3/26, 00.00
NVIDIA telah memperkenalkan kemajuan dalam teknologi AI dengan NVIDIA DGX Spark, yang meningkatkan kemampuan agen AI otonom. Agen-agen ini, yang menangani tugas-tugas kompleks dan jangka panjang di berbagai saluran komunikasi dan subproses, kini mendapatkan manfaat dari kinerja DGX Spark untuk mengeksekusi alur kerja mereka secara efisien. NVIDIA NemoClaw, sebuah komponen dari NVIDIA Agent Toolkit, memperkenalkan runtime NVIDIA OpenShell, menciptakan lingkungan yang aman untuk menjalankan agen otonom dan mendukung model sumber terbuka seperti NVIDIA Nemotron.
Perusahaan menekankan pentingnya kemampuan dan kinerja sistem untuk mendukung agen otonom yang selalu aktif. NVIDIA DGX Spark dipresentasikan sebagai platform desktop ideal untuk AI semacam itu, dengan kemampuannya untuk mengelola jendela konteks yang luas yang dibutuhkan oleh runtime agen AI seperti OpenClaw. Kecepatan pemrosesan platform yang tinggi disorot, menunjukkan kemampuannya untuk menangani konteks besar, yang sangat penting untuk memahami permintaan dan menentukan pendekatan terbaik untuk masalah.
Kemampuan NVIDIA DGX Spark dalam menangani beban kerja konkurensi tinggi juga ditunjukkan, dengan NVIDIA Grace Blackwell Superchip yang memungkinkan paralelisasi beberapa subagen. Hal ini memungkinkan penskalaan tugas simultan yang efisien tanpa dampak kinerja yang signifikan. Dukungan platform untuk kerangka kerja yang mengelola konkurensi dengan baik, seperti NVIDIA TensorRT LLM dan vLLM, memastikan kelancaran operasi beban kerja multiagen.
Selain itu, NVIDIA telah memperluas kemampuan penskalaan DGX Spark, yang kini mendukung hingga empat node, sehingga meningkatkan kapasitas memori dan mendukung berbagai topologi eksekusi untuk tujuan yang berbeda. Penskalaan ini difasilitasi oleh latency rendah komunikasi RoCE yang dimungkinkan oleh NIC ConnectX-7. Platform ini dioptimalkan untuk berbagai kasus penggunaan, mulai dari inferensi konteks berukuran besar dengan latency rendah hingga beban kerja yang intensif komunikasi dan operasi pabrik AI lokal.
Kesimpulannya, NVIDIA DGX Spark diposisikan sebagai platform serbaguna untuk mengembangkan agen AI, menawarkan skalabilitas dan efisiensi untuk berbagai beban kerja AI. Kemampuan platform untuk diimplementasikan ke cloud dengan perubahan kode minimal semakin meningkatkan daya tariknya, menyediakan solusi terpadu bagi perusahaan untuk menerapkan dan menskalakan sistem AI.
Bagikan artikel ini:
Tin tức mới nhất
Evri Meningkatkan Layanan Pengiriman Paket dengan Teknologi AI Amazon
18/3/26, 00.00
Evri Group siap meningkatkan layanan pengiriman paketnya dengan menggabungkan teknologi AI dari Amazon Web Services.
NVIDIA Luncurkan Dynamo 1.0 untuk Peningkatan Performa AI
18/3/26, 00.00
NVIDIA telah meluncurkan Dynamo 1.0, sebuah kerangka kerja AI baru yang dirancang untuk meningkatkan kinerja AI generatif dan model penalaran di lingkungan terdistribusi.
NVIDIA Meluncurkan Groq 3 LPX untuk Sistem AI Agenik
18/3/26, 00.00
NVIDIA telah memperkenalkan Groq 3 LPX, akselerator inferensi skala rak baru yang dirancang khusus untuk memenuhi kebutuhan sistem berbasis agen.
Copyright © 2024 Generatived - All right Reserved.
Bagikan artikel ini:
Bagikan artikel ini:
Kategori
Berita
AI dan hukum/peraturan/masyarakat
Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.
Berita terkini
Evri Meningkatkan Layanan Pengiriman Paket dengan Teknologi AI Amazon
18/3/26, 00.00
Evri Group siap meningkatkan layanan pengiriman paketnya dengan menggabungkan teknologi AI dari Amazon Web Services.
NVIDIA Luncurkan Dynamo 1.0 untuk Peningkatan Performa AI
18/3/26, 00.00
NVIDIA telah meluncurkan Dynamo 1.0, sebuah kerangka kerja AI baru yang dirancang untuk meningkatkan kinerja AI generatif dan model penalaran di lingkungan terdistribusi.
NVIDIA Meluncurkan Groq 3 LPX untuk Sistem AI Agenik
18/3/26, 00.00
NVIDIA telah memperkenalkan Groq 3 LPX, akselerator inferensi skala rak baru yang dirancang khusus untuk memenuhi kebutuhan sistem berbasis agen.



%20(1).webp)


