Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif
%20(1).webp)
NVIDIA Meluncurkan Groq 3 LPX untuk Sistem AI Agenik
Generatived
18/3/26, 00.00
NVIDIA telah memperkenalkan Groq 3 LPX, akselerator inferensi skala rak baru yang dirancang khusus untuk memenuhi kebutuhan sistem berbasis agen. LPX dirancang untuk bekerja bersamaan dengan NVIDIA Vera Rubin NVL72, menyediakan mesin khusus untuk pembuatan token cepat yang penting untuk aplikasi AI yang membutuhkan latency rendah. Di sisi lain, Vera Rubin NVL72 terus berfungsi sebagai solusi serbaguna untuk tugas pelatihan dan inferensi, mampu menangani berbagai proses dengan throughput tinggi.
Kolaborasi antara Vera Rubin NVL72 dan LPX sangat penting untuk masa depan AI berbasis agen, di mana kecepatan interaksi diperkirakan akan mencapai hingga 1.000 token per detik per pengguna. Akselerasi ini memungkinkan sistem AI untuk terlibat dalam penalaran, simulasi, dan respons berkelanjutan, mensimulasikan kolaborasi waktu nyata daripada komunikasi berbasis giliran. Kemampuan untuk mengoordinasikan kelompok agen juga meningkatkan potensi untuk tugas-tugas kompleks, mirip dengan masyarakat manusia yang memanfaatkan kecerdasan kolektif.
Untuk mendukung kebutuhan tingkat lanjut dari sistem-sistem ini, diperlukan infrastruktur yang kuat yang mampu memberikan throughput tinggi dan latency rendah. Arsitektur heterogen yang menggabungkan Vera Rubin NVL72 dan LPX memenuhi kebutuhan ini dengan menggabungkan kinerja pabrik AI skala besar dengan pembuatan token yang cepat yang dibutuhkan untuk sistem agen yang beroperasi terus menerus dan aplikasi AI mutakhir.
Sistem NVIDIA Groq 3 LPX dibangun di sekitar 256 akselerator yang saling terhubung dan menekankan eksekusi deterministik serta bandwidth SRAM on-chip yang tinggi. Desain ini memastikan bahwa inferensi interaktif tetap responsif di bawah berbagai tingkat konkurensi dan kompleksitas permintaan. Saat digunakan dengan Vera Rubin NVL72, LPX secara khusus mempercepat bagian-bagian sensitif latensi dari loop dekode, sementara GPU Rubin mengelola prefill dan perhatian dekode, menghasilkan jalur penyajian heterogen yang meningkatkan responsivitas interaktif tanpa mengorbankan throughput pabrik AI.
Bagikan artikel ini:
Tin tức mới nhất
Pelatihan Digital Transformation Pemerintah Daerah dan Dukungan Pemanfaatan AI dari Polimill
18/3/26, 00.00
Polimill (Minato-ku, Tokyo) menyelenggarakan pelatihan tentang penggunaan "QommonsAI" untuk karyawan Kota Uonuma, Prefektur Niigata.
Kompatibel dengan Narecom AI Chatbot GPT-5.4
18/3/26, 00.00
Knowledge Communication (Kota Ichikawa, Prefektur Chiba) mengumumkan bahwa platform pemanfaatan Generative AI tipe SaaS untuk perusahaan, "KnowCom AI Chatbot,"
Peluncuran Rakuten AI 3.0: Terbesar di Jepang
18/3/26, 00.00
Rakuten (Tokyo) telah merilis "Rakuten AI 3.0," model AI terbesar di Jepang, sebagai bagian dari proyek "GENIAC" yang dipromosikan oleh Kementerian Ekonomi
Copyright © 2024 Generatived - All right Reserved.
Bagikan artikel ini:
Bagikan artikel ini:
Kategori
Berita
AI dan hukum/peraturan/masyarakat
Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.
Berita terkini
Pelatihan Digital Transformation Pemerintah Daerah dan Dukungan Pemanfaatan AI dari Polimill
18/3/26, 00.00
Polimill (Minato-ku, Tokyo) menyelenggarakan pelatihan tentang penggunaan "QommonsAI" untuk karyawan Kota Uonuma, Prefektur Niigata.
Kompatibel dengan Narecom AI Chatbot GPT-5.4
18/3/26, 00.00
Knowledge Communication (Kota Ichikawa, Prefektur Chiba) mengumumkan bahwa platform pemanfaatan Generative AI tipe SaaS untuk perusahaan, "KnowCom AI Chatbot,"
Peluncuran Rakuten AI 3.0: Terbesar di Jepang
18/3/26, 00.00
Rakuten (Tokyo) telah merilis "Rakuten AI 3.0," model AI terbesar di Jepang, sebagai bagian dari proyek "GENIAC" yang dipromosikan oleh Kementerian Ekonomi

%20(1).webp)




