NVIDIA Meluncurkan Groq 3 LPX untuk Sistem AI Agenik 3/3926

Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif

NVIDIA Meluncurkan Groq 3 LPX untuk Sistem AI Agenik

Generatived

18/3/26, 00.00

NVIDIA telah memperkenalkan Groq 3 LPX, akselerator inferensi skala rak baru yang dirancang khusus untuk memenuhi kebutuhan sistem berbasis agen. LPX dirancang untuk bekerja bersamaan dengan NVIDIA Vera Rubin NVL72, menyediakan mesin khusus untuk pembuatan token cepat yang penting untuk aplikasi AI yang membutuhkan latency rendah. Di sisi lain, Vera Rubin NVL72 terus berfungsi sebagai solusi serbaguna untuk tugas pelatihan dan inferensi, mampu menangani berbagai proses dengan throughput tinggi.

Kolaborasi antara Vera Rubin NVL72 dan LPX sangat penting untuk masa depan AI berbasis agen, di mana kecepatan interaksi diperkirakan akan mencapai hingga 1.000 token per detik per pengguna. Akselerasi ini memungkinkan sistem AI untuk terlibat dalam penalaran, simulasi, dan respons berkelanjutan, mensimulasikan kolaborasi waktu nyata daripada komunikasi berbasis giliran. Kemampuan untuk mengoordinasikan kelompok agen juga meningkatkan potensi untuk tugas-tugas kompleks, mirip dengan masyarakat manusia yang memanfaatkan kecerdasan kolektif.

Untuk mendukung kebutuhan tingkat lanjut dari sistem-sistem ini, diperlukan infrastruktur yang kuat yang mampu memberikan throughput tinggi dan latency rendah. Arsitektur heterogen yang menggabungkan Vera Rubin NVL72 dan LPX memenuhi kebutuhan ini dengan menggabungkan kinerja pabrik AI skala besar dengan pembuatan token yang cepat yang dibutuhkan untuk sistem agen yang beroperasi terus menerus dan aplikasi AI mutakhir.

Sistem NVIDIA Groq 3 LPX dibangun di sekitar 256 akselerator yang saling terhubung dan menekankan eksekusi deterministik serta bandwidth SRAM on-chip yang tinggi. Desain ini memastikan bahwa inferensi interaktif tetap responsif di bawah berbagai tingkat konkurensi dan kompleksitas permintaan. Saat digunakan dengan Vera Rubin NVL72, LPX secara khusus mempercepat bagian-bagian sensitif latensi dari loop dekode, sementara GPU Rubin mengelola prefill dan perhatian dekode, menghasilkan jalur penyajian heterogen yang meningkatkan responsivitas interaktif tanpa mengorbankan throughput pabrik AI.

Sumber: Blog Pengembang NVIDIA

Bagikan artikel ini:

Tin tức mới nhất

Layanan Pelatihan Bermain Peran AI Reflect Diumumkan

18/3/26, 00.00

Reflect (Shibuya-ku, Tokyo) meluncurkan layanan pelatihan bermain peran berbasis AI, "AI Role-Playing Pack," pada tanggal 17 Maret.

Baca lebih lanjut

FeedForce AI Search MCP Beta kini tersedia.

18/3/26, 00.00

Feedforce (Minato-ku, Tokyo) telah meluncurkan versi beta dari fungsi server MCP untuk "Answer IO," sebuah alat yang memvisualisasikan skor merek dari pencarian AI.

Baca lebih lanjut

Baby Calendar meluncurkan layanan konsultasi ahli berbasis AI.

18/3/26, 00.00

Baby Calendar (Shibuya-ku, Tokyo) telah meluncurkan fitur baru, "Konsultasi Pakar AI," untuk aplikasi informasi kehamilan, persalinan, dan perawatan anak, "Baby Calendar."

Baca lebih lanjut

Nile AI Partners Meluncurkan Dukungan

18/3/26, 00.00

Nyle (Shinagawa-ku, Tokyo) telah meluncurkan "Nyle AI Partners," sebuah layanan yang menyediakan talenta AI berdasarkan proyek untuk mendukung perusahaan dalam pemanfaatan AI

Baca lebih lanjut

Bagikan artikel ini:

Kategori

Peningkat Gambar AI

Pembuat kode AI

Manajemen tugas AI

Tanpa kode/kode rendah

Generator desain grafis AI

Generator seni/ilustrasi AI

Semua alat

Berita

AI dan hukum/peraturan/masyarakat

Perusahaan/produk/teknologi AI

AI Teknologi Besar

OpenAI/ChatGPT

AI generasi kreatif

AI generasi berbasis teks

AI generatif Jepang

Dasar-dasar AI generatif

Panduan penerapan AI terbaik

Profil perusahaan

Tentang kami

Chính sách quyền riêng tư

Điều khoản sử dụng trang web

Công ty điều hành

Hãy theo dõi chúng tôi

Bahasa

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.

Ikuti kami

Bahasa

Kategori

Semua alat

Manajemen tugas AI

Generator desain grafis AI

Tanpa kode/kode rendah

Pembuat kode AI

Peningkat Gambar AI

Pembuat Seni/Ilustrasi AI

AI dan hukum/sistem/ekonomi/masyarakat

Perusahaan/produk/teknologi AI

AI berteknologi besar

OpenAI/ChatGPT

AI generasi inovatif

AI generasi berbasis teks

AI inovatif Jepang

Dasar-dasar AI generatif

Petunjuk dasar aplikasi AI

Tin tức

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng của trang web

Công ty điều hành

Hồ sơ công ty

Berita terkini

Layanan Pelatihan Bermain Peran AI Reflect Diumumkan

18/3/26, 00.00

Reflect (Shibuya-ku, Tokyo) meluncurkan layanan pelatihan bermain peran berbasis AI, "AI Role-Playing Pack," pada tanggal 17 Maret.

Baca lebih lanjut

FeedForce AI Search MCP Beta kini tersedia.

18/3/26, 00.00

Feedforce (Minato-ku, Tokyo) telah meluncurkan versi beta dari fungsi server MCP untuk "Answer IO," sebuah alat yang memvisualisasikan skor merek dari pencarian AI.

Baca lebih lanjut

Baby Calendar meluncurkan layanan konsultasi ahli berbasis AI.

18/3/26, 00.00

Baby Calendar (Shibuya-ku, Tokyo) telah meluncurkan fitur baru, "Konsultasi Pakar AI," untuk aplikasi informasi kehamilan, persalinan, dan perawatan anak, "Baby Calendar."

Baca lebih lanjut

Nile AI Partners Meluncurkan Dukungan

18/3/26, 00.00

Nyle (Shinagawa-ku, Tokyo) telah meluncurkan "Nyle AI Partners," sebuah layanan yang menyediakan talenta AI berdasarkan proyek untuk mendukung perusahaan dalam pemanfaatan AI

Baca lebih lanjut