GigaIO dan d-Matrix Mendukung Inferensi AI Perusahaan 2/3916

Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif

GigaIO dan d-Matrix Mendukung Inferensi AI Perusahaan

Generatived

5/5/25, 00.00

GigaIO telah mengumumkan kemitraan strategis dengan d-Matrix untuk meningkatkan solusi inferensi AI bagi perusahaan. Kemitraan ini menyatukan platform inferensi Corsair milik d-Matrix dan arsitektur SuperNODE milik GigaIO untuk menyediakan solusi yang menyederhanakan penerapan dan secara efisien meningkatkan skala beban kerja inferensi AI. Upaya bersama ini bertujuan untuk memenuhi permintaan yang terus meningkat akan kemampuan AI berkinerja tinggi dan hemat energi yang dapat ditingkatkan skalanya tanpa dibatasi oleh kendala sistem multi-simpul tradisional.

Platform SuperNODE GigaIO kini dapat mendukung banyak akselerator d-Matrix Corsair dalam satu node, menjadikannya platform inferensi AI yang paling dapat diskalakan di industri. Integrasi ini memungkinkan organisasi untuk menjauh dari kompleksitas pendekatan komputasi terdistribusi tradisional dan menerapkan beban kerja inferensi batch dalam skala besar dengan latency yang sangat rendah. Alan Benjamin, CEO GigaIO, menyoroti sifat inovatif dari solusi tersebut dan kemampuannya untuk menyederhanakan penerapan dan beradaptasi dengan beban kerja AI yang berubah sekaligus meningkatkan total biaya kepemilikan dan efisiensi operasional.

Kemitraan ini telah menghasilkan solusi dengan metrik kinerja yang luar biasa, yang menetapkan standar baru untuk inferensi AI perusahaan: 30.000 token per detik dan kecepatan interaktif hingga 10x dibandingkan dengan alternatif berbasis GPU. Selain itu, solusi ini memberikan kinerja 3x dan efisiensi energi 3x dengan biaya yang sebanding, sehingga penerapan AI menjadi lebih berkelanjutan. CEO d-Matrix Sid Sheth mengatakan kolaborasi ini menggabungkan arsitektur komputasi dalam memori d-Matrix yang efisien dengan platform GigaIO yang tangguh untuk menjadikan Generative AI dalam skala besar layak secara komersial.

Jaringan AI berbasis PCIe Gen 5 canggih milik GigaIO merupakan komponen utama dari integrasi ini, yang memfasilitasi komunikasi latency rendah antara akselerator Corsair dan memaksimalkan efisiensi arsitektur d-Matrix. Pendekatan ini menghilangkan hambatan yang biasanya terkait dengan beban kerja inferensi terdistribusi. Keberhasilan kemitraan ini dibuktikan lebih lanjut oleh pencapaian terkini GigaIO dalam tolok ukur inferensi MLPerf, yang menyoroti kepemimpinan perusahaan dalam infrastruktur AI. Benjamin mengakhiri dengan menyatakan apresiasinya atas kebutuhan pasar akan solusi inferensi AI yang lebih efisien dan terukur serta inovasi rekayasa signifikan yang telah dihasilkan oleh kemitraan dengan d-Matrix.

Sumber: Siaran pers

Bagikan artikel ini:

Tin tức mới nhất

Meta memperluas kemitraan dengan Broadcom untuk chip AI.

16/4/26, 00.00

Meta mengumumkan perluasan kemitraan dengan Broadcom untuk bersama-sama mengembangkan beberapa generasi chip AI MTIA.

Baca lebih lanjut

NVIDIA meluncurkan model AI Ising untuk komputasi kuantum.

16/4/26, 00.00

NVIDIA mengumumkan peluncuran keluarga model AI terbuka "NVIDIA Ising" untuk prosesor kuantum, yang berfokus pada kalibrasi dan dekoding

Baca lebih lanjut

NVIDIA memperkenalkan alat pengujian performa GPU NVbandwidth.

16/4/26, 00.00

NVIDIA memperkenalkan NVbandwidth, sebuah alat berbasis CUDA yang dirancang untuk mengukur kinerja transfer data di seluruh sistem GPU

Baca lebih lanjut

Google meluncurkan fitur Skills untuk Chrome AI.

16/4/26, 00.00

Google memperkenalkan "Skills" di Chrome, sebuah fitur yang memungkinkan pengguna untuk menyimpan dan menggunakan kembali petunjuk AI

Baca lebih lanjut

Bagikan artikel ini:

Kategori

Peningkat Gambar AI

Pembuat kode AI

Manajemen tugas AI

Tanpa kode/kode rendah

Generator desain grafis AI

Generator seni/ilustrasi AI

Semua alat

Berita

AI dan hukum/peraturan/masyarakat

Perusahaan/produk/teknologi AI

AI Teknologi Besar

OpenAI/ChatGPT

AI generasi kreatif

AI generasi berbasis teks

AI generatif Jepang

Dasar-dasar AI generatif

Panduan penerapan AI terbaik

Profil perusahaan

Tentang kami

Chính sách quyền riêng tư

Điều khoản sử dụng trang web

Công ty điều hành

Hãy theo dõi chúng tôi

Bahasa

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.

Ikuti kami

Bahasa

Kategori

Semua alat

Manajemen tugas AI

Generator desain grafis AI

Tanpa kode/kode rendah

Pembuat kode AI

Peningkat Gambar AI

Pembuat Seni/Ilustrasi AI

AI dan hukum/sistem/ekonomi/masyarakat

Perusahaan/produk/teknologi AI