Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif
%20(1).webp)
GigaIO dan d-Matrix Mendukung Inferensi AI Perusahaan
Generatived
5/5/25, 00.00
GigaIO telah mengumumkan kemitraan strategis dengan d-Matrix untuk meningkatkan solusi inferensi AI bagi perusahaan. Kemitraan ini menyatukan platform inferensi Corsair milik d-Matrix dan arsitektur SuperNODE milik GigaIO untuk menyediakan solusi yang menyederhanakan penerapan dan secara efisien meningkatkan skala beban kerja inferensi AI. Upaya bersama ini bertujuan untuk memenuhi permintaan yang terus meningkat akan kemampuan AI berkinerja tinggi dan hemat energi yang dapat ditingkatkan skalanya tanpa dibatasi oleh kendala sistem multi-simpul tradisional.
Platform SuperNODE GigaIO kini dapat mendukung banyak akselerator d-Matrix Corsair dalam satu node, menjadikannya platform inferensi AI yang paling dapat diskalakan di industri. Integrasi ini memungkinkan organisasi untuk menjauh dari kompleksitas pendekatan komputasi terdistribusi tradisional dan menerapkan beban kerja inferensi batch dalam skala besar dengan latency yang sangat rendah. Alan Benjamin, CEO GigaIO, menyoroti sifat inovatif dari solusi tersebut dan kemampuannya untuk menyederhanakan penerapan dan beradaptasi dengan beban kerja AI yang berubah sekaligus meningkatkan total biaya kepemilikan dan efisiensi operasional.
Kemitraan ini telah menghasilkan solusi dengan metrik kinerja yang luar biasa, yang menetapkan standar baru untuk inferensi AI perusahaan: 30.000 token per detik dan kecepatan interaktif hingga 10x dibandingkan dengan alternatif berbasis GPU. Selain itu, solusi ini memberikan kinerja 3x dan efisiensi energi 3x dengan biaya yang sebanding, sehingga penerapan AI menjadi lebih berkelanjutan. CEO d-Matrix Sid Sheth mengatakan kolaborasi ini menggabungkan arsitektur komputasi dalam memori d-Matrix yang efisien dengan platform GigaIO yang tangguh untuk menjadikan Generative AI dalam skala besar layak secara komersial.
Jaringan AI berbasis PCIe Gen 5 canggih milik GigaIO merupakan komponen utama dari integrasi ini, yang memfasilitasi komunikasi latency rendah antara akselerator Corsair dan memaksimalkan efisiensi arsitektur d-Matrix. Pendekatan ini menghilangkan hambatan yang biasanya terkait dengan beban kerja inferensi terdistribusi. Keberhasilan kemitraan ini dibuktikan lebih lanjut oleh pencapaian terkini GigaIO dalam tolok ukur inferensi MLPerf, yang menyoroti kepemimpinan perusahaan dalam infrastruktur AI. Benjamin mengakhiri dengan menyatakan apresiasinya atas kebutuhan pasar akan solusi inferensi AI yang lebih efisien dan terukur serta inovasi rekayasa signifikan yang telah dihasilkan oleh kemitraan dengan d-Matrix.
Bagikan artikel ini:
Tin tức mới nhất
Ippu Senkin東和銀行AI導入効率化
20/2/26, 00.00
Ippu Senkin(東京都中央区)は、東和銀行(群馬県前橋市)に生成AIを活用した議事録AIアプリ「Towa Bank AI 1.0 -MEMO-(とわログ)」と規程・手続き検索AIアプリ「Towa Bank AI 1.0 -Buddy-(とわナビ)」を導入し、業務効率化を図った。
Copyright © 2024 Generatived - All right Reserved.
Bagikan artikel ini:
Bagikan artikel ini:
Kategori
Berita
AI dan hukum/peraturan/masyarakat
Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.
Berita terkini
Ippu Senkin東和銀行AI導入効率化
20/2/26, 00.00
Ippu Senkin(東京都中央区)は、東和銀行(群馬県前橋市)に生成AIを活用した議事録AIアプリ「Towa Bank AI 1.0 -MEMO-(とわログ)」と規程・手続き検索AIアプリ「Towa Bank AI 1.0 -Buddy-(とわナビ)」を導入し、業務効率化を図った。

%20(1).webp)




