Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif
%20(1).webp)
GigaIO dan d-Matrix Mendukung Inferensi AI Perusahaan
Generatived
5/5/25, 00.00
GigaIO telah mengumumkan kemitraan strategis dengan d-Matrix untuk meningkatkan solusi inferensi AI bagi perusahaan. Kemitraan ini menyatukan platform inferensi Corsair milik d-Matrix dan arsitektur SuperNODE milik GigaIO untuk menyediakan solusi yang menyederhanakan penerapan dan secara efisien meningkatkan skala beban kerja inferensi AI. Upaya bersama ini bertujuan untuk memenuhi permintaan yang terus meningkat akan kemampuan AI berkinerja tinggi dan hemat energi yang dapat ditingkatkan skalanya tanpa dibatasi oleh kendala sistem multi-simpul tradisional.
Platform SuperNODE GigaIO kini dapat mendukung banyak akselerator d-Matrix Corsair dalam satu node, menjadikannya platform inferensi AI yang paling dapat diskalakan di industri. Integrasi ini memungkinkan organisasi untuk menjauh dari kompleksitas pendekatan komputasi terdistribusi tradisional dan menerapkan beban kerja inferensi batch dalam skala besar dengan latency yang sangat rendah. Alan Benjamin, CEO GigaIO, menyoroti sifat inovatif dari solusi tersebut dan kemampuannya untuk menyederhanakan penerapan dan beradaptasi dengan beban kerja AI yang berubah sekaligus meningkatkan total biaya kepemilikan dan efisiensi operasional.
Kemitraan ini telah menghasilkan solusi dengan metrik kinerja yang luar biasa, yang menetapkan standar baru untuk inferensi AI perusahaan: 30.000 token per detik dan kecepatan interaktif hingga 10x dibandingkan dengan alternatif berbasis GPU. Selain itu, solusi ini memberikan kinerja 3x dan efisiensi energi 3x dengan biaya yang sebanding, sehingga penerapan AI menjadi lebih berkelanjutan. CEO d-Matrix Sid Sheth mengatakan kolaborasi ini menggabungkan arsitektur komputasi dalam memori d-Matrix yang efisien dengan platform GigaIO yang tangguh untuk menjadikan Generative AI dalam skala besar layak secara komersial.
Jaringan AI berbasis PCIe Gen 5 canggih milik GigaIO merupakan komponen utama dari integrasi ini, yang memfasilitasi komunikasi latency rendah antara akselerator Corsair dan memaksimalkan efisiensi arsitektur d-Matrix. Pendekatan ini menghilangkan hambatan yang biasanya terkait dengan beban kerja inferensi terdistribusi. Keberhasilan kemitraan ini dibuktikan lebih lanjut oleh pencapaian terkini GigaIO dalam tolok ukur inferensi MLPerf, yang menyoroti kepemimpinan perusahaan dalam infrastruktur AI. Benjamin mengakhiri dengan menyatakan apresiasinya atas kebutuhan pasar akan solusi inferensi AI yang lebih efisien dan terukur serta inovasi rekayasa signifikan yang telah dihasilkan oleh kemitraan dengan d-Matrix.
Bagikan artikel ini:
Tin tức mới nhất
Gemini、 Google AIを活用したカスタムトラック作成を開始
20/2/26, 00.00
Geminiは、ユーザーが説明文を入力するか写真をアップロードするだけで、カスタム音楽トラックを作成できる新機能を導入しました。
Google、グローバルAIアクセス強化イニシアチブを発表
20/2/26, 00.00
Googleは、AI技術への世界的なアクセス向上への取り組みを発表し、様々な分野における課題解決のためにこれらのツールが広く利用可能であることの重要性を強調しました。
Sarvam AI と NVIDIA が多言語 AI モデルを加速
20/2/26, 00.00
インド・ベンガルールのAIスタートアップ企業Sarvam AIは、インドの多様な言語ニーズに応えるため、大規模な多言語基盤モデルを構築するという野心的なプロジェクトに着手しました。
Copyright © 2024 Generatived - All right Reserved.
Bagikan artikel ini:
Bagikan artikel ini:
Kategori
Berita
AI dan hukum/peraturan/masyarakat
Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.
Berita terkini
Gemini、 Google AIを活用したカスタムトラック作成を開始
20/2/26, 00.00
Geminiは、ユーザーが説明文を入力するか写真をアップロードするだけで、カスタム音楽トラックを作成できる新機能を導入しました。
Google、グローバルAIアクセス強化イニシアチブを発表
20/2/26, 00.00
Googleは、AI技術への世界的なアクセス向上への取り組みを発表し、様々な分野における課題解決のためにこれらのツールが広く利用可能であることの重要性を強調しました。
Sarvam AI と NVIDIA が多言語 AI モデルを加速
20/2/26, 00.00
インド・ベンガルールのAIスタートアップ企業Sarvam AIは、インドの多様な言語ニーズに応えるため、大規模な多言語基盤モデルを構築するという野心的なプロジェクトに着手しました。




%20(1).webp)

