top of page

Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

logo.png

GigaIO và d-Matrix Power Enterprise AI Inference

Generatived

0:00 5/5/25

GigaIO đã công bố quan hệ đối tác chiến lược với d-Matrix để nâng cao các giải pháp suy luận AI cho doanh nghiệp. Quan hệ đối tác này kết hợp nền tảng suy luận Corsair của d-Matrix và kiến ​​trúc SuperNODE của GigaIO để cung cấp giải pháp đơn giản hóa việc triển khai và mở rộng hiệu quả khối lượng công việc suy luận AI. Nỗ lực chung này nhằm đáp ứng nhu cầu ngày càng tăng về khả năng AI hiệu suất cao, tiết kiệm năng lượng có thể mở rộng mà không bị ràng buộc bởi các hạn chế của hệ thống đa nút truyền thống.

Nền tảng SuperNODE của GigaIO hiện có thể hỗ trợ nhiều bộ tăng tốc d-Matrix Corsair trong một nút duy nhất, khiến nó trở thành nền tảng suy luận AI có khả năng mở rộng nhất trong ngành. Sự tích hợp này cho phép các tổ chức thoát khỏi sự phức tạp của các phương pháp điện toán phân tán truyền thống và triển khai khối lượng công việc suy luận theo lô ở quy mô lớn với latency cực thấp. Alan Benjamin, CEO của GigaIO, đã nhấn mạnh bản chất sáng tạo của giải pháp và khả năng hợp lý hóa việc triển khai và thích ứng với khối lượng công việc AI thay đổi trong khi cải thiện tổng chi phí sở hữu và hiệu quả hoạt động.

Quan hệ đối tác đã mang đến một giải pháp với số liệu hiệu suất đáng kinh ngạc, thiết lập một tiêu chuẩn mới cho suy luận AI doanh nghiệp: 30.000 token mỗi giây và tốc độ tương tác lên đến 10 lần so với các giải pháp thay thế dựa trên GPU. Ngoài ra, nó mang lại hiệu suất gấp 3 lần và hiệu quả năng lượng gấp 3 lần với chi phí tương đương, giúp triển khai AI bền vững hơn. Giám đốc điều hành d-Matrix Sid Sheth cho biết sự hợp tác này kết hợp kiến ​​trúc điện toán trong bộ nhớ hiệu quả của d-Matrix với nền tảng mạnh mẽ của GigaIO để biến Generative AI ở quy mô khả thi về mặt thương mại.

Nền tảng AI tiên tiến dựa trên PCIe Gen 5 của GigaIO là một thành phần quan trọng của sự tích hợp này, tạo điều kiện cho giao tiếp latency thấp giữa các bộ tăng tốc Corsair và tối đa hóa hiệu quả của kiến ​​trúc d-Matrix. Cách tiếp cận này loại bỏ các nút thắt thường liên quan đến khối lượng công việc suy luận phân tán. Sự thành công của quan hệ đối tác này được chứng minh thêm bằng những thành tựu gần đây của GigaIO trong chuẩn mực suy luận MLPerf, làm nổi bật vị thế dẫn đầu của công ty trong cơ sở hạ tầng AI. Benjamin kết luận bằng cách bày tỏ sự đánh giá cao đối với nhu cầu của thị trường về các giải pháp suy luận AI hiệu quả và có khả năng mở rộng hơn cũng như những cải tiến kỹ thuật đáng kể đã được mang lại thông qua quan hệ đối tác với d-Matrix.

Chia sẻ bài viết này:

Tin tức mới nhất
Gemini、 Google AIを活用したカスタムトラック作成を開始

Gemini、 Google AIを活用したカスタムトラック作成を開始

0:00 20/2/26

Geminiは、ユーザーが説明文を入力するか写真をアップロードするだけで、カスタム音楽トラックを作成できる新機能を導入しました。

Google、グローバルAIアクセス強化イニシアチブを発表

Google、グローバルAIアクセス強化イニシアチブを発表

0:00 20/2/26

Googleは、AI技術への世界的なアクセス向上への取り組みを発表し、様々な分野における課題解決のためにこれらのツールが広く利用可能であることの重要性を強調しました。

Sarvam AI と NVIDIA が多言語 AI モデルを加速

Sarvam AI と NVIDIA が多言語 AI モデルを加速

0:00 20/2/26

インド・ベンガルールのAIスタートアップ企業Sarvam AIは、インドの多様な言語ニーズに応えるため、大規模な多言語基盤モデルを構築するという野心的なプロジェクトに着手しました。

NVIDIA と Nebius が GPU 部分割り当てのメリットを紹介

NVIDIA と Nebius が GPU 部分割り当てのメリットを紹介

0:00 20/2/26

NVIDIA は Nebius 社と協力し、大規模言語モデル (LLM) 推論における NVIDIA Run:ai の部分的 GPU 割り当てによるパフォーマンス向上を評価しました。

Copyright © 2024 Generatived - All right Reserved.

Chia sẻ bài viết này:

Chia sẻ bài viết này:

Generatived AI Logo

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

  • Facebook
  • X

Hãy theo dõi chúng tôi

Ngôn ngữ

Tin tức mới nhất
Gemini、 Google AIを活用したカスタムトラック作成を開始

Gemini、 Google AIを活用したカスタムトラック作成を開始

0:00 20/2/26

Geminiは、ユーザーが説明文を入力するか写真をアップロードするだけで、カスタム音楽トラックを作成できる新機能を導入しました。

Google、グローバルAIアクセス強化イニシアチブを発表

Google、グローバルAIアクセス強化イニシアチブを発表

0:00 20/2/26

Googleは、AI技術への世界的なアクセス向上への取り組みを発表し、様々な分野における課題解決のためにこれらのツールが広く利用可能であることの重要性を強調しました。

Sarvam AI と NVIDIA が多言語 AI モデルを加速

Sarvam AI と NVIDIA が多言語 AI モデルを加速

0:00 20/2/26

インド・ベンガルールのAIスタートアップ企業Sarvam AIは、インドの多様な言語ニーズに応えるため、大規模な多言語基盤モデルを構築するという野心的なプロジェクトに着手しました。

NVIDIA と Nebius が GPU 部分割り当てのメリットを紹介

NVIDIA と Nebius が GPU 部分割り当てのメリットを紹介

0:00 20/2/26

NVIDIA は Nebius 社と協力し、大規模言語モデル (LLM) 推論における NVIDIA Run:ai の部分的 GPU 割り当てによるパフォーマンス向上を評価しました。

bottom of page