top of page

Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

logo.png

MLCommons công bố kết quả suy luận MLPerf v4.1

Generatived

2:00 29/8/24

MLCommons đã công bố kết quả mới nhất từ ​​bộ điểm chuẩn MLPerf Inference v4.1 để đánh giá hiệu suất của các hệ thống máy học. Bao gồm cả trung tâm dữ liệu và hệ thống biên, bộ phần mềm này nhằm mục đích cung cấp nền tảng đo điểm chuẩn công bằng và có thể tái tạo cho các mô hình AI và ML. Bản phát hành mới nhất bao gồm kết quả của sáu bộ xử lý mới, một số trong đó hiện có sẵn và một số khác có sẵn dưới dạng bản xem trước.

Bộ điểm chuẩn bao gồm 22 tổ chức tham gia và giới thiệu nhiều công nghệ hệ thống AI. Kết quả nêu bật cam kết của ngành đối với việc đo điểm chuẩn hiệu suất minh bạch, điều này rất cần thiết để đánh giá và mua sắm công nghệ AI. Những người tham gia bao gồm cả những gã khổng lồ công nghệ và các công ty khởi nghiệp, bao gồm cả những người gửi Suy luận MLPerf mới như AMD và Đám mây kim loại bền vững.

Một bổ sung đáng chú ý cho bộ suy luận MLPerf là ​​một chuẩn mực mới dựa trên kiến ​​trúc mô hình Kết hợp các chuyên gia (MoE). Cách tiếp cận này sử dụng nhiều mô hình nhỏ hoặc "chuyên gia" để xử lý các tác vụ suy luận. Điều này mang lại lợi ích về hiệu suất so với các hệ thống mô hình đơn truyền thống. Một trong những điểm chuẩn phức tạp nhất cho đến nay, điểm chuẩn MoE sử dụng mô hình Mixtral 8x7B và bao gồm các nhiệm vụ như Hỏi & Đáp, giải toán và tạo mã.

Bộ điểm chuẩn cũng bao gồm các bài kiểm tra mức tiêu thụ điện năng, với 31 kết quả được gửi cho các hệ thống hoạt động trong môi trường trung tâm dữ liệu và biên. Những thử nghiệm này nêu bật tầm quan trọng của việc hiểu rõ nhu cầu năng lượng của hệ thống AI, vì chi phí điện năng ảnh hưởng đáng kể đến chi phí vận hành tổng thể. MLCommons tiếp tục hỗ trợ ngành công nghiệp AI bằng cách cung cấp các tiêu chuẩn mở và minh bạch để giúp các bên liên quan định hướng trong bối cảnh công nghệ AI đang phát triển nhanh chóng.

Chia sẻ bài viết này:

Tin tức mới nhất
Gemini、 Google AIを活用したカスタムトラック作成を開始

Gemini、 Google AIを活用したカスタムトラック作成を開始

0:00 20/2/26

Geminiは、ユーザーが説明文を入力するか写真をアップロードするだけで、カスタム音楽トラックを作成できる新機能を導入しました。

Google、グローバルAIアクセス強化イニシアチブを発表

Google、グローバルAIアクセス強化イニシアチブを発表

0:00 20/2/26

Googleは、AI技術への世界的なアクセス向上への取り組みを発表し、様々な分野における課題解決のためにこれらのツールが広く利用可能であることの重要性を強調しました。

Sarvam AI と NVIDIA が多言語 AI モデルを加速

Sarvam AI と NVIDIA が多言語 AI モデルを加速

0:00 20/2/26

インド・ベンガルールのAIスタートアップ企業Sarvam AIは、インドの多様な言語ニーズに応えるため、大規模な多言語基盤モデルを構築するという野心的なプロジェクトに着手しました。

NVIDIA と Nebius が GPU 部分割り当てのメリットを紹介

NVIDIA と Nebius が GPU 部分割り当てのメリットを紹介

0:00 20/2/26

NVIDIA は Nebius 社と協力し、大規模言語モデル (LLM) 推論における NVIDIA Run:ai の部分的 GPU 割り当てによるパフォーマンス向上を評価しました。

Copyright © 2024 Generatived - All right Reserved.

Chia sẻ bài viết này:

Chia sẻ bài viết này:

Generatived AI Logo

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

  • Facebook
  • X

Hãy theo dõi chúng tôi

Ngôn ngữ

Tin tức mới nhất
Gemini、 Google AIを活用したカスタムトラック作成を開始

Gemini、 Google AIを活用したカスタムトラック作成を開始

0:00 20/2/26

Geminiは、ユーザーが説明文を入力するか写真をアップロードするだけで、カスタム音楽トラックを作成できる新機能を導入しました。

Google、グローバルAIアクセス強化イニシアチブを発表

Google、グローバルAIアクセス強化イニシアチブを発表

0:00 20/2/26

Googleは、AI技術への世界的なアクセス向上への取り組みを発表し、様々な分野における課題解決のためにこれらのツールが広く利用可能であることの重要性を強調しました。

Sarvam AI と NVIDIA が多言語 AI モデルを加速

Sarvam AI と NVIDIA が多言語 AI モデルを加速

0:00 20/2/26

インド・ベンガルールのAIスタートアップ企業Sarvam AIは、インドの多様な言語ニーズに応えるため、大規模な多言語基盤モデルを構築するという野心的なプロジェクトに着手しました。

NVIDIA と Nebius が GPU 部分割り当てのメリットを紹介

NVIDIA と Nebius が GPU 部分割り当てのメリットを紹介

0:00 20/2/26

NVIDIA は Nebius 社と協力し、大規模言語モデル (LLM) 推論における NVIDIA Run:ai の部分的 GPU 割り当てによるパフォーマンス向上を評価しました。

bottom of page