top of page

Generatived(Beta)|生成AIの最新ニュースとトレンドを提供

logo.png

CUTLASSが新しい階層型GEMMシステム設計を発表

Generatived

25/7/18 0:00

CUTLASSは、一般行列乗算(GEMM)実装のための新しい階層システムを導入しました。これにより柔軟性が向上し、新しいNVIDIAアーキテクチャへのサポートが拡張されました。このモジュール型アプローチにより、ハードウェアとユーザーの要件に基づいてカスタマイズ可能な様々なハイパーパラメータの指定が可能になります。3.xシリーズにおけるこの再設計は、コードの可読性を向上させ、GEMM実装のカバレッジを最大化する、構成可能な直交ビルディングブロックのシステム構築に重点を置いています。

CUTLASS 3.xの階層設計は5つの異なるレイヤーで構成されており、各レイヤーは前のレイヤーの抽象化の合成ポイントとして機能します。これにより、ユーザーは高レベルレイヤーを利用して効率的なGEMM実装を実現することも、低レベルレイヤーを活用して高度なカスタマイズを行うこともできます。この設計はGPUの階層的ハードウェア設計と整合しており、他のGPUアプリケーションにも適しています。

CUTLASSのGEMMカーネル構築アプローチについては、同シリーズの2番目のブログ記事で詳しく説明しています。低レベルのCuTe抽象化を用いて空間マイクロカーネルを構築する方法について説明しています。これらのマイクロカーネルは、任意のインターリーブとタイル化が可能です。集合層は、アーキテクチャ固有の同期を用いて、これらのマイクロカーネルの実行を調整し、単一の出力タイルを計算します。

カーネル層は、問題空間全体をカバーし、集合体の作業をグリッド上に拡張します。一方、デバイス層はホスト側のセットアップとインターフェースを提供します。CUTLASSは、 GitHubのGEMM集合体フォルダで入手できる、様々な特化した集合体のメインループ実装とエピローグを提供しています。これらのコンポーネントは高度にカスタマイズ可能で、ユーザーはGEMMのメインループを正確に指定できます。

CUTLASSの設計哲学は、カスタマイズ可能なGEMM実装の作成において、構成可能性と直交性の重要性を重視しています。ライブラリの構造は、高いコード再利用性を備え、幅広く、かつ高度にカスタマイズ可能なGEMM実装を実現することを目指しています。この設計に興味のあるユーザーは、 GitHubでソフトウェアにアクセスしたり、ドキュメントを参照したり、開発者フォーラムに参加して詳細な議論に参加したりすることができます。

この記事を共有:

最新のニュース
Meta Broadcom AIチップ共同開発拡大

Meta Broadcom AIチップ共同開発拡大

26/4/16 0:00

Meta(米カリフォルニア州)は、Broadcomとの提携を拡大し、次世代AIチップ「MTIA」の複数世代を共同開発すると発表した。

NVIDIA量子AIモデルIsing発表

NVIDIA量子AIモデルIsing発表

26/4/16 0:00

NVIDIA(米国カリフォルニア州サンタクララ)は、量子プロセッサ向けAIモデル群「NVIDIA Ising」を発表したとみられる。

NVIDIA NVbandwidth性能測定ツール

NVIDIA NVbandwidth性能測定ツール

26/4/16 0:00

NVIDIA(米国カリフォルニア州サンタクララ)は、CUDAアプリケーションにおけるデータ転送性能の可視化を目的としたツール「NVbandwidth」を紹介したとみられる。

Google ChromeにAI Skills機能

Google ChromeにAI Skills機能

26/4/16 0:00

Google(米国カリフォルニア州マウンテンビュー)は、Chrome上でAIプロンプトを保存・再利用できる新機能「Skills」を発表したとみられる。

Copyright © 2024 Generatived - All right Reserved.

この記事を共有:

この記事を共有:

Generatived AI Logo

Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。

  • Facebook
  • X

フォローをお願いします

言語

最新のニュース
Meta Broadcom AIチップ共同開発拡大

Meta Broadcom AIチップ共同開発拡大

26/4/16 0:00

Meta(米カリフォルニア州)は、Broadcomとの提携を拡大し、次世代AIチップ「MTIA」の複数世代を共同開発すると発表した。

NVIDIA量子AIモデルIsing発表

NVIDIA量子AIモデルIsing発表

26/4/16 0:00

NVIDIA(米国カリフォルニア州サンタクララ)は、量子プロセッサ向けAIモデル群「NVIDIA Ising」を発表したとみられる。

NVIDIA NVbandwidth性能測定ツール

NVIDIA NVbandwidth性能測定ツール

26/4/16 0:00

NVIDIA(米国カリフォルニア州サンタクララ)は、CUDAアプリケーションにおけるデータ転送性能の可視化を目的としたツール「NVbandwidth」を紹介したとみられる。

Google ChromeにAI Skills機能

Google ChromeにAI Skills機能

26/4/16 0:00

Google(米国カリフォルニア州マウンテンビュー)は、Chrome上でAIプロンプトを保存・再利用できる新機能「Skills」を発表したとみられる。

bottom of page