top of page

Generatived(Beta)|生成AIの最新ニュースとトレンドを提供

logo.png

CUTLASSが新しい階層型GEMMシステム設計を発表

Generatived

25/7/18 0:00

CUTLASSは、一般行列乗算(GEMM)実装のための新しい階層システムを導入しました。これにより柔軟性が向上し、新しいNVIDIAアーキテクチャへのサポートが拡張されました。このモジュール型アプローチにより、ハードウェアとユーザーの要件に基づいてカスタマイズ可能な様々なハイパーパラメータの指定が可能になります。3.xシリーズにおけるこの再設計は、コードの可読性を向上させ、GEMM実装のカバレッジを最大化する、構成可能な直交ビルディングブロックのシステム構築に重点を置いています。

CUTLASS 3.xの階層設計は5つの異なるレイヤーで構成されており、各レイヤーは前のレイヤーの抽象化の合成ポイントとして機能します。これにより、ユーザーは高レベルレイヤーを利用して効率的なGEMM実装を実現することも、低レベルレイヤーを活用して高度なカスタマイズを行うこともできます。この設計はGPUの階層的ハードウェア設計と整合しており、他のGPUアプリケーションにも適しています。

CUTLASSのGEMMカーネル構築アプローチについては、同シリーズの2番目のブログ記事で詳しく説明しています。低レベルのCuTe抽象化を用いて空間マイクロカーネルを構築する方法について説明しています。これらのマイクロカーネルは、任意のインターリーブとタイル化が可能です。集合層は、アーキテクチャ固有の同期を用いて、これらのマイクロカーネルの実行を調整し、単一の出力タイルを計算します。

カーネル層は、問題空間全体をカバーし、集合体の作業をグリッド上に拡張します。一方、デバイス層はホスト側のセットアップとインターフェースを提供します。CUTLASSは、 GitHubのGEMM集合体フォルダで入手できる、様々な特化した集合体のメインループ実装とエピローグを提供しています。これらのコンポーネントは高度にカスタマイズ可能で、ユーザーはGEMMのメインループを正確に指定できます。

CUTLASSの設計哲学は、カスタマイズ可能なGEMM実装の作成において、構成可能性と直交性の重要性を重視しています。ライブラリの構造は、高いコード再利用性を備え、幅広く、かつ高度にカスタマイズ可能なGEMM実装を実現することを目指しています。この設計に興味のあるユーザーは、 GitHubでソフトウェアにアクセスしたり、ドキュメントを参照したり、開発者フォーラムに参加して詳細な議論に参加したりすることができます。

この記事を共有:

最新のニュース
Kotoznaが新RAG技術TocDex公開

Kotoznaが新RAG技術TocDex公開

26/4/16 0:00

Kotozna(東京都港区)は、生成AIチャットボットの精度向上を目的とした独自RAGアーキテクチャ「TocDex RAG」を発表したと明らかにした。

Nexdataが物理AIデータ基盤強化

Nexdataが物理AIデータ基盤強化

26/4/16 0:00

Nexdata(東京都千代田区)は、フィジカルAI向けデータ基盤の強化に向け、総額25億円超を投じた大規模データ収集体制を構築したと明らかにした。

ウフル、Databricks支援強化でAI活用加速

ウフル、Databricks支援強化でAI活用加速

26/4/16 0:00

ウフル(東京都港区)は、Databricksを活用したデータ基盤構築からAI活用の定着までを支援するサービスの強化を発表したとされる。

エンとPeopleX合弁でAI人材事業

エンとPeopleX合弁でAI人材事業

26/4/16 0:00

エン(東京都新宿区)とPeopleX(東京都新宿区)は、合弁契約を締結し新会社エンPeopleXを設立したと発表したとされる。

Copyright © 2024 Generatived - All right Reserved.

この記事を共有:

この記事を共有:

Generatived AI Logo

Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。

  • Facebook
  • X

フォローをお願いします

言語

最新のニュース
Kotoznaが新RAG技術TocDex公開

Kotoznaが新RAG技術TocDex公開

26/4/16 0:00

Kotozna(東京都港区)は、生成AIチャットボットの精度向上を目的とした独自RAGアーキテクチャ「TocDex RAG」を発表したと明らかにした。

Nexdataが物理AIデータ基盤強化

Nexdataが物理AIデータ基盤強化

26/4/16 0:00

Nexdata(東京都千代田区)は、フィジカルAI向けデータ基盤の強化に向け、総額25億円超を投じた大規模データ収集体制を構築したと明らかにした。

ウフル、Databricks支援強化でAI活用加速

ウフル、Databricks支援強化でAI活用加速

26/4/16 0:00

ウフル(東京都港区)は、Databricksを活用したデータ基盤構築からAI活用の定着までを支援するサービスの強化を発表したとされる。

エンとPeopleX合弁でAI人材事業

エンとPeopleX合弁でAI人材事業

26/4/16 0:00

エン(東京都新宿区)とPeopleX(東京都新宿区)は、合弁契約を締結し新会社エンPeopleXを設立したと発表したとされる。

bottom of page