top of page

Generatived(Beta)|生成AIの最新ニュースとトレンドを提供

logo.png

NVIDIA、GPU開発を容易にするCuTe DSLをリリース

Generatived

25/11/17 0:00

CUTLASS 3.xの主要要素であるCuTeは、データレイアウトとスレッドマッピングを簡素化することで、カーネル開発者がTensorコア上でパフォーマンスを最適化する上で重要な役割を果たしてきました。しかしながら、CUTLASS 3.xではC++テンプレートを多用していたため、コンパイル時間が長くなっていました。AIワークフローにおけるPythonとJITコンパイルの利用が増加していることを踏まえ、開発者はこれらの課題に対処するためにCUTLASS 4を導入しました。

CUTLASS 4で新たに導入されたCuTe DSLは、CuTeの機能をPythonに拡張し、C++テンプレートメタプログラミングの複雑さを排除することで、GPUカーネル開発を容易にします。このドメイン固有言語(DSL)はCuTeと同じ基本原理を維持し、一貫性のあるAPIと様々なGPUチップで同等の効率性を提供しながら、C++と比較してコンパイル時間を大幅に短縮します。CuTe DSLの使用例はGitHubで公開されており、dense GEMM、grouped GEMM、Fused Multi-Head Attention(FMHA)への応用例が紹介されています。

CuTe DSLは、10年以上にわたりNVIDIA GPUアーキテクチャでCuTeの特徴となってきた堅牢なレイアウト表現と代数構造を維持しています。CuTe C++からCuTe DSLへの移行は開発者にとってシームレスで、主な違いはC++とPythonの構文にあります。この一貫性により、開発者はコンパイル時間を短縮し、CuTe DSLをPythonベースのディープラーニングフレームワークに容易に統合できます。

CuTe DSLのパフォーマンスは、複数世代のNVIDIA GPUでベンチマークされ、CUTLASS C++とほぼ同等のパフォーマンスを提供できることが実証されています。dense GEMM、grouped GEMM、FMHAなどの演算における初期テストでは有望な結果が示されており、継続的な最適化によりパフォーマンスがさらに向上すると期待されています。CuTe DSLはAmpereからBlackwellまで、NVIDIA GPUの世代をサポートしているため、様々な本番環境への適用が可能です。

この記事を共有:

最新のニュース
アンドドット東大生協AI特別講義実施

アンドドット東大生協AI特別講義実施

25/11/20 0:00

アンドドット(東京都渋谷区)は、東京大学生協(東京都文京区)と共催で、東京大学の学生に向けた生成AIに関する特別講義を実施した。

AIデータ量子テクノロジー支援プラットフォーム

AIデータ量子テクノロジー支援プラットフォーム

25/11/20 0:00

AIデータ(東京都港区)は、日本政府のデジタル・科学技術戦略に基づき、「量子テクノロジー」分野に特化したAI基盤「AI Quantum on IDX」の提供を開始すると発表した。

売れるネット広告社AI動画制作効率化

売れるネット広告社AI動画制作効率化

25/11/20 0:00

売れるネット広告社グループ(福岡市)は、連結子会社を通じて動画制作における生成AIの活用を開始した。

Devolutions、AI強化型セキュアリモートデスクトップマネージャーを発表

Devolutions、AI強化型セキュアリモートデスクトップマネージャーを発表

25/11/20 0:00

Devolutionsは、リモートデスクトップマネージャー(RDM)プラットフォーム内のAIアシスタントの機能を強化するために設計された、セキュアな自動化レイヤーである、新しいモデルコンテキストプロトコル(MCP)サーバーを発表しました。

Copyright © 2024 Generatived - All right Reserved.

この記事を共有:

この記事を共有:

Generatived AI Logo

Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。

  • Facebook
  • X

フォローをお願いします

言語

最新のニュース
アンドドット東大生協AI特別講義実施

アンドドット東大生協AI特別講義実施

25/11/20 0:00

アンドドット(東京都渋谷区)は、東京大学生協(東京都文京区)と共催で、東京大学の学生に向けた生成AIに関する特別講義を実施した。

AIデータ量子テクノロジー支援プラットフォーム

AIデータ量子テクノロジー支援プラットフォーム

25/11/20 0:00

AIデータ(東京都港区)は、日本政府のデジタル・科学技術戦略に基づき、「量子テクノロジー」分野に特化したAI基盤「AI Quantum on IDX」の提供を開始すると発表した。

売れるネット広告社AI動画制作効率化

売れるネット広告社AI動画制作効率化

25/11/20 0:00

売れるネット広告社グループ(福岡市)は、連結子会社を通じて動画制作における生成AIの活用を開始した。

Devolutions、AI強化型セキュアリモートデスクトップマネージャーを発表

Devolutions、AI強化型セキュアリモートデスクトップマネージャーを発表

25/11/20 0:00

Devolutionsは、リモートデスクトップマネージャー(RDM)プラットフォーム内のAIアシスタントの機能を強化するために設計された、セキュアな自動化レイヤーである、新しいモデルコンテキストプロトコル(MCP)サーバーを発表しました。

bottom of page