NVIDIAは、GPUアクセラレーションの力を活用してAIおよびHPCアプリケーションを高速化するように設計されたツールであるcuBLASライブラリーの機能強化を発表した。このライブラリーには、業界標準のBLAS APIに合わせたさまざまなAPI拡張機能と、NVIDIAのGPUで最適なパフォーマンスが得られるように細かく調整されたGEMM APIが含まれるようになった。これらの改善は、人工知能とハイパフォーマンスコンピューティングの分野で働く開発者にとって、より効率的な計算を促進することを目的としているとのこと。

更新されたcuBLASライブラリーは、さまざまな計算シナリオに対応する機能で機能を拡張している。バッチ操作とグループ化されたGEMMがサポートされるようになり、より柔軟でスケーラブルな計算が可能になった。さらに、このライブラリーには複数のGPUにわたるタスクを処理する機能が備わっており、大規模な並列処理タスクの範囲が広がる。

コンピューティングコミュニティーの多様なニーズを満たすため、NVIDIAのcuBLASライブラリーでは、混合および低精度実行のサポートも導入された。この機能強化は、高精度を必要としないアプリケーションにとって特に有益であり、消費する計算リソースを減らしながら高速に実行できるようになる。同社は、ユーザーがこれらの新機能を利用する際に可能な限り最高のパフォーマンスを達成できるように、ライブラリーを微調整することにも重点を置いているとのことだ。

ソース:NVIDIA Developer Blog