top of page
Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif
logo.png

CUTLASS Mengumumkan Desain Sistem GEMM Hirarkis Baru

Generatived

18/7/25, 00.00

CUTLASS memperkenalkan sistem hierarkis baru untuk implementasi General Matrix Multiplication (GEMM), yang memberikan fleksibilitas lebih tinggi dan memperluas dukungan untuk arsitektur NVIDIA baru. Pendekatan modular ini memungkinkan spesifikasi berbagai hiperparameter yang dapat disesuaikan berdasarkan perangkat keras dan kebutuhan pengguna. Desain ulang pada seri 3.x ini berfokus pada pembangunan sistem blok penyusun ortogonal yang dapat dikonfigurasi, yang meningkatkan keterbacaan kode dan memaksimalkan cakupan implementasi GEMM.

Desain hierarkis CUTLASS 3.x terdiri dari lima lapisan berbeda, dengan setiap lapisan bertindak sebagai titik komposisi untuk abstraksi lapisan sebelumnya. Hal ini memungkinkan pengguna untuk memanfaatkan lapisan tingkat yang lebih tinggi untuk implementasi GEMM yang efisien, atau lapisan tingkat yang lebih rendah untuk kustomisasi tingkat lanjut. Desain ini konsisten dengan desain perangkat keras hierarkis GPU, sehingga cocok untuk aplikasi GPU lainnya.

Pendekatan konstruksi kernel GEMM CUTLASS dijelaskan secara rinci dalam postingan blog kedua dalam seri ini. Postingan ini menjelaskan bagaimana mikrokernel spasial dibangun menggunakan abstraksi CuTe tingkat rendah. Mikrokernel-mikrokernel ini dapat disisipkan dan diubinkan secara acak. Lapisan kolektif mengoordinasikan eksekusi mikrokernel-mikrokernel ini, menggunakan sinkronisasi khusus arsitektur, untuk menghitung satu ubin keluaran.

Lapisan kernel mencakup seluruh ruang permasalahan dan menskalakan pekerjaan ensemble ke grid, sementara lapisan perangkat menyediakan pengaturan dan antarmuka sisi host. CUTLASS menyediakan berbagai implementasi loop utama ensemble khusus dan epilog yang tersedia di folder ensemble GEMM di GitHub. Komponen-komponen ini sangat dapat dikustomisasi, memungkinkan pengguna untuk menentukan loop utama GEMM secara tepat.

Filosofi desain CUTLASS menekankan pentingnya komposisi dan ortogonalitas dalam menciptakan implementasi GEMM yang dapat dikustomisasi. Struktur pustaka ini bertujuan untuk memungkinkan berbagai implementasi GEMM yang sangat dapat dikustomisasi dengan tingkat penggunaan ulang kode yang tinggi. Pengguna yang tertarik dengan desain ini dapat mengakses perangkat lunak di GitHub, melihat dokumentasi, atau bergabung dengan forum pengembang untuk diskusi lebih lanjut.

Bagikan artikel ini:

Tin tức mới nhất
MiniMax NVIDIA merilis model terbuka M2.7.

MiniMax NVIDIA merilis model terbuka M2.7.

15/4/26, 00.00

MiniMax M2.7 telah diperkenalkan sebagai pembaruan model M2.5 yang ditujukan untuk alur kerja berbasis agen dan tugas penalaran kompleks dalam perangkat lunak dan rekayasa.

MediaFusion meluncurkan sistem manajemen dukungan berbasis Teams, DX.

MediaFusion meluncurkan sistem manajemen dukungan berbasis Teams, DX.

15/4/26, 00.00

MediaFusion mengumumkan sistem berbasis Teams untuk memusatkan manajemen dukungan pengguna

Highreso meluncurkan kurikulum AI menggunakan layanan PICSOROBAN

Highreso meluncurkan kurikulum AI menggunakan layanan PICSOROBAN

15/4/26, 00.00

Highreso mengumumkan peluncuran kurikulum yang berfokus pada AI menggunakan layanan PICSOROBAN di sebuah sekolah kejuruan

SalesRequest meluncurkan model berbasis kinerja layanan penjualan AI.

SalesRequest meluncurkan model berbasis kinerja layanan penjualan AI.

15/4/26, 00.00

SalesRequest mengumumkan peluncuran layanan dukungan penjualan berbasis AI yang berfokus pada kinerja

Copyright © 2024 Generatived - All right Reserved.

Bagikan artikel ini:

Bagikan artikel ini:

Generatived

Hãy theo dõi chúng tôi

  • Facebook
  • X

Bahasa

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Generatived AI Logo

Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.

  • Facebook
  • X

Ikuti kami

Bahasa

Berita terkini
MiniMax NVIDIA merilis model terbuka M2.7.

MiniMax NVIDIA merilis model terbuka M2.7.

15/4/26, 00.00

MiniMax M2.7 telah diperkenalkan sebagai pembaruan model M2.5 yang ditujukan untuk alur kerja berbasis agen dan tugas penalaran kompleks dalam perangkat lunak dan rekayasa.

MediaFusion meluncurkan sistem manajemen dukungan berbasis Teams, DX.

MediaFusion meluncurkan sistem manajemen dukungan berbasis Teams, DX.

15/4/26, 00.00

MediaFusion mengumumkan sistem berbasis Teams untuk memusatkan manajemen dukungan pengguna

Highreso meluncurkan kurikulum AI menggunakan layanan PICSOROBAN

Highreso meluncurkan kurikulum AI menggunakan layanan PICSOROBAN

15/4/26, 00.00

Highreso mengumumkan peluncuran kurikulum yang berfokus pada AI menggunakan layanan PICSOROBAN di sebuah sekolah kejuruan

SalesRequest meluncurkan model berbasis kinerja layanan penjualan AI.

SalesRequest meluncurkan model berbasis kinerja layanan penjualan AI.

15/4/26, 00.00

SalesRequest mengumumkan peluncuran layanan dukungan penjualan berbasis AI yang berfokus pada kinerja

bottom of page