top of page
Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif
logo.png

CUTLASS Mengumumkan Desain Sistem GEMM Hirarkis Baru

Generatived

18/7/25, 00.00

CUTLASS memperkenalkan sistem hierarkis baru untuk implementasi General Matrix Multiplication (GEMM), yang memberikan fleksibilitas lebih tinggi dan memperluas dukungan untuk arsitektur NVIDIA baru. Pendekatan modular ini memungkinkan spesifikasi berbagai hiperparameter yang dapat disesuaikan berdasarkan perangkat keras dan kebutuhan pengguna. Desain ulang pada seri 3.x ini berfokus pada pembangunan sistem blok penyusun ortogonal yang dapat dikonfigurasi, yang meningkatkan keterbacaan kode dan memaksimalkan cakupan implementasi GEMM.

Desain hierarkis CUTLASS 3.x terdiri dari lima lapisan berbeda, dengan setiap lapisan bertindak sebagai titik komposisi untuk abstraksi lapisan sebelumnya. Hal ini memungkinkan pengguna untuk memanfaatkan lapisan tingkat yang lebih tinggi untuk implementasi GEMM yang efisien, atau lapisan tingkat yang lebih rendah untuk kustomisasi tingkat lanjut. Desain ini konsisten dengan desain perangkat keras hierarkis GPU, sehingga cocok untuk aplikasi GPU lainnya.

Pendekatan konstruksi kernel GEMM CUTLASS dijelaskan secara rinci dalam postingan blog kedua dalam seri ini. Postingan ini menjelaskan bagaimana mikrokernel spasial dibangun menggunakan abstraksi CuTe tingkat rendah. Mikrokernel-mikrokernel ini dapat disisipkan dan diubinkan secara acak. Lapisan kolektif mengoordinasikan eksekusi mikrokernel-mikrokernel ini, menggunakan sinkronisasi khusus arsitektur, untuk menghitung satu ubin keluaran.

Lapisan kernel mencakup seluruh ruang permasalahan dan menskalakan pekerjaan ensemble ke grid, sementara lapisan perangkat menyediakan pengaturan dan antarmuka sisi host. CUTLASS menyediakan berbagai implementasi loop utama ensemble khusus dan epilog yang tersedia di folder ensemble GEMM di GitHub. Komponen-komponen ini sangat dapat dikustomisasi, memungkinkan pengguna untuk menentukan loop utama GEMM secara tepat.

Filosofi desain CUTLASS menekankan pentingnya komposisi dan ortogonalitas dalam menciptakan implementasi GEMM yang dapat dikustomisasi. Struktur pustaka ini bertujuan untuk memungkinkan berbagai implementasi GEMM yang sangat dapat dikustomisasi dengan tingkat penggunaan ulang kode yang tinggi. Pengguna yang tertarik dengan desain ini dapat mengakses perangkat lunak di GitHub, melihat dokumentasi, atau bergabung dengan forum pengembang untuk diskusi lebih lanjut.

Bagikan artikel ini:

Tin tức mới nhất
Dropbox meluncurkan tiga aplikasi produktivitas dengan integrasi ChatGPT.

Dropbox meluncurkan tiga aplikasi produktivitas dengan integrasi ChatGPT.

21/4/26, 00.00

Dropbox Jepang mengumumkan tiga aplikasi terintegrasi ChatGPT untuk meningkatkan efisiensi alur kerja.

ChillStack NEC Meluncurkan Layanan Integrasi AI untuk Pengelolaan Biaya

ChillStack NEC Meluncurkan Layanan Integrasi AI untuk Pengelolaan Biaya

21/4/26, 00.00

ChillStack dan NEC mengumumkan integrasi cloud audit pengeluaran berbasis AI dengan sistem manajemen administratif

NTT Data Advanced Tech menambahkan tsuzumi 2

NTT Data Advanced Tech menambahkan tsuzumi 2

21/4/26, 00.00

NTT Data Advanced Tech mengumumkan telah memulai dukungan validasi untuk model bahasa besar “tsuzumi 2” dalam INTELLILINK Private AI Starter Pack miliknya

Richka Menambahkan Fitur Pembuatan Video Otomatis

Richka Menambahkan Fitur Pembuatan Video Otomatis

21/4/26, 00.00

Richka mengumumkan penambahan fitur pada layanan cloud-nya yang menghasilkan banyak video iklan dari data LP dan gambar.

Copyright © 2024 Generatived - All right Reserved.

Bagikan artikel ini:

Bagikan artikel ini:

Generatived

Hãy theo dõi chúng tôi

  • Facebook
  • X

Bahasa

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Generatived AI Logo

Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.

  • Facebook
  • X

Ikuti kami

Bahasa

Berita terkini
Dropbox meluncurkan tiga aplikasi produktivitas dengan integrasi ChatGPT.

Dropbox meluncurkan tiga aplikasi produktivitas dengan integrasi ChatGPT.

21/4/26, 00.00

Dropbox Jepang mengumumkan tiga aplikasi terintegrasi ChatGPT untuk meningkatkan efisiensi alur kerja.

ChillStack NEC Meluncurkan Layanan Integrasi AI untuk Pengelolaan Biaya

ChillStack NEC Meluncurkan Layanan Integrasi AI untuk Pengelolaan Biaya

21/4/26, 00.00

ChillStack dan NEC mengumumkan integrasi cloud audit pengeluaran berbasis AI dengan sistem manajemen administratif

NTT Data Advanced Tech menambahkan tsuzumi 2

NTT Data Advanced Tech menambahkan tsuzumi 2

21/4/26, 00.00

NTT Data Advanced Tech mengumumkan telah memulai dukungan validasi untuk model bahasa besar “tsuzumi 2” dalam INTELLILINK Private AI Starter Pack miliknya

Richka Menambahkan Fitur Pembuatan Video Otomatis

Richka Menambahkan Fitur Pembuatan Video Otomatis

21/4/26, 00.00

Richka mengumumkan penambahan fitur pada layanan cloud-nya yang menghasilkan banyak video iklan dari data LP dan gambar.

bottom of page