Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

NVIDIA phát hành CuTe DSL để dễ dàng phát triển GPU

Generatived

0:00 17/11/25

CuTe, một thành phần quan trọng của CUTLASS 3.x, đã đóng vai trò then chốt trong việc giúp các nhà phát triển kernel tối ưu hóa hiệu suất trên Tensor Core bằng cách đơn giản hóa bố cục dữ liệu và ánh xạ luồng. Tuy nhiên, việc CUTLASS 3.x sử dụng nhiều mẫu C++ đã dẫn đến thời gian biên dịch lâu. Do việc sử dụng Python và biên dịch JIT ngày càng tăng trong quy trình làm việc AI, các nhà phát triển đã giới thiệu CUTLASS 4 để giải quyết những thách thức này.

CuTe DSL, mới được giới thiệu trong CUTLASS 4, đơn giản hóa việc phát triển nhân GPU bằng cách mở rộng khả năng của CuTe sang Python và loại bỏ sự phức tạp của siêu lập trình mẫu C++. Ngôn ngữ chuyên ngành (DSL) này duy trì các nguyên tắc cơ bản giống như CuTe, cung cấp API nhất quán và hiệu quả tương tự trên nhiều chip GPU khác nhau, đồng thời giảm đáng kể thời gian biên dịch so với C++. Các ví dụ về việc sử dụng CuTe DSL có sẵn trên GitHub, giới thiệu ứng dụng của nó cho GEMM dày đặc, GEMM nhóm và Fused Multi-Head Attention (FMHA).

CuTe DSL duy trì các biểu diễn bố cục mạnh mẽ và cấu trúc đại số đặc trưng của CuTe trên kiến trúc GPU NVIDIA trong hơn một thập kỷ. Việc chuyển đổi từ CuTe C++ sang CuTe DSL diễn ra liền mạch đối với các nhà phát triển, với những khác biệt chính nằm ở cú pháp C++ và Python . Tính nhất quán này cho phép các nhà phát triển giảm thời gian biên dịch và dễ dàng tích hợp CuTe DSL vào các nền tảng học sâu dựa trên Python.

Hiệu năng của CuTe DSL đã được đánh giá chuẩn trên nhiều thế hệ GPU NVIDIA, chứng minh rằng nó có thể cung cấp hiệu năng gần như tương đương với CUTLASS C++. Các thử nghiệm ban đầu trên các hoạt động như GEMM dày đặc, GEMM nhóm và FMHA đã cho thấy kết quả khả quan, và việc tiếp tục tối ưu hóa dự kiến sẽ cải thiện hiệu năng hơn nữa. CuTe DSL hỗ trợ các thế hệ GPU NVIDIA từ Ampere đến Blackwell, giúp nó có thể áp dụng cho nhiều môi trường sản xuất khác nhau.

Nguồn: Blog nhà phát triển NVIDIA

Chia sẻ bài viết này:

Tin tức mới nhất

Microsoft và OpenAI tiếp tục thúc đẩy hợp tác trong lĩnh vực trí tuệ nhân tạo.

0:00 3/3/26

Microsoft và OpenAI đã tái khẳng định cam kết thúc đẩy trí tuệ nhân tạo thông qua mối quan hệ hợp tác phát triển mạnh mẽ từ năm 2019.

đọc thêm

NVIDIA công bố bản thiết kế mạng tự động và mô hình AI.

0:00 3/3/26

Ngành viễn thông đang chuyển trọng tâm sang các mạng tự động, với báo cáo mới nhất từ NVIDIA nhấn mạnh tự động hóa mạng là lĩnh vực đầu tư hàng đầu cho

đọc thêm

NVIDIA giới thiệu những tiến bộ về AI-RAN tại Mobile Congress

0:00 3/3/26

NVIDIA và Nokia dự kiến sẽ giới thiệu những tiến bộ của họ trong công nghệ AI-RAN tại Đại hội Di động Thế giới sắp tới ở Barcelona.

đọc thêm

OpenAI và Amazon công bố hợp tác trị giá 50 tỷ đô la trong lĩnh vực trí tuệ nhân tạo.

0:00 3/3/26

OpenAI đã ký kết thỏa thuận hợp tác chiến lược với Amazon, nhằm mục đích đẩy nhanh sự đổi mới trí tuệ nhân tạo (AI) trên quy mô toàn cầu.

đọc thêm

Chia sẻ bài viết này:

Danh mục

Trình nâng cao hình ảnh AI

Trình tạo mã AI

Quản lý tác vụ AI

Không có mã/mã thấp

Trình tạo thiết kế đồ họa AI

Trình tạo minh họa/nghệ thuật AI

Tất cả công cụ

Tin tức

AI và luật/hệ thống/kinh tế/xã hội

Các công ty/sản phẩm/công nghệ AI

AI công nghệ lớn

OpenAI/ChatGPT

AI thế hệ sáng tạo

AI thế hệ dựa trên văn bản

AI sáng tạo của Nhật Bản

Cơ bản về AI sáng tạo

Hướng dẫn ứng dụng AI cơ bản

Hồ sơ công ty

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng trang web

Công ty điều hành

Hãy theo dõi chúng tôi

Ngôn ngữ

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Hãy theo dõi chúng tôi

Ngôn ngữ

Danh mục

Tất cả công cụ

Quản lý tác vụ AI

Trình tạo thiết kế đồ họa AI

Không có mã/mã thấp

Trình tạo mã AI

Trình nâng cao hình ảnh AI

Trình tạo minh họa/nghệ thuật AI

AI và luật/hệ thống/kinh tế/xã hội

Các công ty/sản phẩm/công nghệ AI

AI công nghệ lớn

OpenAI/ChatGPT

AI thế hệ sáng tạo

AI thế hệ dựa trên văn bản

AI sáng tạo của Nhật Bản

Cơ bản về AI tạo ra

Hướng dẫn ứng dụng AI cơ bản

Tin tức

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng của trang web

Công ty điều hành

Hồ sơ công ty

Tin tức mới nhất

Microsoft và OpenAI tiếp tục thúc đẩy hợp tác trong lĩnh vực trí tuệ nhân tạo.

0:00 3/3/26

Microsoft và OpenAI đã tái khẳng định cam kết thúc đẩy trí tuệ nhân tạo thông qua mối quan hệ hợp tác phát triển mạnh mẽ từ năm 2019.

đọc thêm

NVIDIA công bố bản thiết kế mạng tự động và mô hình AI.

0:00 3/3/26

Ngành viễn thông đang chuyển trọng tâm sang các mạng tự động, với báo cáo mới nhất từ NVIDIA nhấn mạnh tự động hóa mạng là lĩnh vực đầu tư hàng đầu cho

đọc thêm

NVIDIA giới thiệu những tiến bộ về AI-RAN tại Mobile Congress

0:00 3/3/26

NVIDIA và Nokia dự kiến sẽ giới thiệu những tiến bộ của họ trong công nghệ AI-RAN tại Đại hội Di động Thế giới sắp tới ở Barcelona.

đọc thêm

OpenAI và Amazon công bố hợp tác trị giá 50 tỷ đô la trong lĩnh vực trí tuệ nhân tạo.

0:00 3/3/26

OpenAI đã ký kết thỏa thuận hợp tác chiến lược với Amazon, nhằm mục đích đẩy nhanh sự đổi mới trí tuệ nhân tạo (AI) trên quy mô toàn cầu.

đọc thêm