top of page
Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif
logo.png

Model AI NVIDIA Mendukung Generasi Kernel GPU

Generatived

13/2/25, 04.30

Untuk mengatasi tantangan pembuatan kernel perhatian GPU tanpa pemrograman eksplisit, teknisi NVIDIA melakukan eksperimen dengan model AI DeepSeek-R1 sumber terbuka. Dengan memanfaatkan daya komputasi tambahan selama fase inferensi, model tersebut mampu menghasilkan kernel yang, dalam beberapa kasus, mengungguli kernel yang dibuat oleh teknisi berpengalaman. Pendekatan ini, yang disebut penskalaan waktu pengujian, meningkatkan kinerja AI dengan mempertimbangkan beberapa hasil sebelum memilih yang paling efektif.

Konsep perhatian telah memainkan peran penting dalam kemajuan model bahasa skala besar (LLM), yang memungkinkan AI untuk fokus pada segmen data yang relevan guna meningkatkan prediksi dan menemukan pola tersembunyi. Namun, kompleksitas operasi perhatian bertambah seiring dengan panjangnya urutan input, yang memerlukan kernel GPU yang dioptimalkan demi efisiensi dan menghindari masalah waktu proses. Teknisi sering kali menggabungkan berbagai varian perhatian untuk menangani tugas tertentu, yang selanjutnya mempersulit pembuatan kernel yang dioptimalkan ini.

Untuk mengatasi kompleksitas ini, teknisi NVIDIA merancang alur kerja yang menggabungkan model DeepSeek-R1 dengan alat validasi yang berjalan pada GPU NVIDIA H100. Dimulai dengan perintah manual, sistem loop tertutup ini menyempurnakan kode GPU yang dihasilkan secara berulang. Proses 15 menit tersebut menghasilkan kernel yang benar secara numerik untuk semua masalah Level 1 dan 96% masalah Level 2, menurut tolok ukur KernelBench Universitas Stanford.

Hasil dari eksperimen kami menunjukkan bahwa memanfaatkan penskalaan waktu pengujian dapat secara signifikan meningkatkan pembuatan kernel GPU yang dioptimalkan. Kemampuan model DeepSeek-R1 untuk secara otomatis menghasilkan kernel perhatian yang efektif menunjukkan potensi area penelitian baru ini. Meskipun lebih banyak pekerjaan diperlukan untuk mencapai hasil yang baik secara konsisten pada rentang masalah yang lebih luas, hasil awal cukup menjanjikan. Pihak yang berminat dapat mempelajari lebih lanjut di layanan mikro NIM DeepSeek-R1.

Bagikan artikel ini:

Tin tức mới nhất
NVIDIA Memperluas Keterampilan Terverifikasi untuk Agen AI

NVIDIA Memperluas Keterampilan Terverifikasi untuk Agen AI

27/5/26, 00.00

NVIDIA memperkenalkan kemampuan agen terverifikasi NVIDIA untuk meningkatkan transparansi dan kepercayaan dalam alur kerja agen AI otonom.

Google Menambahkan Street View ke Project Genie

Google Menambahkan Street View ke Project Genie

27/5/26, 00.00

Google mengumumkan fitur dasar Street View baru untuk model dunia generatifnya, Project Genie, yang memungkinkan lingkungan virtual dibangun dari citra dunia nyata.

AdventHealth Memperluas Alur Kerja AI dengan ChatGPT

AdventHealth Memperluas Alur Kerja AI dengan ChatGPT

27/5/26, 00.00

AdventHealth mengumumkan penerapan ChatGPT for Healthcare di seluruh sistem rumah sakitnya untuk mengurangi beban kerja administratif dan meningkatkan alur kerja klinis.

VURA Meluncurkan Strategi AI untuk Mendefinisikan Ulang Kapitalisme

VURA Meluncurkan Strategi AI untuk Mendefinisikan Ulang Kapitalisme

27/5/26, 00.00

VURA Capital Innovation mengumumkan kerangka kerja baru yang disebut “Redefinisi Kapitalisme” yang bertujuan untuk mendukung transformasi nilai perusahaan

Copyright © 2024 Generatived - All right Reserved.

Bagikan artikel ini:

Bagikan artikel ini:

Generatived

Hãy theo dõi chúng tôi

  • Facebook
  • X

Bahasa

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Generatived AI Logo

Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.

  • Facebook
  • X

Ikuti kami

Bahasa

Berita terkini
NVIDIA Memperluas Keterampilan Terverifikasi untuk Agen AI

NVIDIA Memperluas Keterampilan Terverifikasi untuk Agen AI

27/5/26, 00.00

NVIDIA memperkenalkan kemampuan agen terverifikasi NVIDIA untuk meningkatkan transparansi dan kepercayaan dalam alur kerja agen AI otonom.

Google Menambahkan Street View ke Project Genie

Google Menambahkan Street View ke Project Genie

27/5/26, 00.00

Google mengumumkan fitur dasar Street View baru untuk model dunia generatifnya, Project Genie, yang memungkinkan lingkungan virtual dibangun dari citra dunia nyata.

AdventHealth Memperluas Alur Kerja AI dengan ChatGPT

AdventHealth Memperluas Alur Kerja AI dengan ChatGPT

27/5/26, 00.00

AdventHealth mengumumkan penerapan ChatGPT for Healthcare di seluruh sistem rumah sakitnya untuk mengurangi beban kerja administratif dan meningkatkan alur kerja klinis.

VURA Meluncurkan Strategi AI untuk Mendefinisikan Ulang Kapitalisme

VURA Meluncurkan Strategi AI untuk Mendefinisikan Ulang Kapitalisme

27/5/26, 00.00

VURA Capital Innovation mengumumkan kerangka kerja baru yang disebut “Redefinisi Kapitalisme” yang bertujuan untuk mendukung transformasi nilai perusahaan

bottom of page