Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif
%20(1).webp)
NVIDIA Torch-TensorRT Meningkatkan Performa Model PyTorch
Generatived
28/7/25, 00.00
TensorRT NVIDIA meningkatkan penerapan model pembelajaran mesin pada GPU dengan mengoptimalkan model AI agar berjalan lebih efisien pada perangkat keras tertentu. Dengan menggunakan teknik seperti fusi lapisan dan pemilihan taktik kernel secara otomatis, TensorRT dikustomisasi untuk berjalan pada perangkat keras khusus NVIDIA, termasuk Blackwell Tensor Cores. Optimalisasi ini penting untuk mempercepat komputasi pada model pembelajaran mesin yang kompleks.
Torch-TensorRT, sebuah kompiler untuk model PyTorch, menjembatani kesenjangan performa dengan memungkinkan model mencapai performa setingkat TensorRT pada GPU NVIDIA. Alat ini memungkinkan pengembang untuk tetap mudah menggunakan PyTorch sekaligus berpotensi mencapai peningkatan performa 2 kali lipat dibandingkan PyTorch asli, tanpa perlu memodifikasi API PyTorch yang sudah ada. Tulisan blog ini merinci bagaimana Torch-TensorRT menyederhanakan optimasi dan mendemonstrasikan bagaimana perubahan kode minimal dapat menghasilkan peningkatan performa yang signifikan. Misalnya, dengan satu baris kode, model AI dengan 12 miliar parameter dapat mencapai peningkatan performa 1,5 kali lipat dibandingkan PyTorch FP16 asli, dan peningkatan performa 2,4 kali lipat lebih lanjut dapat dicapai dengan menerapkan kuantisasi FP8.
Integrasi Torch-TensorRT dengan alur kerja diffuser canggih seperti Adaptasi Tingkat Rendah (LoRA) memungkinkan penyesuaian ulang model secara cepat. Fitur ini sangat bermanfaat bagi pengembang yang menggunakan HuggingFace Diffusers, sebuah SDK yang menyediakan akses ke berbagai model canggih dan mendukung kasus penggunaan kompleks seperti fine-tuning. Torch-TensorRT menyederhanakan proses optimasi dalam alur diffuser, sehingga menghilangkan kebutuhan akan langkah-langkah perantara atau pengkodean tambahan saat terjadi perubahan pada alur.
Modul Mutable Torch-TensorRT (MTTM) dari Torch-TensorRT dirancang untuk mengoptimalkan modul PyTorch secara langsung dengan TensorRT sambil mempertahankan semua fungsionalitas model aslinya. Fitur ini sangat menguntungkan untuk aplikasi dengan bobot atau grafik dinamis, karena secara otomatis beradaptasi terhadap perubahan dengan melakukan refitting atau mengompilasi ulang fungsi forward. MTTM juga dapat diserialisasi, menyediakan pendekatan hibrida kompilasi Ahead-Of-Time (AOT) dan Just-In-Time (JIT). Hal ini bermanfaat bagi developer yang perlu mengirimkan modul prakompilasi yang dapat beradaptasi dengan perubahan runtime.
Bagikan artikel ini:
Tin tức mới nhất
Fitur baru ditambahkan ke Rakuten LinkSurge
17/2/26, 00.00
LinkShare Japan, anggota dari Rakuten Group, telah menambahkan fungsi dasbor ke LinkSurge, yang dikembangkan bekerja sama dengan Benji.
Dukungan Avatar AI Cloud Pelanggan
17/2/26, 00.00
Customer Cloud (Shibuya-ku, Tokyo) telah meluncurkan layanan yang memanfaatkan Generative AI dan teknologi avatar AI untuk mendukung pengembangan avatar digital bagi
Eksperimen demonstrasi AI pengisian daya EV Verbex ENEOS dimulai.
17/2/26, 00.00
Verbex berkolaborasi dengan ENEOS Holdings dan ENEOS untuk meluncurkan proyek percontohan yang bertujuan untuk meningkatkan kualitas layanan pelanggan
Copyright © 2024 Generatived - All right Reserved.
Bagikan artikel ini:
Bagikan artikel ini:
Kategori
Berita
AI dan hukum/peraturan/masyarakat
Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.
Berita terkini
Fitur baru ditambahkan ke Rakuten LinkSurge
17/2/26, 00.00
LinkShare Japan, anggota dari Rakuten Group, telah menambahkan fungsi dasbor ke LinkSurge, yang dikembangkan bekerja sama dengan Benji.
Dukungan Avatar AI Cloud Pelanggan
17/2/26, 00.00
Customer Cloud (Shibuya-ku, Tokyo) telah meluncurkan layanan yang memanfaatkan Generative AI dan teknologi avatar AI untuk mendukung pengembangan avatar digital bagi
Eksperimen demonstrasi AI pengisian daya EV Verbex ENEOS dimulai.
17/2/26, 00.00
Verbex berkolaborasi dengan ENEOS Holdings dan ENEOS untuk meluncurkan proyek percontohan yang bertujuan untuk meningkatkan kualitas layanan pelanggan

%20(1).webp)




