Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif
%20(1).webp)
NVIDIA Mendukung RTX AI Toolkit untuk AI yang Efisien
Generatived
29/8/24, 02.00
NVIDIA mengumumkan pembaruan pada RTX AI Toolkit yang meningkatkan performa model AI yang disempurnakan pada PC dan stasiun kerja RTX. Toolkit ini sekarang mendukung penggunaan beberapa adaptor Low Rank Adaptive (LoRA) dalam perpustakaan akselerasi AI TensorRT-LLM, yang dapat meningkatkan performa model hingga 6x. Kemajuan ini memungkinkan pengembang untuk menyesuaikan model bahasa skala besar (LLM) secara lebih efisien untuk aplikasi tertentu, seperti dialog video game atau respons asisten digital.
Menyesuaikan LLM penting bagi pengembang untuk memenuhi kebutuhan aplikasi tertentu. Hal ini karena model ini awalnya dilatih pada kumpulan data yang sangat besar dan mungkin tidak memiliki konteks yang diperlukan untuk tugas tertentu. Dengan menyempurnakan model dengan data yang relevan, pengembang dapat mencapai keluaran yang lebih akurat dan sesuai konteks. RTX AI Toolkit memfasilitasi proses ini dengan memungkinkan penggunaan beberapa adaptor LoRA secara bersamaan, memungkinkan berbagai proses penyesuaian terjadi secara bersamaan tanpa memerlukan beberapa model, yang tidak praktis karena keterbatasan memori GPU.
Kemampuan penyajian multi-LoRA yang diperkenalkan oleh NVIDIA merupakan peningkatan besar bagi pengembang yang bekerja dengan model AI. Dengan menghubungkan adaptor LoRA yang berbeda, satu model dasar dapat digunakan untuk beberapa kasus penggunaan. Setiap adaptor memberikan detail spesifik yang diperlukan untuk tugas berbeda. Pendekatan ini tidak hanya menjaga jejak memori tetap rendah, namun juga memaksimalkan efisiensi GPU dengan memproses beberapa panggilan secara paralel. Hasilnya, pengembang dapat memanfaatkan kekuatan GPU NVIDIA untuk dengan cepat melakukan iterasi dan meningkatkan keluaran berbasis AI, seperti teks dan gambar, untuk aplikasi mereka.
Pembaruan terkini pada perangkat RTX AI NVIDIA menyoroti semakin pentingnya LLM dalam lingkungan AI. Dengan kemampuan untuk mempercepat kinerja model dan menyederhanakan proses penyesuaian, pengembang kini dapat membuat aplikasi AI yang kuat dan disesuaikan dengan lebih baik. Dukungan Multi-LoRA diharapkan semakin mendorong adopsi dan integrasi LLM di seluruh industri guna memenuhi permintaan yang terus meningkat akan solusi AI khusus aplikasi yang canggih.
Bagikan artikel ini:
Tin tức mới nhất
Entity Tech Merilis Laporan Pengembangan AI yang Bertanggung Jawab
19/2/26, 00.00
Pada tahun 2025, AI telah mengalami lompatan signifikan, menjadi bagian integral dari kehidupan sehari-hari bagi individu dan bisnis di seluruh dunia.
Perangkat promosi penjualan AI generasi berikutnya, TOUCH TO GO, diluncurkan.
18/2/26, 00.00
TOUCH TO GO (Minato-ku, Tokyo) akan merilis "TTG-HELLO," perangkat promosi penjualan bertenaga AI generasi berikutnya, pada 20 Maret 2026.
Dukungan untuk pembangunan infrastruktur pemanfaatan AI Magic Semi yang aman.
18/2/26, 00.00
Magic Semi (Tokyo) menunjukkan bahwa seiring dengan meluasnya penggunaan Generative AI dalam bisnis, penanganan data bisnis yang masih berada di terminal PC menjadi
Copyright © 2024 Generatived - All right Reserved.
Bagikan artikel ini:
Bagikan artikel ini:
Kategori
Berita
AI dan hukum/peraturan/masyarakat
Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.
Berita terkini
Entity Tech Merilis Laporan Pengembangan AI yang Bertanggung Jawab
19/2/26, 00.00
Pada tahun 2025, AI telah mengalami lompatan signifikan, menjadi bagian integral dari kehidupan sehari-hari bagi individu dan bisnis di seluruh dunia.
Perangkat promosi penjualan AI generasi berikutnya, TOUCH TO GO, diluncurkan.
18/2/26, 00.00
TOUCH TO GO (Minato-ku, Tokyo) akan merilis "TTG-HELLO," perangkat promosi penjualan bertenaga AI generasi berikutnya, pada 20 Maret 2026.
Dukungan untuk pembangunan infrastruktur pemanfaatan AI Magic Semi yang aman.
18/2/26, 00.00
Magic Semi (Tokyo) menunjukkan bahwa seiring dengan meluasnya penggunaan Generative AI dalam bisnis, penanganan data bisnis yang masih berada di terminal PC menjadi




%20(1).webp)

