Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif

NVIDIA Mengumumkan Server Inferensi untuk Penerapan AI
Generatived
22/11/24, 04.30
NVIDIA telah memperkenalkan solusi baru yang menyederhanakan penerapan model AI yang disesuaikan dengan data spesifik domain. NVIDIA Inference Server (NIS) menyediakan layanan mikro inferensi bawaan untuk mengintegrasikan model dasar AI dengan cepat ke dalam aplikasi perusahaan. Layanan mikro ini dirancang untuk mendukung model yang disempurnakan dalam berbagai cara, seperti penyesuaian efisien parameter (PEFT), untuk memastikan performa optimal.
Perusahaan telah mengembangkan proses yang menghilangkan kerumitan konfigurasi perangkat lunak inferensi saat menyesuaikan bobot model secara langsung selama pelatihan. NIS NVIDIA dapat secara otomatis membuat mesin inferensi TensorRT-LLM yang disesuaikan dengan model spesifik dan konfigurasi GPU Anda, sehingga menyederhanakan penerapan dalam satu langkah.
Tutorial terbaru NVIDIA memperkenalkan penerapan layanan mikro NIS untuk model yang disesuaikan menggunakan penyempurnaan yang diawasi (SFT). Panduan ini memberikan petunjuk mendetail dan perintah yang diperlukan untuk membuat dan menerapkan mesin inferensi TensorRT-LLM yang dioptimalkan performa secara lokal. Prasyaratnya mencakup lingkungan komputasi terakselerasi NVIDIA dengan memori GPU yang memadai dan instalasi perangkat lunak khusus.
Perusahaan menekankan kemudahan memilih profil kinerja mesin inferensinya. Profil ini secara otomatis beradaptasi dengan perangkat keras dan pilihan model Anda. Profil ini dirancang untuk mengoptimalkan latensi atau throughput bergantung pada kebutuhan aplikasi Anda. Upaya NVIDIA dirancang untuk mempercepat adopsi kemampuan inferensi AI, menyediakan sumber daya dan dukungan komunitas melalui forum dan dokumentasi pengembang.
Bagikan artikel ini:
Tin tức mới nhất
Dukungan otomatisasi pengujian aplikasi Autify GMO
30/5/25, 00.00
Autify (Chuo-ku, Tokyo) membantu GMO Internet mengotomatiskan pengujian untuk pengembangan aplikasinya menggunakan Autify NoCode, alat otomatisasi pengujian berbasis AI.
QTnet dan And.net menjalin aliansi modal
30/5/25, 00.00
QTnet (Kota Fukuoka) telah menandatangani aliansi modal dan bisnis dengan And.net (Kota Fukuoka).
Panduan Pemanfaatan AI Produksi Materi Pengajaran Mogic
30/5/25, 00.00
Mogic (Nerima-ku, Tokyo) telah menerbitkan kolom yang memperkenalkan cara menggunakan Generative AI untuk membuat materi pengajaran untuk sistem e-learning "LearnO."
Copyright © 2024 Generatived - All right Reserved.
Bagikan artikel ini:
Bagikan artikel ini:
Kategori
Berita
AI dan hukum/peraturan/masyarakat
Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.
Berita terkini
Dukungan otomatisasi pengujian aplikasi Autify GMO
30/5/25, 00.00
Autify (Chuo-ku, Tokyo) membantu GMO Internet mengotomatiskan pengujian untuk pengembangan aplikasinya menggunakan Autify NoCode, alat otomatisasi pengujian berbasis AI.
QTnet dan And.net menjalin aliansi modal
30/5/25, 00.00
QTnet (Kota Fukuoka) telah menandatangani aliansi modal dan bisnis dengan And.net (Kota Fukuoka).
Panduan Pemanfaatan AI Produksi Materi Pengajaran Mogic
30/5/25, 00.00
Mogic (Nerima-ku, Tokyo) telah menerbitkan kolom yang memperkenalkan cara menggunakan Generative AI untuk membuat materi pengajaran untuk sistem e-learning "LearnO."