Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif
NVIDIA Memperkenalkan Server Inferensi untuk Penerapan AI
Generatived
24/11/22 4:30
NVIDIA telah memperkenalkan solusi baru yang menyederhanakan penerapan model AI yang disesuaikan untuk data khusus domain. NVIDIA Inference Server (NIS) menyediakan layanan mikro inferensi yang telah dibuat sebelumnya untuk mengintegrasikan model berbasis AI dengan cepat ke dalam aplikasi perusahaan. Layanan mikro ini dirancang untuk mendukung model yang disesuaikan dengan berbagai metode, seperti penyempurnaan parameter-efisien (PEFT), untuk memastikan kinerja yang optimal.
Perusahaan telah mengembangkan proses yang menghilangkan kerumitan dalam mengonfigurasi perangkat lunak inferensi saat menyetel bobot model secara langsung selama pelatihan. NIS NVIDIA dapat secara otomatis membangun mesin inferensi TensorRT-LLM yang disetel dengan baik untuk model dan pengaturan GPU tertentu, menyederhanakan penerapan menjadi satu langkah.
Tutorial terbaru NVIDIA menunjukkan penerapan layanan mikro NIS untuk model yang disesuaikan dengan penyempurnaan terbimbing (SFT). Panduan ini menyediakan langkah-langkah terperinci dan perintah yang diperlukan untuk membangun dan menerapkan mesin inferensi TensorRT-LLM yang dioptimalkan kinerjanya secara lokal. Prasyaratnya meliputi lingkungan komputasi yang dipercepat NVIDIA dengan memori GPU yang memadai dan pemasangan perangkat lunak tertentu.
Perusahaan ini menyoroti kemudahan dalam memilih profil kinerja mesin inferensi, yang secara otomatis beradaptasi dengan pemilihan perangkat keras dan model pengguna. Profil ini dirancang untuk mengoptimalkan latency atau throughput, tergantung pada kebutuhan aplikasi. Upaya NVIDIA ditujukan untuk memfasilitasi adopsi cepat kemampuan inferensi AI, menyediakan sumber daya dan dukungan komunitas melalui forum pengembang dan dokumentasi.
Bagikan artikel ini:
Berita terkini
Layanan respons otomatis terkait AIBOT LINE diluncurkan
24/12/4 4:30
MOICA (lokasi kantor pusat tidak diketahui) sedang mengembangkan layanan SaaS yang disebut "MOICA AIBOT" yang menyediakan chatbot percakapan Generative AI .
PLAN-B com/PASS siaran terlewat tersedia
24/12/4 4:30
PLAN-B (Shinagawa-ku, Tokyo) telah mengumumkan akan menayangkan semua sesi konferensi pemasaran "com/PASS" yang diadakan pada bulan November 2024 pada tanggal 10 dan 11 Desember.
First Accounting mengadakan seminar AI akuntansi
24/12/4 4:30
First Accounting (Minato-ku, Tokyo) telah mengumumkan akan mengadakan Webinar Week selama empat hari mulai tanggal 16 Desember.
Copyright © 2024 Generatived - All right Reserved.
Bagikan artikel ini:
Bagikan artikel ini:
Kategori
Berita
AI dan hukum/peraturan/masyarakat
Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.
Profil perusahaan
Berita terkini
Layanan respons otomatis terkait AIBOT LINE diluncurkan
24/12/4 4:30
MOICA (lokasi kantor pusat tidak diketahui) sedang mengembangkan layanan SaaS yang disebut "MOICA AIBOT" yang menyediakan chatbot percakapan Generative AI .
PLAN-B com/PASS siaran terlewat tersedia
24/12/4 4:30
PLAN-B (Shinagawa-ku, Tokyo) telah mengumumkan akan menayangkan semua sesi konferensi pemasaran "com/PASS" yang diadakan pada bulan November 2024 pada tanggal 10 dan 11 Desember.
First Accounting mengadakan seminar AI akuntansi
24/12/4 4:30
First Accounting (Minato-ku, Tokyo) telah mengumumkan akan mengadakan Webinar Week selama empat hari mulai tanggal 16 Desember.