top of page
Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif
logo.png

NVIDIA Mengumumkan Server Inferensi untuk Penerapan AI

Generatived

22/11/24, 04.30

NVIDIA telah memperkenalkan solusi baru yang menyederhanakan penerapan model AI yang disesuaikan dengan data spesifik domain. NVIDIA Inference Server (NIS) menyediakan layanan mikro inferensi bawaan untuk mengintegrasikan model dasar AI dengan cepat ke dalam aplikasi perusahaan. Layanan mikro ini dirancang untuk mendukung model yang disempurnakan dalam berbagai cara, seperti penyesuaian efisien parameter (PEFT), untuk memastikan performa optimal.

Perusahaan telah mengembangkan proses yang menghilangkan kerumitan konfigurasi perangkat lunak inferensi saat menyesuaikan bobot model secara langsung selama pelatihan. NIS NVIDIA dapat secara otomatis membuat mesin inferensi TensorRT-LLM yang disesuaikan dengan model spesifik dan konfigurasi GPU Anda, sehingga menyederhanakan penerapan dalam satu langkah.

Tutorial terbaru NVIDIA memperkenalkan penerapan layanan mikro NIS untuk model yang disesuaikan menggunakan penyempurnaan yang diawasi (SFT). Panduan ini memberikan petunjuk mendetail dan perintah yang diperlukan untuk membuat dan menerapkan mesin inferensi TensorRT-LLM yang dioptimalkan performa secara lokal. Prasyaratnya mencakup lingkungan komputasi terakselerasi NVIDIA dengan memori GPU yang memadai dan instalasi perangkat lunak khusus.

Perusahaan menekankan kemudahan memilih profil kinerja mesin inferensinya. Profil ini secara otomatis beradaptasi dengan perangkat keras dan pilihan model Anda. Profil ini dirancang untuk mengoptimalkan latensi atau throughput bergantung pada kebutuhan aplikasi Anda. Upaya NVIDIA dirancang untuk mempercepat adopsi kemampuan inferensi AI, menyediakan sumber daya dan dukungan komunitas melalui forum dan dokumentasi pengembang.

Bagikan artikel ini:

Tin tức mới nhất
Dukungan otomatisasi pengujian aplikasi Autify GMO

Dukungan otomatisasi pengujian aplikasi Autify GMO

30/5/25, 00.00

Autify (Chuo-ku, Tokyo) membantu GMO Internet mengotomatiskan pengujian untuk pengembangan aplikasinya menggunakan Autify NoCode, alat otomatisasi pengujian berbasis AI.

QTnet dan And.net menjalin aliansi modal

QTnet dan And.net menjalin aliansi modal

30/5/25, 00.00

QTnet (Kota Fukuoka) telah menandatangani aliansi modal dan bisnis dengan And.net (Kota Fukuoka).

Panduan Pemanfaatan AI Produksi Materi Pengajaran Mogic

Panduan Pemanfaatan AI Produksi Materi Pengajaran Mogic

30/5/25, 00.00

Mogic (Nerima-ku, Tokyo) telah menerbitkan kolom yang memperkenalkan cara menggunakan Generative AI untuk membuat materi pengajaran untuk sistem e-learning "LearnO."

Kursus SHIFT AI Dify untuk perusahaan diluncurkan

Kursus SHIFT AI Dify untuk perusahaan diluncurkan

30/5/25, 00.00

SHIFT AI (Shibuya-ku, Tokyo) mengumumkan akan meluncurkan "Kursus Dify" untuk pelanggan korporat mulai 29 Mei 2025.

Copyright © 2024 Generatived - All right Reserved.

Bagikan artikel ini:

Bagikan artikel ini:

Generatived

Hãy theo dõi chúng tôi

  • Facebook
  • X

Bahasa

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Generatived AI Logo

Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.

  • Facebook
  • X

Ikuti kami

Bahasa

Berita terkini
Dukungan otomatisasi pengujian aplikasi Autify GMO

Dukungan otomatisasi pengujian aplikasi Autify GMO

30/5/25, 00.00

Autify (Chuo-ku, Tokyo) membantu GMO Internet mengotomatiskan pengujian untuk pengembangan aplikasinya menggunakan Autify NoCode, alat otomatisasi pengujian berbasis AI.

QTnet dan And.net menjalin aliansi modal

QTnet dan And.net menjalin aliansi modal

30/5/25, 00.00

QTnet (Kota Fukuoka) telah menandatangani aliansi modal dan bisnis dengan And.net (Kota Fukuoka).

Panduan Pemanfaatan AI Produksi Materi Pengajaran Mogic

Panduan Pemanfaatan AI Produksi Materi Pengajaran Mogic

30/5/25, 00.00

Mogic (Nerima-ku, Tokyo) telah menerbitkan kolom yang memperkenalkan cara menggunakan Generative AI untuk membuat materi pengajaran untuk sistem e-learning "LearnO."

Kursus SHIFT AI Dify untuk perusahaan diluncurkan

Kursus SHIFT AI Dify untuk perusahaan diluncurkan

30/5/25, 00.00

SHIFT AI (Shibuya-ku, Tokyo) mengumumkan akan meluncurkan "Kursus Dify" untuk pelanggan korporat mulai 29 Mei 2025.

bottom of page