top of page
Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif
logo.png

NVIDIA Memperkenalkan Server Inferensi untuk Penerapan AI

Generatived

24/11/22 4:30

NVIDIA telah memperkenalkan solusi baru yang menyederhanakan penerapan model AI yang disesuaikan untuk data khusus domain. NVIDIA Inference Server (NIS) menyediakan layanan mikro inferensi yang telah dibuat sebelumnya untuk mengintegrasikan model berbasis AI dengan cepat ke dalam aplikasi perusahaan. Layanan mikro ini dirancang untuk mendukung model yang disesuaikan dengan berbagai metode, seperti penyempurnaan parameter-efisien (PEFT), untuk memastikan kinerja yang optimal.

Perusahaan telah mengembangkan proses yang menghilangkan kerumitan dalam mengonfigurasi perangkat lunak inferensi saat menyetel bobot model secara langsung selama pelatihan. NIS NVIDIA dapat secara otomatis membangun mesin inferensi TensorRT-LLM yang disetel dengan baik untuk model dan pengaturan GPU tertentu, menyederhanakan penerapan menjadi satu langkah.

Tutorial terbaru NVIDIA menunjukkan penerapan layanan mikro NIS untuk model yang disesuaikan dengan penyempurnaan terbimbing (SFT). Panduan ini menyediakan langkah-langkah terperinci dan perintah yang diperlukan untuk membangun dan menerapkan mesin inferensi TensorRT-LLM yang dioptimalkan kinerjanya secara lokal. Prasyaratnya meliputi lingkungan komputasi yang dipercepat NVIDIA dengan memori GPU yang memadai dan pemasangan perangkat lunak tertentu.

Perusahaan ini menyoroti kemudahan dalam memilih profil kinerja mesin inferensi, yang secara otomatis beradaptasi dengan pemilihan perangkat keras dan model pengguna. Profil ini dirancang untuk mengoptimalkan latency atau throughput, tergantung pada kebutuhan aplikasi. Upaya NVIDIA ditujukan untuk memfasilitasi adopsi cepat kemampuan inferensi AI, menyediakan sumber daya dan dukungan komunitas melalui forum pengembang dan dokumentasi.

Bagikan artikel ini:

Berita terkini
Layanan respons otomatis terkait AIBOT LINE diluncurkan

Layanan respons otomatis terkait AIBOT LINE diluncurkan

24/12/4 4:30

MOICA (lokasi kantor pusat tidak diketahui) sedang mengembangkan layanan SaaS yang disebut "MOICA AIBOT" yang menyediakan chatbot percakapan Generative AI .

PLAN-B com/PASS siaran terlewat tersedia

PLAN-B com/PASS siaran terlewat tersedia

24/12/4 4:30

PLAN-B (Shinagawa-ku, Tokyo) telah mengumumkan akan menayangkan semua sesi konferensi pemasaran "com/PASS" yang diadakan pada bulan November 2024 pada tanggal 10 dan 11 Desember.

First Accounting mengadakan seminar AI akuntansi

First Accounting mengadakan seminar AI akuntansi

24/12/4 4:30

First Accounting (Minato-ku, Tokyo) telah mengumumkan akan mengadakan Webinar Week selama empat hari mulai tanggal 16 Desember.

Fitur onboarding Findy AI ditambahkan

Fitur onboarding Findy AI ditambahkan

24/12/4 4:30

Findy (Shinagawa, Tokyo) telah mengumumkan bahwa mereka telah menambahkan "fungsi laporan orientasi β menggunakan Generative AI" ke SaaS "Findy Team+,"

Copyright © 2024 Generatived - All right Reserved.

Bagikan artikel ini:

Bagikan artikel ini:

Generatived

Ikuti kami

  • Facebook
  • X

Bahasa

Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.

Generatived AI Logo

Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.

  • Facebook
  • X

Ikuti kami

Bahasa

Berita terkini
Layanan respons otomatis terkait AIBOT LINE diluncurkan

Layanan respons otomatis terkait AIBOT LINE diluncurkan

24/12/4 4:30

MOICA (lokasi kantor pusat tidak diketahui) sedang mengembangkan layanan SaaS yang disebut "MOICA AIBOT" yang menyediakan chatbot percakapan Generative AI .

PLAN-B com/PASS siaran terlewat tersedia

PLAN-B com/PASS siaran terlewat tersedia

24/12/4 4:30

PLAN-B (Shinagawa-ku, Tokyo) telah mengumumkan akan menayangkan semua sesi konferensi pemasaran "com/PASS" yang diadakan pada bulan November 2024 pada tanggal 10 dan 11 Desember.

First Accounting mengadakan seminar AI akuntansi

First Accounting mengadakan seminar AI akuntansi

24/12/4 4:30

First Accounting (Minato-ku, Tokyo) telah mengumumkan akan mengadakan Webinar Week selama empat hari mulai tanggal 16 Desember.

Fitur onboarding Findy AI ditambahkan

Fitur onboarding Findy AI ditambahkan

24/12/4 4:30

Findy (Shinagawa, Tokyo) telah mengumumkan bahwa mereka telah menambahkan "fungsi laporan orientasi β menggunakan Generative AI" ke SaaS "Findy Team+,"

bottom of page