NVIDIA GH200 NVL32 mempercepat model bahasa besar

Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif

NVIDIA GH200 NVL32 mempercepat model bahasa besar

Generatived

27/9/24, 04.30

Kemajuan terbaru dalam teknologi AI telah secara signifikan meningkatkan daya tanggap model bahasa skala besar (LLM), yang penting untuk aplikasi yang memerlukan interaksi cepat, seperti bot suara dan asisten pengkodean. Metrik utama untuk peningkatan ini adalah waktu untuk token pertama (TTFT). Ini mengukur kecepatan sejak permintaan pengguna diterima hingga LLM mulai menghasilkan respons. Seiring berkembangnya LLM, kemampuannya untuk menangani kueri yang lebih panjang dalam lebih banyak konteks meningkat, dengan beberapa model kini mampu menangani masukan sepanjang sebuah novel.

NVIDIA mengumumkan GH200 NVL32, sistem baru yang memanfaatkan 32 Superchip Grace Hopper yang terhubung melalui sistem sakelar NVLink untuk meningkatkan kinerja TTFT. Sistem ini dirancang untuk memenuhi kebutuhan LLM modern, seperti keluarga Llama 3.1, yang mencakup model dengan hingga 405 miliar parameter. Dengan memanfaatkan pengoptimalan TensorRT-LLM, sistem GH200 NVL32 mencapai TTFT yang dipublikasikan paling cepat untuk model ini, bahkan pada konteks yang panjang.

Arsitektur sistem GH200 NVL32 memungkinkan sinkronisasi data yang efisien di beberapa GPU, yang merupakan faktor kunci dalam mempercepat TTFT. Hal ini sangat penting untuk model seperti Llama 3.1 405B, yang memerlukan daya komputasi yang signifikan karena banyaknya parameter. Struktur GPU-ke-GPU dengan bandwidth tinggi dan latensi rendah meminimalkan waktu sinkronisasi, mempercepat komputasi, dan meningkatkan pengalaman pengguna secara real-time.

Komitmen NVIDIA terhadap inovasi tidak hanya mencakup perangkat keras, karena perusahaan terus mengembangkan teknik dan optimalisasi baru untuk meningkatkan kinerja inferensi. Kemajuan ini membuat kemampuan AI yang kuat menjadi lebih mudah diakses dan hemat biaya, sehingga memberikan manfaat bagi ekosistem NVIDIA yang lebih luas, termasuk jutaan pengembang dan basis instalasi GPU yang luas. Ke depan, platform NVIDIA Blackwell GB200 NVL72 diharapkan dapat lebih meningkatkan kemampuan komputasi guna memenuhi permintaan yang terus meningkat akan AI generatif dan alur kerja agen yang kompleks.

Sumber: Blog Pengembang NVIDIA

Bagikan artikel ini:

Tin tức mới nhất

API agen AI hukum LegalOn diluncurkan.

19/2/26, 00.00

LegalOn Technologies (Shibuya Ward, Tokyo) telah mulai menawarkan API untuk platform LegalOn miliknya, yang dilengkapi dengan agen AI khusus bidang hukum.

Baca lebih lanjut

Fitur Pembuktian Konsep (PoC) Fungsi Bantuan Pembersihan AI Good Life Telah Dimulai

19/2/26, 00.00

Ii Seikatsu (Distrik Minato, Tokyo) mengumumkan bahwa mereka telah menambahkan "fungsi bantuan rekonsiliasi AI" ke "Ii Seikatsu Rental Management Cloud"

Baca lebih lanjut

Anker Jepang meluncurkan layanan telepon berbasis AI.

19/2/26, 00.00

Anker Japan (Minato-ku, Tokyo) memperluas fungsionalitas sistem dukungan pelanggan AI-nya, "Anker AI Assistant," yang dikembangkan berdasarkan ChatGPT.

Baca lebih lanjut

Layanan Diagnostik AI Nomor Satu Teikoku Diluncurkan

19/2/26, 00.00

Teikoku Number One Research LLC (Shibuya-ku, Tokyo) telah meluncurkan layanan "Diagnosis AI Mandiri No. 1", yang memanfaatkan AI.

Baca lebih lanjut

Bagikan artikel ini:

Kategori

Peningkat Gambar AI

Pembuat kode AI

Manajemen tugas AI

Tanpa kode/kode rendah

Generator desain grafis AI

Generator seni/ilustrasi AI

Semua alat

Berita

AI dan hukum/peraturan/masyarakat

Perusahaan/produk/teknologi AI

AI Teknologi Besar

OpenAI/ChatGPT

AI generasi kreatif

AI generasi berbasis teks

AI generatif Jepang

Dasar-dasar AI generatif

Panduan penerapan AI terbaik

Profil perusahaan

Tentang kami

Chính sách quyền riêng tư

Điều khoản sử dụng trang web

Công ty điều hành

Hãy theo dõi chúng tôi

Bahasa

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.

Ikuti kami

Bahasa

Kategori

Semua alat

Manajemen tugas AI

Generator desain grafis AI

Tanpa kode/kode rendah

Pembuat kode AI

Peningkat Gambar AI

Pembuat Seni/Ilustrasi AI

AI dan hukum/sistem/ekonomi/masyarakat

Perusahaan/produk/teknologi AI

AI berteknologi besar

OpenAI/ChatGPT

AI generasi inovatif

AI generasi berbasis teks

AI inovatif Jepang

Dasar-dasar AI generatif

Petunjuk dasar aplikasi AI

Tin tức

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng của trang web

Công ty điều hành

Hồ sơ công ty

Berita terkini

API agen AI hukum LegalOn diluncurkan.

19/2/26, 00.00

LegalOn Technologies (Shibuya Ward, Tokyo) telah mulai menawarkan API untuk platform LegalOn miliknya, yang dilengkapi dengan agen AI khusus bidang hukum.

Baca lebih lanjut

Fitur Pembuktian Konsep (PoC) Fungsi Bantuan Pembersihan AI Good Life Telah Dimulai

19/2/26, 00.00

Ii Seikatsu (Distrik Minato, Tokyo) mengumumkan bahwa mereka telah menambahkan "fungsi bantuan rekonsiliasi AI" ke "Ii Seikatsu Rental Management Cloud"

Baca lebih lanjut

Anker Jepang meluncurkan layanan telepon berbasis AI.

19/2/26, 00.00

Anker Japan (Minato-ku, Tokyo) memperluas fungsionalitas sistem dukungan pelanggan AI-nya, "Anker AI Assistant," yang dikembangkan berdasarkan ChatGPT.

Baca lebih lanjut

Layanan Diagnostik AI Nomor Satu Teikoku Diluncurkan

19/2/26, 00.00

Teikoku Number One Research LLC (Shibuya-ku, Tokyo) telah meluncurkan layanan "Diagnosis AI Mandiri No. 1", yang memanfaatkan AI.

Baca lebih lanjut