Hao AI Lab Mengintegrasikan NVIDIA DGX untuk Penelitian LLM 16/3971

Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif

Hao AI Lab Mengintegrasikan NVIDIA DGX untuk Penelitian LLM

Generatived

19/12/25, 00.00

Hao AI Lab di Universitas California, San Diego, baru-baru ini mengintegrasikan sistem NVIDIA DGX B200 ke dalam infrastruktur penelitiannya. Sistem AI canggih ini bertujuan untuk meningkatkan penelitian lab tentang inferensi model bahasa skala besar (LLM). Di bidang ini, banyak platform produksi, termasuk NVIDIA Dynamo, telah mengadopsi konsep penelitian Hao AI Lab, seperti DistServe.

Akses laboratorium ke DGX B200, yang terpasang di San Diego Supercomputer Center, membuka kemungkinan penelitian baru bagi komunitas UC San Diego. Asisten Profesor Hao Zhang dari Harithiogul Institute for Data Science menekankan bahwa kinerja sistem yang luar biasa akan secara signifikan mempercepat pembuatan prototipe dan eksperimen. Proyek-proyek Current ini yang memanfaatkan DGX B200 meliputi FastVideo, yang bertujuan untuk menghasilkan video pendek dengan cepat dari perintah teks, dan Lmgame-bench, sebuah rangkaian benchmark yang menguji LLM menggunakan game populer seperti Tetris dan Super Mario Bros.

Selain proyek-proyek ini, Hao AI Lab sedang meneliti cara untuk mengurangi latency dalam layanan LLM, dengan tujuan meningkatkan responsivitas model secara real-time. Mahasiswa PhD Junda Chen menekankan fokus lab pada pemanfaatan kemampuan DGX B200 untuk mendorong batasan layanan LLM dengan latensi rendah.

Konsep inferensi terpisah, yang dipelopori oleh tim DistServe, juga menjadi fokus utama laboratorium kami. Pendekatan ini mengoptimalkan throughput sistem sambil mempertahankan latency permintaan pengguna yang rendah dan memperkenalkan metrik kinerja baru yang disebut "goodput," yang memperhitungkan biaya dan kualitas layanan, menghasilkan sistem penyajian LLM yang lebih efisien dan ramah pengguna. Penelitian kami tentang pemisahan prefill/decode telah menunjukkan bahwa mengisolasi proses ini ke GPU yang berbeda dapat memaksimalkan goodput, memfasilitasi penskalaan beban kerja tanpa mengorbankan kualitas respons.

Hao AI Lab berkolaborasi dengan berbagai departemen di UC San Diego, termasuk perawatan kesehatan dan biologi, untuk lebih memanfaatkan kekuatan sistem NVIDIA DGX B200. Upaya ini merupakan bagian dari usaha yang lebih luas untuk mengeksplorasi bagaimana platform AI dapat mendorong penelitian dan inovasi lintas disiplin.

Sumber: Blog Pengembang NVIDIA

Bagikan artikel ini:

Tin tức mới nhất

NVIDIA Mempercepat Inferensi LLM dengan Skip Softmax

18/12/25, 00.00

Para insinyur pembelajaran mesin yang bekerja dengan model bahasa besar (LLM) sering menghadapi tantangan yang signifikan.

Baca lebih lanjut

NVIDIA Umumkan Inovasi untuk Pertumbuhan Infrastruktur AI

18/12/25, 00.00

Dalam perkembangan penting di bidang infrastruktur AI, NVIDIA telah bermitra dengan para pemimpin industri untuk mengembangkan arsitektur daya DC 800V.

Baca lebih lanjut

FrontierScience Mengumumkan Keberhasilan Benchmark Ilmiah GPT-5

18/12/25, 00.00

FrontierScience telah muncul sebagai tolok ukur baru yang dirancang untuk mengevaluasi kemampuan penalaran ilmiah kecerdasan buatan di bidang fisika, kimia, dan biologi.

Baca lebih lanjut

Fitur baru Asisten AI LINE Yahoo! diluncurkan.

17/12/25, 00.00

LINE Yahoo (Tokyo) telah meluncurkan fitur baru yang mengintegrasikan fungsi "Asisten AI" ke dalam aplikasi "Yahoo! JAPAN".

Baca lebih lanjut

Bagikan artikel ini:

Kategori

Peningkat Gambar AI

Pembuat kode AI

Manajemen tugas AI

Tanpa kode/kode rendah

Generator desain grafis AI

Generator seni/ilustrasi AI

Semua alat

Berita

AI dan hukum/peraturan/masyarakat

Perusahaan/produk/teknologi AI

AI Teknologi Besar

OpenAI/ChatGPT

AI generasi kreatif

AI generasi berbasis teks

AI generatif Jepang

Dasar-dasar AI generatif

Panduan penerapan AI terbaik

Profil perusahaan

Tentang kami

Chính sách quyền riêng tư

Điều khoản sử dụng trang web

Công ty điều hành

Hãy theo dõi chúng tôi

Bahasa

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.

Ikuti kami

Bahasa

Kategori

Semua alat

Manajemen tugas AI

Generator desain grafis AI

Tanpa kode/kode rendah

Pembuat kode AI

Peningkat Gambar AI

Pembuat Seni/Ilustrasi AI

AI dan hukum/sistem/ekonomi/masyarakat

Perusahaan/produk/teknologi AI

AI berteknologi besar

OpenAI/ChatGPT

AI generasi inovatif

AI generasi berbasis teks

AI inovatif Jepang

Dasar-dasar AI generatif

Petunjuk dasar aplikasi AI

Tin tức

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng của trang web

Công ty điều hành

Hồ sơ công ty

Berita terkini

NVIDIA Mempercepat Inferensi LLM dengan Skip Softmax

18/12/25, 00.00

Para insinyur pembelajaran mesin yang bekerja dengan model bahasa besar (LLM) sering menghadapi tantangan yang signifikan.

Baca lebih lanjut

NVIDIA Umumkan Inovasi untuk Pertumbuhan Infrastruktur AI

18/12/25, 00.00

Dalam perkembangan penting di bidang infrastruktur AI, NVIDIA telah bermitra dengan para pemimpin industri untuk mengembangkan arsitektur daya DC 800V.

Baca lebih lanjut

FrontierScience Mengumumkan Keberhasilan Benchmark Ilmiah GPT-5

18/12/25, 00.00

FrontierScience telah muncul sebagai tolok ukur baru yang dirancang untuk mengevaluasi kemampuan penalaran ilmiah kecerdasan buatan di bidang fisika, kimia, dan biologi.

Baca lebih lanjut

Fitur baru Asisten AI LINE Yahoo! diluncurkan.

17/12/25, 00.00

LINE Yahoo (Tokyo) telah meluncurkan fitur baru yang mengintegrasikan fungsi "Asisten AI" ke dalam aplikasi "Yahoo! JAPAN".

Baca lebih lanjut