MambaTech Umumkan Terobosan dalam Efisiensi LM 15/3969

Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif

MambaTech Umumkan Terobosan dalam Efisiensi LM

Generatived

14/1/26, 00.00

Penelitian terbaru dalam pengembangan model bahasa (LM) telah memperkenalkan pendekatan baru untuk mengatasi keterbatasan pemrosesan konteks panjang. Tidak seperti model Transformer tradisional, yang kesulitan dengan efisiensi saat menangani konteks yang luas, pendekatan baru ini, yang disebut pembelajaran waktu uji ujung-ke-ujung (TTT-E2E), bertujuan untuk meningkatkan akurasi dan kecepatan LM. Dengan mengompres konteks ke dalam bobot model melalui prediksi token berikutnya, TTT-E2E telah menunjukkan hasil yang menjanjikan dalam mempertahankan kinerja bahkan dalam konteks panjang, seperti yang ditunjukkan dalam penelitian terbaru.

Hasil penelitian, yang ditunjukkan pada Gambar 1, mengungkapkan bahwa Transformer dengan perhatian penuh menunjukkan kinerja akurasi yang sangat baik tetapi mengalami kekurangan latency seiring bertambahnya panjang konteks. Sementara itu, jaringan saraf berulang (RNN) seperti Mamba 2 dan Gated DeltaNet menunjukkan latency tetapi tidak seefektif dalam hal akurasi. TTT-E2E telah muncul sebagai satu-satunya metode yang menunjukkan kinerja superior di kedua area tersebut, menawarkan solusi potensial untuk tantangan lama pemrosesan konteks panjang dalam LM.

TTT-E2E berpotensi menjadi terobosan dalam bidang kecerdasan buatan, karena dapat menangani berbagai konteks tanpa meningkatkan latency secara signifikan. Metode ini menunjukkan kinerja yang konsisten di berbagai panjang konteks, menunjukkan potensinya untuk membuka jalan bagi model bahasa (LM) yang lebih efisien dan efektif dalam waktu dekat. Tim peneliti telah mempublikasikan makalah dan kode mereka, mengundang komunitas yang lebih luas untuk mengeksplorasi dan mengembangkan temuan mereka.

Penelitian ini juga menggali secara mendalam perbedaan antara memori manusia dan memori LM, menyoroti kemampuan manusia untuk memadatkan sejumlah besar pengalaman menjadi pengetahuan intuitif. Temuan ini telah menginformasikan pengembangan TTT-E2E, yang meniru kompresi seperti manusia untuk meningkatkan kinerja LM. Desain metode ini, yang menggabungkan meta-learning selama fase pelatihan, meletakkan dasar bagi LM untuk lebih baik menangkap dan memanfaatkan informasi prediktif dalam konteks yang panjang. Meskipun masih ada tantangan yang harus diatasi, seperti mengoptimalkan fase meta-learning, tim peneliti optimis tentang masa depan LM dan mendorong kolaborasi untuk lebih mengembangkan teknologi yang menjanjikan ini.

Sumber: Blog Pengembang NVIDIA

Bagikan artikel ini:

Tin tức mới nhất

NVIDIA Memperkuat Platform AI untuk Meningkatkan Efisiensi

14/1/26, 00.00

NVIDIA telah aktif berupaya meningkatkan platform AI-nya untuk meningkatkan throughput token per watt, sebuah indikator kunci efisiensi biaya dalam operasi AI.

Baca lebih lanjut

Badan Sains dan Teknologi Jepang Umumkan Robot Perawatan AI NVIDIA

14/1/26, 00.00

Program Riset Moonshot, yang didukung oleh Badan R&D Teknologi Jepang (JST), membuat kemajuan besar dengan tujuannya untuk mengintegrasikan robot bertenaga AI ke

Baca lebih lanjut

NVIDIA Umumkan Blueprint untuk Meningkatkan Operasi Gudang dengan AI

14/1/26, 00.00

Gudang-gudang menghadapi paradoks operasional.

Baca lebih lanjut

NVIDIA Meluncurkan Alat AI untuk Meningkatkan Efisiensi Ritel

14/1/26, 00.00

NVIDIA memperkenalkan alat pengembang baru yang bertujuan untuk meningkatkan efisiensi dan skalabilitas di industri ritel.

Baca lebih lanjut

Bagikan artikel ini:

Kategori

Peningkat Gambar AI

Pembuat kode AI

Manajemen tugas AI

Tanpa kode/kode rendah

Generator desain grafis AI

Generator seni/ilustrasi AI

Semua alat

Berita

AI dan hukum/peraturan/masyarakat

Perusahaan/produk/teknologi AI

AI Teknologi Besar

OpenAI/ChatGPT

AI generasi kreatif

AI generasi berbasis teks

AI generatif Jepang

Dasar-dasar AI generatif

Panduan penerapan AI terbaik

Profil perusahaan

Tentang kami

Chính sách quyền riêng tư

Điều khoản sử dụng trang web

Công ty điều hành

Hãy theo dõi chúng tôi

Bahasa

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.

Ikuti kami

Bahasa

Kategori

Semua alat

Manajemen tugas AI

Generator desain grafis AI

Tanpa kode/kode rendah

Pembuat kode AI

Peningkat Gambar AI

Pembuat Seni/Ilustrasi AI

AI dan hukum/sistem/ekonomi/masyarakat

Perusahaan/produk/teknologi AI

AI berteknologi besar

OpenAI/ChatGPT

AI generasi inovatif

AI generasi berbasis teks

AI inovatif Jepang

Dasar-dasar AI generatif

Petunjuk dasar aplikasi AI

Tin tức

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng của trang web

Công ty điều hành

Hồ sơ công ty

Berita terkini

NVIDIA Memperkuat Platform AI untuk Meningkatkan Efisiensi

14/1/26, 00.00

NVIDIA telah aktif berupaya meningkatkan platform AI-nya untuk meningkatkan throughput token per watt, sebuah indikator kunci efisiensi biaya dalam operasi AI.

Baca lebih lanjut

Badan Sains dan Teknologi Jepang Umumkan Robot Perawatan AI NVIDIA

14/1/26, 00.00

Program Riset Moonshot, yang didukung oleh Badan R&D Teknologi Jepang (JST), membuat kemajuan besar dengan tujuannya untuk mengintegrasikan robot bertenaga AI ke

Baca lebih lanjut

NVIDIA Umumkan Blueprint untuk Meningkatkan Operasi Gudang dengan AI

14/1/26, 00.00

Gudang-gudang menghadapi paradoks operasional.

Baca lebih lanjut

NVIDIA Meluncurkan Alat AI untuk Meningkatkan Efisiensi Ritel

14/1/26, 00.00

NVIDIA memperkenalkan alat pengembang baru yang bertujuan untuk meningkatkan efisiensi dan skalabilitas di industri ritel.

Baca lebih lanjut