top of page
Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif
logo.png

MambaTech Umumkan Terobosan dalam Efisiensi LM

Generatived

14/1/26, 00.00

Penelitian terbaru dalam pengembangan model bahasa (LM) telah memperkenalkan pendekatan baru untuk mengatasi keterbatasan pemrosesan konteks panjang. Tidak seperti model Transformer tradisional, yang kesulitan dengan efisiensi saat menangani konteks yang luas, pendekatan baru ini, yang disebut pembelajaran waktu uji ujung-ke-ujung (TTT-E2E), bertujuan untuk meningkatkan akurasi dan kecepatan LM. Dengan mengompres konteks ke dalam bobot model melalui prediksi token berikutnya, TTT-E2E telah menunjukkan hasil yang menjanjikan dalam mempertahankan kinerja bahkan dalam konteks panjang, seperti yang ditunjukkan dalam penelitian terbaru.

Hasil penelitian, yang ditunjukkan pada Gambar 1, mengungkapkan bahwa Transformer dengan perhatian penuh menunjukkan kinerja akurasi yang sangat baik tetapi mengalami kekurangan latency seiring bertambahnya panjang konteks. Sementara itu, jaringan saraf berulang (RNN) seperti Mamba 2 dan Gated DeltaNet menunjukkan latency tetapi tidak seefektif dalam hal akurasi. TTT-E2E telah muncul sebagai satu-satunya metode yang menunjukkan kinerja superior di kedua area tersebut, menawarkan solusi potensial untuk tantangan lama pemrosesan konteks panjang dalam LM.

TTT-E2E berpotensi menjadi terobosan dalam bidang kecerdasan buatan, karena dapat menangani berbagai konteks tanpa meningkatkan latency secara signifikan. Metode ini menunjukkan kinerja yang konsisten di berbagai panjang konteks, menunjukkan potensinya untuk membuka jalan bagi model bahasa (LM) yang lebih efisien dan efektif dalam waktu dekat. Tim peneliti telah mempublikasikan makalah dan kode mereka, mengundang komunitas yang lebih luas untuk mengeksplorasi dan mengembangkan temuan mereka.

Penelitian ini juga menggali secara mendalam perbedaan antara memori manusia dan memori LM, menyoroti kemampuan manusia untuk memadatkan sejumlah besar pengalaman menjadi pengetahuan intuitif. Temuan ini telah menginformasikan pengembangan TTT-E2E, yang meniru kompresi seperti manusia untuk meningkatkan kinerja LM. Desain metode ini, yang menggabungkan meta-learning selama fase pelatihan, meletakkan dasar bagi LM untuk lebih baik menangkap dan memanfaatkan informasi prediktif dalam konteks yang panjang. Meskipun masih ada tantangan yang harus diatasi, seperti mengoptimalkan fase meta-learning, tim peneliti optimis tentang masa depan LM dan mendorong kolaborasi untuk lebih mengembangkan teknologi yang menjanjikan ini.

Bagikan artikel ini:

Tin tức mới nhất
NVIDIA Memperkuat Platform AI untuk Meningkatkan Efisiensi

NVIDIA Memperkuat Platform AI untuk Meningkatkan Efisiensi

14/1/26, 00.00

NVIDIA telah aktif berupaya meningkatkan platform AI-nya untuk meningkatkan throughput token per watt, sebuah indikator kunci efisiensi biaya dalam operasi AI.

Badan Sains dan Teknologi Jepang Umumkan Robot Perawatan AI NVIDIA

Badan Sains dan Teknologi Jepang Umumkan Robot Perawatan AI NVIDIA

14/1/26, 00.00

Program Riset Moonshot, yang didukung oleh Badan R&D Teknologi Jepang (JST), membuat kemajuan besar dengan tujuannya untuk mengintegrasikan robot bertenaga AI ke

NVIDIA Umumkan Blueprint untuk Meningkatkan Operasi Gudang dengan AI

NVIDIA Umumkan Blueprint untuk Meningkatkan Operasi Gudang dengan AI

14/1/26, 00.00

Gudang-gudang menghadapi paradoks operasional.

NVIDIA Meluncurkan Alat AI untuk Meningkatkan Efisiensi Ritel

NVIDIA Meluncurkan Alat AI untuk Meningkatkan Efisiensi Ritel

14/1/26, 00.00

NVIDIA memperkenalkan alat pengembang baru yang bertujuan untuk meningkatkan efisiensi dan skalabilitas di industri ritel.

Copyright © 2024 Generatived - All right Reserved.

Bagikan artikel ini:

Bagikan artikel ini:

Generatived

Hãy theo dõi chúng tôi

  • Facebook
  • X

Bahasa

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Generatived AI Logo

Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.

  • Facebook
  • X

Ikuti kami

Bahasa

Berita terkini
NVIDIA Memperkuat Platform AI untuk Meningkatkan Efisiensi

NVIDIA Memperkuat Platform AI untuk Meningkatkan Efisiensi

14/1/26, 00.00

NVIDIA telah aktif berupaya meningkatkan platform AI-nya untuk meningkatkan throughput token per watt, sebuah indikator kunci efisiensi biaya dalam operasi AI.

Badan Sains dan Teknologi Jepang Umumkan Robot Perawatan AI NVIDIA

Badan Sains dan Teknologi Jepang Umumkan Robot Perawatan AI NVIDIA

14/1/26, 00.00

Program Riset Moonshot, yang didukung oleh Badan R&D Teknologi Jepang (JST), membuat kemajuan besar dengan tujuannya untuk mengintegrasikan robot bertenaga AI ke

NVIDIA Umumkan Blueprint untuk Meningkatkan Operasi Gudang dengan AI

NVIDIA Umumkan Blueprint untuk Meningkatkan Operasi Gudang dengan AI

14/1/26, 00.00

Gudang-gudang menghadapi paradoks operasional.

NVIDIA Meluncurkan Alat AI untuk Meningkatkan Efisiensi Ritel

NVIDIA Meluncurkan Alat AI untuk Meningkatkan Efisiensi Ritel

14/1/26, 00.00

NVIDIA memperkenalkan alat pengembang baru yang bertujuan untuk meningkatkan efisiensi dan skalabilitas di industri ritel.

bottom of page