top of page
Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif
logo.png

MambaTech Umumkan Terobosan dalam Efisiensi LM

Generatived

14/1/26, 00.00

Penelitian terbaru dalam pengembangan model bahasa (LM) telah memperkenalkan pendekatan baru untuk mengatasi keterbatasan pemrosesan konteks panjang. Tidak seperti model Transformer tradisional, yang kesulitan dengan efisiensi saat menangani konteks yang luas, pendekatan baru ini, yang disebut pembelajaran waktu uji ujung-ke-ujung (TTT-E2E), bertujuan untuk meningkatkan akurasi dan kecepatan LM. Dengan mengompres konteks ke dalam bobot model melalui prediksi token berikutnya, TTT-E2E telah menunjukkan hasil yang menjanjikan dalam mempertahankan kinerja bahkan dalam konteks panjang, seperti yang ditunjukkan dalam penelitian terbaru.

Hasil penelitian, yang ditunjukkan pada Gambar 1, mengungkapkan bahwa Transformer dengan perhatian penuh menunjukkan kinerja akurasi yang sangat baik tetapi mengalami kekurangan latency seiring bertambahnya panjang konteks. Sementara itu, jaringan saraf berulang (RNN) seperti Mamba 2 dan Gated DeltaNet menunjukkan latency tetapi tidak seefektif dalam hal akurasi. TTT-E2E telah muncul sebagai satu-satunya metode yang menunjukkan kinerja superior di kedua area tersebut, menawarkan solusi potensial untuk tantangan lama pemrosesan konteks panjang dalam LM.

TTT-E2E berpotensi menjadi terobosan dalam bidang kecerdasan buatan, karena dapat menangani berbagai konteks tanpa meningkatkan latency secara signifikan. Metode ini menunjukkan kinerja yang konsisten di berbagai panjang konteks, menunjukkan potensinya untuk membuka jalan bagi model bahasa (LM) yang lebih efisien dan efektif dalam waktu dekat. Tim peneliti telah mempublikasikan makalah dan kode mereka, mengundang komunitas yang lebih luas untuk mengeksplorasi dan mengembangkan temuan mereka.

Penelitian ini juga menggali secara mendalam perbedaan antara memori manusia dan memori LM, menyoroti kemampuan manusia untuk memadatkan sejumlah besar pengalaman menjadi pengetahuan intuitif. Temuan ini telah menginformasikan pengembangan TTT-E2E, yang meniru kompresi seperti manusia untuk meningkatkan kinerja LM. Desain metode ini, yang menggabungkan meta-learning selama fase pelatihan, meletakkan dasar bagi LM untuk lebih baik menangkap dan memanfaatkan informasi prediktif dalam konteks yang panjang. Meskipun masih ada tantangan yang harus diatasi, seperti mengoptimalkan fase meta-learning, tim peneliti optimis tentang masa depan LM dan mendorong kolaborasi untuk lebih mengembangkan teknologi yang menjanjikan ini.

Bagikan artikel ini:

Tin tức mới nhất
Pembuatan gambar ditambahkan ke AI pemerintah daerah ShiftPlus.

Pembuatan gambar ditambahkan ke AI pemerintah daerah ShiftPlus.

14/1/26, 00.00

ShiftPlus (Kota Miyakonojo, Prefektur Miyazaki/Distrik Nishi, Kota Osaka) telah menambahkan GPT-Image-1.5 ke "Municipal AI zevo," yang dikembangkannya bekerja sama dengan Kota Miyakonojo

INOVASI BERIKUTNYA Penasihat AI Obrolan Pembelajaran GPT

INOVASI BERIKUTNYA Penasihat AI Obrolan Pembelajaran GPT

14/1/26, 00.00

NEXT INNOVAITION (Ota-ku, Tokyo) telah meluncurkan seri baru, "ChatGPT Learning Edition," di media online-nya, "Your AI Advisor."

Sistem pendukung hukum Legal AI diluncurkan.

Sistem pendukung hukum Legal AI diluncurkan.

14/1/26, 00.00

Legal AI (Tokyo) telah mulai menawarkan "Legal AI OS," yang mendukung fungsi hukum perusahaan.

Perekam Suara AI AuralAI Diumumkan

Perekam Suara AI AuralAI Diumumkan

14/1/26, 00.00

AuralAI telah berkolaborasi dengan ChatGPT-4o untuk meluncurkan perekam suara AI yang mengintegrasikan perekaman, transkripsi, terjemahan, dan ringkasan.

Copyright © 2024 Generatived - All right Reserved.

Bagikan artikel ini:

Bagikan artikel ini:

Generatived

Hãy theo dõi chúng tôi

  • Facebook
  • X

Bahasa

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Generatived AI Logo

Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.

  • Facebook
  • X

Ikuti kami

Bahasa

Berita terkini
Pembuatan gambar ditambahkan ke AI pemerintah daerah ShiftPlus.

Pembuatan gambar ditambahkan ke AI pemerintah daerah ShiftPlus.

14/1/26, 00.00

ShiftPlus (Kota Miyakonojo, Prefektur Miyazaki/Distrik Nishi, Kota Osaka) telah menambahkan GPT-Image-1.5 ke "Municipal AI zevo," yang dikembangkannya bekerja sama dengan Kota Miyakonojo

INOVASI BERIKUTNYA Penasihat AI Obrolan Pembelajaran GPT

INOVASI BERIKUTNYA Penasihat AI Obrolan Pembelajaran GPT

14/1/26, 00.00

NEXT INNOVAITION (Ota-ku, Tokyo) telah meluncurkan seri baru, "ChatGPT Learning Edition," di media online-nya, "Your AI Advisor."

Sistem pendukung hukum Legal AI diluncurkan.

Sistem pendukung hukum Legal AI diluncurkan.

14/1/26, 00.00

Legal AI (Tokyo) telah mulai menawarkan "Legal AI OS," yang mendukung fungsi hukum perusahaan.

Perekam Suara AI AuralAI Diumumkan

Perekam Suara AI AuralAI Diumumkan

14/1/26, 00.00

AuralAI telah berkolaborasi dengan ChatGPT-4o untuk meluncurkan perekam suara AI yang mengintegrasikan perekaman, transkripsi, terjemahan, dan ringkasan.

bottom of page