Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

MambaTech công bố bước đột phá trong việc nâng cao hiệu quả của LM.
Generatived
0:00 14/1/26
Nghiên cứu gần đây về phát triển mô hình ngôn ngữ (LM) đã giới thiệu một phương pháp mới để giải quyết những hạn chế của việc xử lý ngữ cảnh dài. Không giống như các mô hình Transformer truyền thống, vốn gặp khó khăn về hiệu quả khi xử lý ngữ cảnh rộng lớn, phương pháp mới này, được gọi là học từ đầu đến cuối trong quá trình kiểm thử (TTT-E2E), nhằm mục đích cải thiện cả độ chính xác và tốc độ của LM. Bằng cách nén ngữ cảnh vào trọng số của mô hình thông qua dự đoán từ tiếp theo, TTT-E2E đã cho thấy kết quả đầy hứa hẹn trong việc duy trì hiệu suất ngay cả trong ngữ cảnh dài, như đã được chứng minh trong nghiên cứu gần đây.
Kết quả nghiên cứu, được thể hiện trong Hình 1, cho thấy rằng một Transformer với cơ chế chú ý đầy đủ thể hiện hiệu suất độ chính xác xuất sắc nhưng lại gặp phải hạn chế về latency khi độ dài ngữ cảnh tăng lên. Trong khi đó, các mạng nơron hồi quy (RNN) như Mamba 2 và Gated DeltaNet lại có latency nhưng không hiệu quả bằng về độ chính xác. TTT-E2E đã nổi lên như phương pháp duy nhất thể hiện hiệu suất vượt trội ở cả hai lĩnh vực, mang đến một giải pháp tiềm năng cho thách thức lâu dài về xử lý ngữ cảnh dài trong mô hình ngôn ngữ.
TTT-E2E có tiềm năng trở thành một bước đột phá trong lĩnh vực trí tuệ nhân tạo, vì nó có thể xử lý nhiều ngữ cảnh khác nhau mà không làm tăng đáng kể latency. Phương pháp này thể hiện hiệu suất ổn định trên nhiều độ dài ngữ cảnh khác nhau, cho thấy tiềm năng của nó trong việc mở đường cho các mô hình ngôn ngữ (LM) hiệu quả hơn trong tương lai gần. Nhóm nghiên cứu đã công khai bài báo và mã nguồn của họ, mời cộng đồng rộng lớn hơn cùng khám phá và phát triển dựa trên những phát hiện này.
Nghiên cứu này cũng đi sâu vào sự khác biệt giữa trí nhớ con người và trí nhớ mô hình ngôn ngữ (LM), làm nổi bật khả năng của con người trong việc nén một lượng lớn kinh nghiệm thành kiến thức trực quan. Những phát hiện này đã định hướng cho sự phát triển của TTT-E2E, mô phỏng khả năng nén thông tin giống con người để cải thiện hiệu suất của LM. Thiết kế của phương pháp này, kết hợp siêu học tập trong giai đoạn huấn luyện, đặt nền tảng cho LM nắm bắt và sử dụng thông tin dự đoán tốt hơn trong các ngữ cảnh dài. Mặc dù vẫn còn những thách thức cần vượt qua, chẳng hạn như tối ưu hóa giai đoạn siêu học tập, nhóm nghiên cứu vẫn lạc quan về tương lai của LM và khuyến khích sự hợp tác để tiếp tục phát triển công nghệ đầy hứa hẹn này.
Chia sẻ bài viết này:
Tin tức mới nhất
Chủ tịch M-Mart công bố ứng dụng thực tiễn của trí tuệ nhân tạo (AI).
0:00 14/1/26
Ngày 7 tháng 1, M Mart (Shinjuku-ku, Tokyo) thông báo về việc phát triển và ứng dụng thực tiễn "Trí tuệ nhân tạo Chủ tịch (Phiên bản nội bộ)"
Hỗ trợ phương pháp phát triển đầu tiên trên thực địa FYBE
0:00 14/1/26
FYBE (Minato-ku, Tokyo) chủ trương phương pháp phát triển "ưu tiên hiện trường" để giải quyết các thách thức tại chỗ trong các doanh nghiệp mới và ứng dụng AI.
Nghiên cứu tối ưu hóa chi phí Generative AI của Largegate
0:00 14/1/26
Công ty Largegate (Tokyo) đã tiến hành "Khảo sát về chi phí và tối ưu hóa Generative AI " với sự tham gia của 550 nhà quản lý doanh nghiệp sử dụng Generative AI .
Copyright © 2024 Generatived - All right Reserved.
Chia sẻ bài viết này:
Chia sẻ bài viết này:
Danh mục
Tin tức
AI và luật/hệ thống/kinh tế/xã hội
Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.
Tin tức mới nhất
Chủ tịch M-Mart công bố ứng dụng thực tiễn của trí tuệ nhân tạo (AI).
0:00 14/1/26
Ngày 7 tháng 1, M Mart (Shinjuku-ku, Tokyo) thông báo về việc phát triển và ứng dụng thực tiễn "Trí tuệ nhân tạo Chủ tịch (Phiên bản nội bộ)"
Hỗ trợ phương pháp phát triển đầu tiên trên thực địa FYBE
0:00 14/1/26
FYBE (Minato-ku, Tokyo) chủ trương phương pháp phát triển "ưu tiên hiện trường" để giải quyết các thách thức tại chỗ trong các doanh nghiệp mới và ứng dụng AI.
Nghiên cứu tối ưu hóa chi phí Generative AI của Largegate
0:00 14/1/26
Công ty Largegate (Tokyo) đã tiến hành "Khảo sát về chi phí và tối ưu hóa Generative AI " với sự tham gia của 550 nhà quản lý doanh nghiệp sử dụng Generative AI .



%20(1).webp)


