Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

MambaTech công bố bước đột phá trong việc nâng cao hiệu quả của LM.

Generatived

0:00 14/1/26

Nghiên cứu gần đây về phát triển mô hình ngôn ngữ (LM) đã giới thiệu một phương pháp mới để giải quyết những hạn chế của việc xử lý ngữ cảnh dài. Không giống như các mô hình Transformer truyền thống, vốn gặp khó khăn về hiệu quả khi xử lý ngữ cảnh rộng lớn, phương pháp mới này, được gọi là học từ đầu đến cuối trong quá trình kiểm thử (TTT-E2E), nhằm mục đích cải thiện cả độ chính xác và tốc độ của LM. Bằng cách nén ngữ cảnh vào trọng số của mô hình thông qua dự đoán từ tiếp theo, TTT-E2E đã cho thấy kết quả đầy hứa hẹn trong việc duy trì hiệu suất ngay cả trong ngữ cảnh dài, như đã được chứng minh trong nghiên cứu gần đây.

Kết quả nghiên cứu, được thể hiện trong Hình 1, cho thấy rằng một Transformer với cơ chế chú ý đầy đủ thể hiện hiệu suất độ chính xác xuất sắc nhưng lại gặp phải hạn chế về latency khi độ dài ngữ cảnh tăng lên. Trong khi đó, các mạng nơron hồi quy (RNN) như Mamba 2 và Gated DeltaNet lại có latency nhưng không hiệu quả bằng về độ chính xác. TTT-E2E đã nổi lên như phương pháp duy nhất thể hiện hiệu suất vượt trội ở cả hai lĩnh vực, mang đến một giải pháp tiềm năng cho thách thức lâu dài về xử lý ngữ cảnh dài trong mô hình ngôn ngữ.

TTT-E2E có tiềm năng trở thành một bước đột phá trong lĩnh vực trí tuệ nhân tạo, vì nó có thể xử lý nhiều ngữ cảnh khác nhau mà không làm tăng đáng kể latency. Phương pháp này thể hiện hiệu suất ổn định trên nhiều độ dài ngữ cảnh khác nhau, cho thấy tiềm năng của nó trong việc mở đường cho các mô hình ngôn ngữ (LM) hiệu quả hơn trong tương lai gần. Nhóm nghiên cứu đã công khai bài báo và mã nguồn của họ, mời cộng đồng rộng lớn hơn cùng khám phá và phát triển dựa trên những phát hiện này.

Nghiên cứu này cũng đi sâu vào sự khác biệt giữa trí nhớ con người và trí nhớ mô hình ngôn ngữ (LM), làm nổi bật khả năng của con người trong việc nén một lượng lớn kinh nghiệm thành kiến thức trực quan. Những phát hiện này đã định hướng cho sự phát triển của TTT-E2E, mô phỏng khả năng nén thông tin giống con người để cải thiện hiệu suất của LM. Thiết kế của phương pháp này, kết hợp siêu học tập trong giai đoạn huấn luyện, đặt nền tảng cho LM nắm bắt và sử dụng thông tin dự đoán tốt hơn trong các ngữ cảnh dài. Mặc dù vẫn còn những thách thức cần vượt qua, chẳng hạn như tối ưu hóa giai đoạn siêu học tập, nhóm nghiên cứu vẫn lạc quan về tương lai của LM và khuyến khích sự hợp tác để tiếp tục phát triển công nghệ đầy hứa hẹn này.

Nguồn: Blog dành cho nhà phát triển của NVIDIA

Chia sẻ bài viết này:

Tin tức mới nhất

Chủ tịch M-Mart công bố ứng dụng thực tiễn của trí tuệ nhân tạo (AI).

0:00 14/1/26

Ngày 7 tháng 1, M Mart (Shinjuku-ku, Tokyo) thông báo về việc phát triển và ứng dụng thực tiễn "Trí tuệ nhân tạo Chủ tịch (Phiên bản nội bộ)"

đọc thêm

Hỗ trợ phương pháp phát triển đầu tiên trên thực địa FYBE

0:00 14/1/26

FYBE (Minato-ku, Tokyo) chủ trương phương pháp phát triển "ưu tiên hiện trường" để giải quyết các thách thức tại chỗ trong các doanh nghiệp mới và ứng dụng AI.

đọc thêm

Nghiên cứu tối ưu hóa chi phí Generative AI của Largegate

0:00 14/1/26

Công ty Largegate (Tokyo) đã tiến hành "Khảo sát về chi phí và tối ưu hóa Generative AI " với sự tham gia của 550 nhà quản lý doanh nghiệp sử dụng Generative AI .

đọc thêm

Hệ thống kế toán AI của FocusFirstAdvisors vừa được công bố.

0:00 14/1/26

FocusFirstAdvisors (quận Shibuya, Tokyo) đã công bố hệ thống kế toán AI mua một lần duy nhất mang thương hiệu "AI Flow Digital Transformation

đọc thêm

Chia sẻ bài viết này:

Danh mục

Trình nâng cao hình ảnh AI

Trình tạo mã AI

Quản lý tác vụ AI

Không có mã/mã thấp

Trình tạo thiết kế đồ họa AI

Trình tạo minh họa/nghệ thuật AI

Tất cả công cụ

Tin tức

AI và luật/hệ thống/kinh tế/xã hội

Các công ty/sản phẩm/công nghệ AI

AI công nghệ lớn

OpenAI/ChatGPT

AI thế hệ sáng tạo

AI thế hệ dựa trên văn bản

AI sáng tạo của Nhật Bản

Cơ bản về AI sáng tạo

Hướng dẫn ứng dụng AI cơ bản

Hồ sơ công ty

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng trang web

Công ty điều hành

Hãy theo dõi chúng tôi

Ngôn ngữ

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Hãy theo dõi chúng tôi

Ngôn ngữ

Danh mục

Tất cả công cụ

Quản lý tác vụ AI

Trình tạo thiết kế đồ họa AI

Không có mã/mã thấp

Trình tạo mã AI

Trình nâng cao hình ảnh AI

Trình tạo minh họa/nghệ thuật AI

AI và luật/hệ thống/kinh tế/xã hội

Các công ty/sản phẩm/công nghệ AI

AI công nghệ lớn

OpenAI/ChatGPT

AI thế hệ sáng tạo

AI thế hệ dựa trên văn bản

AI sáng tạo của Nhật Bản

Cơ bản về AI tạo ra

Hướng dẫn ứng dụng AI cơ bản

Tin tức

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng của trang web

Công ty điều hành

Hồ sơ công ty

Tin tức mới nhất

Chủ tịch M-Mart công bố ứng dụng thực tiễn của trí tuệ nhân tạo (AI).

0:00 14/1/26

Ngày 7 tháng 1, M Mart (Shinjuku-ku, Tokyo) thông báo về việc phát triển và ứng dụng thực tiễn "Trí tuệ nhân tạo Chủ tịch (Phiên bản nội bộ)"

đọc thêm

Hỗ trợ phương pháp phát triển đầu tiên trên thực địa FYBE

0:00 14/1/26

FYBE (Minato-ku, Tokyo) chủ trương phương pháp phát triển "ưu tiên hiện trường" để giải quyết các thách thức tại chỗ trong các doanh nghiệp mới và ứng dụng AI.

đọc thêm

Nghiên cứu tối ưu hóa chi phí Generative AI của Largegate

0:00 14/1/26

Công ty Largegate (Tokyo) đã tiến hành "Khảo sát về chi phí và tối ưu hóa Generative AI " với sự tham gia của 550 nhà quản lý doanh nghiệp sử dụng Generative AI .

đọc thêm

Hệ thống kế toán AI của FocusFirstAdvisors vừa được công bố.

0:00 14/1/26

FocusFirstAdvisors (quận Shibuya, Tokyo) đã công bố hệ thống kế toán AI mua một lần duy nhất mang thương hiệu "AI Flow Digital Transformation

đọc thêm