top of page

Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

logo.png

Nhân chủng học “Nghiên cứu khái quát hóa các mô hình ngôn ngữ quy mô lớn sử dụng các hàm ảnh hưởng”

Generatived

9:40 16/8/23

Anthropic gần đây đã xuất bản một bài báo mang tính đột phá có tựa đề "Nghiên cứu sự khái quát hóa các mô hình ngôn ngữ quy mô lớn bằng cách sử dụng các hàm ảnh hưởng". Bài viết này xem xét cách tiếp cận từ trên xuống để hiểu hoạt động bên trong của các mô hình ngôn ngữ và tiết lộ cách các mô hình này khái quát hóa từ dữ liệu huấn luyện. Khi các mô hình ngôn ngữ trở nên mạnh mẽ hơn và rủi ro của chúng trở nên rõ ràng hơn, nhu cầu hiểu rõ nguyên nhân khiến các mô hình ngôn ngữ hành xử trở nên ngày càng tăng. Nghiên cứu trước đây của Anthropic đã chỉ ra rằng các mô hình ngôn ngữ quy mô lớn thể hiện những thay đổi trong tính cách và hành vi do việc mở rộng quy mô và tinh chỉnh. Để thực sự hiểu những thay đổi này, điều quan trọng là phải xem xét kỹ hơn cách hoạt động của mô hình và xác định xem đầu ra của nó phụ thuộc vào bộ nhớ hay xử lý cấp cao hơn. Trong bài báo mới nhất của họ, Anthropic giới thiệu các hàm ảnh hưởng như một cách tiếp cận bổ sung cho khả năng diễn giải. Hàm ảnh hưởng là một phương pháp thống kê xác định sự đóng góp đáng kể của các mẫu huấn luyện vào đầu ra của mô hình. Bằng cách phân tích tác động của các trình tự huấn luyện cụ thể, các nhà nghiên cứu có thể hiểu rõ hơn về cách một mô hình khái quát hóa từ dữ liệu huấn luyện. Một trong những phát hiện chính của nghiên cứu này là khi kích thước mô hình tăng lên, mô hình khái quát hóa trở nên trừu tượng hơn. Ví dụ: khi kiểm tra phản hồi của mô hình đối với truy vấn về việc không bị tắt, các chuỗi ảnh hưởng đến mô hình nhỏ hơn không liên quan về mặt ngữ nghĩa nhưng được chia sẻ các mã thông báo chồng chéo. Ngược lại, các trình tự ảnh hưởng đến mô hình lớn hơn có liên quan về mặt khái niệm và liên quan đến các chủ đề như bản năng sinh tồn và cảm xúc giống con người trong AI. Nghiên cứu này cũng điều tra các tác động đa ngôn ngữ và chứng minh rằng khi kích thước mô hình tăng lên, tác động của các truy vấn được dịch sẽ trở nên mạnh mẽ hơn đáng kể. Phát hiện này nhấn mạnh tầm quan trọng của việc xem xét tính đa dạng ngôn ngữ khi phân tích các mô hình khái quát hóa trong các mô hình ngôn ngữ. Hơn nữa, nghiên cứu này xua tan quan niệm cho rằng kết quả đầu ra của mô hình là kết quả của việc ghi nhớ thuần túy. Ảnh hưởng thường tuân theo phân bố luật lũy thừa, trong đó một phần nhỏ dữ liệu huấn luyện có ảnh hưởng lớn nhất, nhưng ảnh hưởng vẫn còn lan tỏa. Mô hình này minh họa một quá trình khái quát hóa phức tạp và nhiều sắc thái hơn là chỉ liệt kê các ví dụ đào tạo riêng lẻ ở cấp độ mã thông báo. Hàm ảnh hưởng không chỉ cung cấp điểm ảnh hưởng có giá trị vô hướng cho mỗi chuỗi huấn luyện mà còn cung cấp cái nhìn sâu sắc về cách phân bổ ảnh hưởng trong mạng lưới thần kinh. Trung bình, ảnh hưởng được phân bổ đều giữa các lớp khác nhau của mạng. Tuy nhiên, đối với các truy vấn ảnh hưởng cụ thể, ảnh hưởng có xu hướng được tập trung vào các phần cụ thể của mạng, với các lớp dưới cùng và trên cùng nắm bắt thông tin văn bản chi tiết và các lớp giữa nắm bắt các cấp độ chủ đề trừu tượng hơn. Mặc dù nghiên cứu này tập trung vào các mô hình được đào tạo trước, nhưng Anthropic cũng muốn mở rộng nghiên cứu sang việc tinh chỉnh. Tinh chỉnh bao gồm các mô hình đào tạo dựa trên các mục tiêu học tăng cường có giám sát khác nhau, điều này có thể dẫn đến những kết quả và thách thức đáng ngạc nhiên. Khả năng bản địa hóa các ảnh hưởng đến các lớp hoặc mã thông báo cụ thể cũng mở ra khả năng liên kết các chức năng ảnh hưởng với khả năng diễn giải cơ học, cuối cùng là xác định các nơ-ron và mạch liên quan đến các mẫu khái quát hóa cụ thể. Bằng cách khám phá các cơ chế đằng sau kết quả đầu ra của mô hình và mô hình khái quát hóa, các nhà nghiên cứu có thể dự đoán chính xác hơn các khả năng của AI và điều chỉnh hệ thống AI theo sở thích của con người. Kết quả của nghiên cứu này có ý nghĩa sâu rộng đối với sự phát triển và triển khai các mô hình ngôn ngữ quy mô lớn trong tương lai.

Chia sẻ bài viết này:

Tin tức mới nhất
AIUEO phát hành tài liệu giảng dạy Generative AI dành cho học sinh tiểu học.

AIUEO phát hành tài liệu giảng dạy Generative AI dành cho học sinh tiểu học.

0:00 15/1/26

Hiệp hội Ứng dụng Trí tuệ Nhân tạo trong Giáo dục (Minato-ku, Tokyo) đã phát hành một loạt tài liệu giảng dạy bằng video mang tên "Kiến thức về Trí tuệ Generative AI "

Araya Hamada, tương lai của sự kết hợp giữa BMI và AI

Araya Hamada, tương lai của sự kết hợp giữa BMI và AI

0:00 15/1/26

Taiyo Hamada, Trưởng nhóm Persona thuộc bộ phận NeuroAI tại Araya (Chiyoda-ku, Tokyo), sẽ có bài phát biểu tại Hội thảo công khai của Nhóm nghiên cứu SSN được tổ chức vào ngày 29 tháng 1 năm 2026.

Hội nghị Chiến lược Sáng tạo Quảng cáo AI Galapagos

Hội nghị Chiến lược Sáng tạo Quảng cáo AI Galapagos

0:00 15/1/26

Galapagos (quận Chiyoda, Tokyo) cung cấp dịch vụ "AIR Design," một dịch vụ sản xuất và quản lý quảng cáo sáng tạo sử dụng trí tuệ nhân tạo (AI).

Hội nghị về sự tiến hóa của AI Back Office tại Atred

Hội nghị về sự tiến hóa của AI Back Office tại Atred

0:00 15/1/26

Công ty Atread (quận Shibuya, Tokyo) sẽ tổ chức hội nghị trực tuyến với chủ đề về sự phát triển của các hoạt động hỗ trợ nghiệp vụ bằng trí tuệ nhân tạo (AI).

Copyright © 2024 Generatived - All right Reserved.

Chia sẻ bài viết này:

Chia sẻ bài viết này:

Generatived AI Logo

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

  • Facebook
  • X

Hãy theo dõi chúng tôi

Ngôn ngữ

Tin tức mới nhất
AIUEO phát hành tài liệu giảng dạy Generative AI dành cho học sinh tiểu học.

AIUEO phát hành tài liệu giảng dạy Generative AI dành cho học sinh tiểu học.

0:00 15/1/26

Hiệp hội Ứng dụng Trí tuệ Nhân tạo trong Giáo dục (Minato-ku, Tokyo) đã phát hành một loạt tài liệu giảng dạy bằng video mang tên "Kiến thức về Trí tuệ Generative AI "

Araya Hamada, tương lai của sự kết hợp giữa BMI và AI

Araya Hamada, tương lai của sự kết hợp giữa BMI và AI

0:00 15/1/26

Taiyo Hamada, Trưởng nhóm Persona thuộc bộ phận NeuroAI tại Araya (Chiyoda-ku, Tokyo), sẽ có bài phát biểu tại Hội thảo công khai của Nhóm nghiên cứu SSN được tổ chức vào ngày 29 tháng 1 năm 2026.

Hội nghị Chiến lược Sáng tạo Quảng cáo AI Galapagos

Hội nghị Chiến lược Sáng tạo Quảng cáo AI Galapagos

0:00 15/1/26

Galapagos (quận Chiyoda, Tokyo) cung cấp dịch vụ "AIR Design," một dịch vụ sản xuất và quản lý quảng cáo sáng tạo sử dụng trí tuệ nhân tạo (AI).

Hội nghị về sự tiến hóa của AI Back Office tại Atred

Hội nghị về sự tiến hóa của AI Back Office tại Atred

0:00 15/1/26

Công ty Atread (quận Shibuya, Tokyo) sẽ tổ chức hội nghị trực tuyến với chủ đề về sự phát triển của các hoạt động hỗ trợ nghiệp vụ bằng trí tuệ nhân tạo (AI).

bottom of page