Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

Nhân chủng học “Nghiên cứu khái quát hóa các mô hình ngôn ngữ quy mô lớn sử dụng các hàm ảnh hưởng”

Generatived

9:40 16/8/23

Anthropic gần đây đã xuất bản một bài báo mang tính đột phá có tựa đề "Nghiên cứu sự khái quát hóa các mô hình ngôn ngữ quy mô lớn bằng cách sử dụng các hàm ảnh hưởng". Bài viết này xem xét cách tiếp cận từ trên xuống để hiểu hoạt động bên trong của các mô hình ngôn ngữ và tiết lộ cách các mô hình này khái quát hóa từ dữ liệu huấn luyện. Khi các mô hình ngôn ngữ trở nên mạnh mẽ hơn và rủi ro của chúng trở nên rõ ràng hơn, nhu cầu hiểu rõ nguyên nhân khiến các mô hình ngôn ngữ hành xử trở nên ngày càng tăng. Nghiên cứu trước đây của Anthropic đã chỉ ra rằng các mô hình ngôn ngữ quy mô lớn thể hiện những thay đổi trong tính cách và hành vi do việc mở rộng quy mô và tinh chỉnh. Để thực sự hiểu những thay đổi này, điều quan trọng là phải xem xét kỹ hơn cách hoạt động của mô hình và xác định xem đầu ra của nó phụ thuộc vào bộ nhớ hay xử lý cấp cao hơn. Trong bài báo mới nhất của họ, Anthropic giới thiệu các hàm ảnh hưởng như một cách tiếp cận bổ sung cho khả năng diễn giải. Hàm ảnh hưởng là một phương pháp thống kê xác định sự đóng góp đáng kể của các mẫu huấn luyện vào đầu ra của mô hình. Bằng cách phân tích tác động của các trình tự huấn luyện cụ thể, các nhà nghiên cứu có thể hiểu rõ hơn về cách một mô hình khái quát hóa từ dữ liệu huấn luyện. Một trong những phát hiện chính của nghiên cứu này là khi kích thước mô hình tăng lên, mô hình khái quát hóa trở nên trừu tượng hơn. Ví dụ: khi kiểm tra phản hồi của mô hình đối với truy vấn về việc không bị tắt, các chuỗi ảnh hưởng đến mô hình nhỏ hơn không liên quan về mặt ngữ nghĩa nhưng được chia sẻ các mã thông báo chồng chéo. Ngược lại, các trình tự ảnh hưởng đến mô hình lớn hơn có liên quan về mặt khái niệm và liên quan đến các chủ đề như bản năng sinh tồn và cảm xúc giống con người trong AI. Nghiên cứu này cũng điều tra các tác động đa ngôn ngữ và chứng minh rằng khi kích thước mô hình tăng lên, tác động của các truy vấn được dịch sẽ trở nên mạnh mẽ hơn đáng kể. Phát hiện này nhấn mạnh tầm quan trọng của việc xem xét tính đa dạng ngôn ngữ khi phân tích các mô hình khái quát hóa trong các mô hình ngôn ngữ. Hơn nữa, nghiên cứu này xua tan quan niệm cho rằng kết quả đầu ra của mô hình là kết quả của việc ghi nhớ thuần túy. Ảnh hưởng thường tuân theo phân bố luật lũy thừa, trong đó một phần nhỏ dữ liệu huấn luyện có ảnh hưởng lớn nhất, nhưng ảnh hưởng vẫn còn lan tỏa. Mô hình này minh họa một quá trình khái quát hóa phức tạp và nhiều sắc thái hơn là chỉ liệt kê các ví dụ đào tạo riêng lẻ ở cấp độ mã thông báo. Hàm ảnh hưởng không chỉ cung cấp điểm ảnh hưởng có giá trị vô hướng cho mỗi chuỗi huấn luyện mà còn cung cấp cái nhìn sâu sắc về cách phân bổ ảnh hưởng trong mạng lưới thần kinh. Trung bình, ảnh hưởng được phân bổ đều giữa các lớp khác nhau của mạng. Tuy nhiên, đối với các truy vấn ảnh hưởng cụ thể, ảnh hưởng có xu hướng được tập trung vào các phần cụ thể của mạng, với các lớp dưới cùng và trên cùng nắm bắt thông tin văn bản chi tiết và các lớp giữa nắm bắt các cấp độ chủ đề trừu tượng hơn. Mặc dù nghiên cứu này tập trung vào các mô hình được đào tạo trước, nhưng Anthropic cũng muốn mở rộng nghiên cứu sang việc tinh chỉnh. Tinh chỉnh bao gồm các mô hình đào tạo dựa trên các mục tiêu học tăng cường có giám sát khác nhau, điều này có thể dẫn đến những kết quả và thách thức đáng ngạc nhiên. Khả năng bản địa hóa các ảnh hưởng đến các lớp hoặc mã thông báo cụ thể cũng mở ra khả năng liên kết các chức năng ảnh hưởng với khả năng diễn giải cơ học, cuối cùng là xác định các nơ-ron và mạch liên quan đến các mẫu khái quát hóa cụ thể. Bằng cách khám phá các cơ chế đằng sau kết quả đầu ra của mô hình và mô hình khái quát hóa, các nhà nghiên cứu có thể dự đoán chính xác hơn các khả năng của AI và điều chỉnh hệ thống AI theo sở thích của con người. Kết quả của nghiên cứu này có ý nghĩa sâu rộng đối với sự phát triển và triển khai các mô hình ngôn ngữ quy mô lớn trong tương lai.

nguồn: Nhân chủng học

Chia sẻ bài viết này:

Tin tức mới nhất

Trò chơi nhập vai Sapeet AI được Aiful chuyển thể.

0:00 23/4/26

Sapeet thông báo rằng dịch vụ đào tạo dựa trên trí tuệ nhân tạo (AI) “SAPI Roleplay” của họ đã được Aiful áp dụng.

đọc thêm

Givery bổ sung tính năng tương tác vào các cuộc phỏng vấn AI.

0:00 23/4/26

Givery thông báo rằng công cụ phỏng vấn AI "Track AI Interview" của họ hiện đã bao gồm một tính năng tương tác được thiết kế để điều chỉnh các câu hỏi tiếp theo dựa trên

đọc thêm

Cadence mở rộng hợp tác với NVIDIA trong lĩnh vực hệ thống trí tuệ nhân tạo.

0:00 23/4/26

Cadence vừa công bố mở rộng quan hệ đối tác chiến lược với NVIDIA nhằm tăng cường quy trình kỹ thuật trong thiết kế bán dẫn và phát triển hệ thống AI

đọc thêm

Triển khai sản phẩm Chitose AI Chiko trên khắp các cơ sở chăm sóc trẻ em.

0:00 23/4/26

Chitose đã thông báo triển khai “AI Chiko-chan” tại các cơ sở chăm sóc trẻ em từ tháng 4 năm 2026

đọc thêm

Chia sẻ bài viết này:

Danh mục

Trình nâng cao hình ảnh AI

Trình tạo mã AI

Quản lý tác vụ AI

Không có mã/mã thấp

Trình tạo thiết kế đồ họa AI

Trình tạo minh họa/nghệ thuật AI

Tất cả công cụ

Tin tức

AI và luật/hệ thống/kinh tế/xã hội

Các công ty/sản phẩm/công nghệ AI

AI công nghệ lớn

OpenAI/ChatGPT

AI thế hệ sáng tạo

AI thế hệ dựa trên văn bản

AI sáng tạo của Nhật Bản

Cơ bản về AI sáng tạo

Hướng dẫn ứng dụng AI cơ bản

Hồ sơ công ty

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng trang web

Công ty điều hành

Hãy theo dõi chúng tôi

Ngôn ngữ

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Hãy theo dõi chúng tôi

Ngôn ngữ

Danh mục

Tất cả công cụ

Quản lý tác vụ AI

Trình tạo thiết kế đồ họa AI

Không có mã/mã thấp

Trình tạo mã AI

Trình nâng cao hình ảnh AI

Trình tạo minh họa/nghệ thuật AI

AI và luật/hệ thống/kinh tế/xã hội

Các công ty/sản phẩm/công nghệ AI

AI công nghệ lớn

OpenAI/ChatGPT

AI thế hệ sáng tạo

AI thế hệ dựa trên văn bản

AI sáng tạo của Nhật Bản

Cơ bản về AI tạo ra

Hướng dẫn ứng dụng AI cơ bản

Tin tức

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng của trang web

Công ty điều hành

Hồ sơ công ty

Tin tức mới nhất

Trò chơi nhập vai Sapeet AI được Aiful chuyển thể.

0:00 23/4/26

Sapeet thông báo rằng dịch vụ đào tạo dựa trên trí tuệ nhân tạo (AI) “SAPI Roleplay” của họ đã được Aiful áp dụng.

đọc thêm

Givery bổ sung tính năng tương tác vào các cuộc phỏng vấn AI.

0:00 23/4/26

Givery thông báo rằng công cụ phỏng vấn AI "Track AI Interview" của họ hiện đã bao gồm một tính năng tương tác được thiết kế để điều chỉnh các câu hỏi tiếp theo dựa trên

đọc thêm

Cadence mở rộng hợp tác với NVIDIA trong lĩnh vực hệ thống trí tuệ nhân tạo.

0:00 23/4/26

Cadence vừa công bố mở rộng quan hệ đối tác chiến lược với NVIDIA nhằm tăng cường quy trình kỹ thuật trong thiết kế bán dẫn và phát triển hệ thống AI

đọc thêm

Triển khai sản phẩm Chitose AI Chiko trên khắp các cơ sở chăm sóc trẻ em.

0:00 23/4/26

Chitose đã thông báo triển khai “AI Chiko-chan” tại các cơ sở chăm sóc trẻ em từ tháng 4 năm 2026

đọc thêm