Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

Nhân chủng học “Nghiên cứu khái quát hóa các mô hình ngôn ngữ quy mô lớn sử dụng các hàm ảnh hưởng”

Generatived

9:40 16/8/23

Anthropic gần đây đã xuất bản một bài báo mang tính đột phá có tựa đề "Nghiên cứu sự khái quát hóa các mô hình ngôn ngữ quy mô lớn bằng cách sử dụng các hàm ảnh hưởng". Bài viết này xem xét cách tiếp cận từ trên xuống để hiểu hoạt động bên trong của các mô hình ngôn ngữ và tiết lộ cách các mô hình này khái quát hóa từ dữ liệu huấn luyện. Khi các mô hình ngôn ngữ trở nên mạnh mẽ hơn và rủi ro của chúng trở nên rõ ràng hơn, nhu cầu hiểu rõ nguyên nhân khiến các mô hình ngôn ngữ hành xử trở nên ngày càng tăng. Nghiên cứu trước đây của Anthropic đã chỉ ra rằng các mô hình ngôn ngữ quy mô lớn thể hiện những thay đổi trong tính cách và hành vi do việc mở rộng quy mô và tinh chỉnh. Để thực sự hiểu những thay đổi này, điều quan trọng là phải xem xét kỹ hơn cách hoạt động của mô hình và xác định xem đầu ra của nó phụ thuộc vào bộ nhớ hay xử lý cấp cao hơn. Trong bài báo mới nhất của họ, Anthropic giới thiệu các hàm ảnh hưởng như một cách tiếp cận bổ sung cho khả năng diễn giải. Hàm ảnh hưởng là một phương pháp thống kê xác định sự đóng góp đáng kể của các mẫu huấn luyện vào đầu ra của mô hình. Bằng cách phân tích tác động của các trình tự huấn luyện cụ thể, các nhà nghiên cứu có thể hiểu rõ hơn về cách một mô hình khái quát hóa từ dữ liệu huấn luyện. Một trong những phát hiện chính của nghiên cứu này là khi kích thước mô hình tăng lên, mô hình khái quát hóa trở nên trừu tượng hơn. Ví dụ: khi kiểm tra phản hồi của mô hình đối với truy vấn về việc không bị tắt, các chuỗi ảnh hưởng đến mô hình nhỏ hơn không liên quan về mặt ngữ nghĩa nhưng được chia sẻ các mã thông báo chồng chéo. Ngược lại, các trình tự ảnh hưởng đến mô hình lớn hơn có liên quan về mặt khái niệm và liên quan đến các chủ đề như bản năng sinh tồn và cảm xúc giống con người trong AI. Nghiên cứu này cũng điều tra các tác động đa ngôn ngữ và chứng minh rằng khi kích thước mô hình tăng lên, tác động của các truy vấn được dịch sẽ trở nên mạnh mẽ hơn đáng kể. Phát hiện này nhấn mạnh tầm quan trọng của việc xem xét tính đa dạng ngôn ngữ khi phân tích các mô hình khái quát hóa trong các mô hình ngôn ngữ. Hơn nữa, nghiên cứu này xua tan quan niệm cho rằng kết quả đầu ra của mô hình là kết quả của việc ghi nhớ thuần túy. Ảnh hưởng thường tuân theo phân bố luật lũy thừa, trong đó một phần nhỏ dữ liệu huấn luyện có ảnh hưởng lớn nhất, nhưng ảnh hưởng vẫn còn lan tỏa. Mô hình này minh họa một quá trình khái quát hóa phức tạp và nhiều sắc thái hơn là chỉ liệt kê các ví dụ đào tạo riêng lẻ ở cấp độ mã thông báo. Hàm ảnh hưởng không chỉ cung cấp điểm ảnh hưởng có giá trị vô hướng cho mỗi chuỗi huấn luyện mà còn cung cấp cái nhìn sâu sắc về cách phân bổ ảnh hưởng trong mạng lưới thần kinh. Trung bình, ảnh hưởng được phân bổ đều giữa các lớp khác nhau của mạng. Tuy nhiên, đối với các truy vấn ảnh hưởng cụ thể, ảnh hưởng có xu hướng được tập trung vào các phần cụ thể của mạng, với các lớp dưới cùng và trên cùng nắm bắt thông tin văn bản chi tiết và các lớp giữa nắm bắt các cấp độ chủ đề trừu tượng hơn. Mặc dù nghiên cứu này tập trung vào các mô hình được đào tạo trước, nhưng Anthropic cũng muốn mở rộng nghiên cứu sang việc tinh chỉnh. Tinh chỉnh bao gồm các mô hình đào tạo dựa trên các mục tiêu học tăng cường có giám sát khác nhau, điều này có thể dẫn đến những kết quả và thách thức đáng ngạc nhiên. Khả năng bản địa hóa các ảnh hưởng đến các lớp hoặc mã thông báo cụ thể cũng mở ra khả năng liên kết các chức năng ảnh hưởng với khả năng diễn giải cơ học, cuối cùng là xác định các nơ-ron và mạch liên quan đến các mẫu khái quát hóa cụ thể. Bằng cách khám phá các cơ chế đằng sau kết quả đầu ra của mô hình và mô hình khái quát hóa, các nhà nghiên cứu có thể dự đoán chính xác hơn các khả năng của AI và điều chỉnh hệ thống AI theo sở thích của con người. Kết quả của nghiên cứu này có ý nghĩa sâu rộng đối với sự phát triển và triển khai các mô hình ngôn ngữ quy mô lớn trong tương lai.

nguồn: Nhân chủng học

Chia sẻ bài viết này:

Tin tức mới nhất

Buildspi làm mới chương trình đào tạo DX cho kỷ nguyên AI

0:00 5/6/26

Persol Innovation, có trụ sở tại Tokyo, thông báo rằng dịch vụ đào tạo Buildspi Academy của họ đã được đổi mới để đáp ứng nhu cầu phát triển nguồn nhân lực trong kỷ nguyên trí tuệ nhân tạo tạo sinh

đọc thêm

NVIDIA công bố các khả năng AI vật lý tại CVPR.

0:00 5/6/26

Tại hội nghị CVPR 2026, NVIDIA đã công bố các kỹ năng tác nhân AI vật lý mới được thiết kế để đẩy nhanh quá trình phát triển xe tự hành, robot và hệ thống AI thị giác.

đọc thêm

Microsoft báo cáo về cuộc tấn công quy mô lớn vào chuỗi cung ứng npm.

0:00 5/6/26

Microsoft báo cáo về một vụ xâm phạm chuỗi cung ứng npm quy mô lớn ảnh hưởng đến 32 gói và hơn 90 phiên bản độc hại được phát hành dưới tên miền @redhat-cloud-services.

đọc thêm

ProfitMakers ra mắt dịch vụ hỗ trợ rà soát mã nguồn chiến lược.

0:00 5/6/26

ProfitMakers vừa công bố ra mắt dịch vụ “Hỗ trợ Đánh giá Mã nguồn” mới, được thiết kế để giải quyết những lo ngại ngày càng tăng xung quanh mã nguồn do AI tạo ra

đọc thêm

Chia sẻ bài viết này:

Danh mục

Trình nâng cao hình ảnh AI

Trình tạo mã AI

Quản lý tác vụ AI

Không có mã/mã thấp

Trình tạo thiết kế đồ họa AI

Trình tạo minh họa/nghệ thuật AI

Tất cả công cụ

Tin tức

AI và luật/hệ thống/kinh tế/xã hội

Các công ty/sản phẩm/công nghệ AI

AI công nghệ lớn

OpenAI/ChatGPT

AI thế hệ sáng tạo

AI thế hệ dựa trên văn bản

AI sáng tạo của Nhật Bản

Cơ bản về AI sáng tạo

Hướng dẫn ứng dụng AI cơ bản

Hồ sơ công ty

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng trang web

Công ty điều hành

Hãy theo dõi chúng tôi

Ngôn ngữ

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Hãy theo dõi chúng tôi

Ngôn ngữ

Danh mục

Tất cả công cụ

Quản lý tác vụ AI

Trình tạo thiết kế đồ họa AI

Không có mã/mã thấp

Trình tạo mã AI

Trình nâng cao hình ảnh AI

Trình tạo minh họa/nghệ thuật AI

AI và luật/hệ thống/kinh tế/xã hội

Các công ty/sản phẩm/công nghệ AI

AI công nghệ lớn

OpenAI/ChatGPT

AI thế hệ sáng tạo

AI thế hệ dựa trên văn bản

AI sáng tạo của Nhật Bản

Cơ bản về AI tạo ra

Hướng dẫn ứng dụng AI cơ bản

Tin tức

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng của trang web

Công ty điều hành

Hồ sơ công ty

Tin tức mới nhất

Buildspi làm mới chương trình đào tạo DX cho kỷ nguyên AI

0:00 5/6/26

Persol Innovation, có trụ sở tại Tokyo, thông báo rằng dịch vụ đào tạo Buildspi Academy của họ đã được đổi mới để đáp ứng nhu cầu phát triển nguồn nhân lực trong kỷ nguyên trí tuệ nhân tạo tạo sinh

đọc thêm

NVIDIA công bố các khả năng AI vật lý tại CVPR.

0:00 5/6/26

Tại hội nghị CVPR 2026, NVIDIA đã công bố các kỹ năng tác nhân AI vật lý mới được thiết kế để đẩy nhanh quá trình phát triển xe tự hành, robot và hệ thống AI thị giác.

đọc thêm

Microsoft báo cáo về cuộc tấn công quy mô lớn vào chuỗi cung ứng npm.

0:00 5/6/26

Microsoft báo cáo về một vụ xâm phạm chuỗi cung ứng npm quy mô lớn ảnh hưởng đến 32 gói và hơn 90 phiên bản độc hại được phát hành dưới tên miền @redhat-cloud-services.

đọc thêm

ProfitMakers ra mắt dịch vụ hỗ trợ rà soát mã nguồn chiến lược.

0:00 5/6/26

ProfitMakers vừa công bố ra mắt dịch vụ “Hỗ trợ Đánh giá Mã nguồn” mới, được thiết kế để giải quyết những lo ngại ngày càng tăng xung quanh mã nguồn do AI tạo ra

đọc thêm