top of page

Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

logo.png

Nhân chủng học “Nghiên cứu khái quát hóa các mô hình ngôn ngữ quy mô lớn sử dụng các hàm ảnh hưởng”

Generatived

9:40 16/8/23

Anthropic gần đây đã xuất bản một bài báo mang tính đột phá có tựa đề "Nghiên cứu sự khái quát hóa các mô hình ngôn ngữ quy mô lớn bằng cách sử dụng các hàm ảnh hưởng". Bài viết này xem xét cách tiếp cận từ trên xuống để hiểu hoạt động bên trong của các mô hình ngôn ngữ và tiết lộ cách các mô hình này khái quát hóa từ dữ liệu huấn luyện. Khi các mô hình ngôn ngữ trở nên mạnh mẽ hơn và rủi ro của chúng trở nên rõ ràng hơn, nhu cầu hiểu rõ nguyên nhân khiến các mô hình ngôn ngữ hành xử trở nên ngày càng tăng. Nghiên cứu trước đây của Anthropic đã chỉ ra rằng các mô hình ngôn ngữ quy mô lớn thể hiện những thay đổi trong tính cách và hành vi do việc mở rộng quy mô và tinh chỉnh. Để thực sự hiểu những thay đổi này, điều quan trọng là phải xem xét kỹ hơn cách hoạt động của mô hình và xác định xem đầu ra của nó phụ thuộc vào bộ nhớ hay xử lý cấp cao hơn. Trong bài báo mới nhất của họ, Anthropic giới thiệu các hàm ảnh hưởng như một cách tiếp cận bổ sung cho khả năng diễn giải. Hàm ảnh hưởng là một phương pháp thống kê xác định sự đóng góp đáng kể của các mẫu huấn luyện vào đầu ra của mô hình. Bằng cách phân tích tác động của các trình tự huấn luyện cụ thể, các nhà nghiên cứu có thể hiểu rõ hơn về cách một mô hình khái quát hóa từ dữ liệu huấn luyện. Một trong những phát hiện chính của nghiên cứu này là khi kích thước mô hình tăng lên, mô hình khái quát hóa trở nên trừu tượng hơn. Ví dụ: khi kiểm tra phản hồi của mô hình đối với truy vấn về việc không bị tắt, các chuỗi ảnh hưởng đến mô hình nhỏ hơn không liên quan về mặt ngữ nghĩa nhưng được chia sẻ các mã thông báo chồng chéo. Ngược lại, các trình tự ảnh hưởng đến mô hình lớn hơn có liên quan về mặt khái niệm và liên quan đến các chủ đề như bản năng sinh tồn và cảm xúc giống con người trong AI. Nghiên cứu này cũng điều tra các tác động đa ngôn ngữ và chứng minh rằng khi kích thước mô hình tăng lên, tác động của các truy vấn được dịch sẽ trở nên mạnh mẽ hơn đáng kể. Phát hiện này nhấn mạnh tầm quan trọng của việc xem xét tính đa dạng ngôn ngữ khi phân tích các mô hình khái quát hóa trong các mô hình ngôn ngữ. Hơn nữa, nghiên cứu này xua tan quan niệm cho rằng kết quả đầu ra của mô hình là kết quả của việc ghi nhớ thuần túy. Ảnh hưởng thường tuân theo phân bố luật lũy thừa, trong đó một phần nhỏ dữ liệu huấn luyện có ảnh hưởng lớn nhất, nhưng ảnh hưởng vẫn còn lan tỏa. Mô hình này minh họa một quá trình khái quát hóa phức tạp và nhiều sắc thái hơn là chỉ liệt kê các ví dụ đào tạo riêng lẻ ở cấp độ mã thông báo. Hàm ảnh hưởng không chỉ cung cấp điểm ảnh hưởng có giá trị vô hướng cho mỗi chuỗi huấn luyện mà còn cung cấp cái nhìn sâu sắc về cách phân bổ ảnh hưởng trong mạng lưới thần kinh. Trung bình, ảnh hưởng được phân bổ đều giữa các lớp khác nhau của mạng. Tuy nhiên, đối với các truy vấn ảnh hưởng cụ thể, ảnh hưởng có xu hướng được tập trung vào các phần cụ thể của mạng, với các lớp dưới cùng và trên cùng nắm bắt thông tin văn bản chi tiết và các lớp giữa nắm bắt các cấp độ chủ đề trừu tượng hơn. Mặc dù nghiên cứu này tập trung vào các mô hình được đào tạo trước, nhưng Anthropic cũng muốn mở rộng nghiên cứu sang việc tinh chỉnh. Tinh chỉnh bao gồm các mô hình đào tạo dựa trên các mục tiêu học tăng cường có giám sát khác nhau, điều này có thể dẫn đến những kết quả và thách thức đáng ngạc nhiên. Khả năng bản địa hóa các ảnh hưởng đến các lớp hoặc mã thông báo cụ thể cũng mở ra khả năng liên kết các chức năng ảnh hưởng với khả năng diễn giải cơ học, cuối cùng là xác định các nơ-ron và mạch liên quan đến các mẫu khái quát hóa cụ thể. Bằng cách khám phá các cơ chế đằng sau kết quả đầu ra của mô hình và mô hình khái quát hóa, các nhà nghiên cứu có thể dự đoán chính xác hơn các khả năng của AI và điều chỉnh hệ thống AI theo sở thích của con người. Kết quả của nghiên cứu này có ý nghĩa sâu rộng đối với sự phát triển và triển khai các mô hình ngôn ngữ quy mô lớn trong tương lai.

Chia sẻ bài viết này:

Tin tức mới nhất
SoftServe ra mắt đơn vị kinh doanh Google Cloud.

SoftServe ra mắt đơn vị kinh doanh Google Cloud.

0:00 15/1/26

SoftServe, một nhà cung cấp dịch vụ tư vấn CNTT và dịch vụ kỹ thuật số được đánh giá cao, mới đây đã thông báo thành lập một đơn vị kinh doanh mới Google Cloud

NVIDIA và Lilly ra mắt phòng thí nghiệm khám phá thuốc bằng trí tuệ nhân tạo.

NVIDIA và Lilly ra mắt phòng thí nghiệm khám phá thuốc bằng trí tuệ nhân tạo.

0:00 15/1/26

NVIDIA và Lilly đã công bố hợp tác nhằm tăng cường quá trình khám phá thuốc thông qua việc thành lập một phòng thí nghiệm đồng sáng tạo AI độc đáo.

Apple ra mắt Creator Studio với các ứng dụng được tăng cường bởi trí tuệ nhân tạo.

Apple ra mắt Creator Studio với các ứng dụng được tăng cường bởi trí tuệ nhân tạo.

0:00 15/1/26

Apple vừa công bố ra mắt Apple Creator Studio, một bộ ứng dụng sáng tạo toàn diện có sẵn thông qua một gói đăng ký duy nhất.

Veo 3.1 nâng cao khả năng tạo video với các tính năng tiên tiến.

Veo 3.1 nâng cao khả năng tạo video với các tính năng tiên tiến.

0:00 15/1/26

Veo vừa công bố những cải tiến cho tính năng "Từ hình ảnh tham khảo đến video", cho phép người dùng tạo ra những video biểu cảm và sáng tạo hơn từ hình ảnh tham khảo.

Copyright © 2024 Generatived - All right Reserved.

Chia sẻ bài viết này:

Chia sẻ bài viết này:

Generatived AI Logo

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

  • Facebook
  • X

Hãy theo dõi chúng tôi

Ngôn ngữ

Tin tức mới nhất
SoftServe ra mắt đơn vị kinh doanh Google Cloud.

SoftServe ra mắt đơn vị kinh doanh Google Cloud.

0:00 15/1/26

SoftServe, một nhà cung cấp dịch vụ tư vấn CNTT và dịch vụ kỹ thuật số được đánh giá cao, mới đây đã thông báo thành lập một đơn vị kinh doanh mới Google Cloud

NVIDIA và Lilly ra mắt phòng thí nghiệm khám phá thuốc bằng trí tuệ nhân tạo.

NVIDIA và Lilly ra mắt phòng thí nghiệm khám phá thuốc bằng trí tuệ nhân tạo.

0:00 15/1/26

NVIDIA và Lilly đã công bố hợp tác nhằm tăng cường quá trình khám phá thuốc thông qua việc thành lập một phòng thí nghiệm đồng sáng tạo AI độc đáo.

Apple ra mắt Creator Studio với các ứng dụng được tăng cường bởi trí tuệ nhân tạo.

Apple ra mắt Creator Studio với các ứng dụng được tăng cường bởi trí tuệ nhân tạo.

0:00 15/1/26

Apple vừa công bố ra mắt Apple Creator Studio, một bộ ứng dụng sáng tạo toàn diện có sẵn thông qua một gói đăng ký duy nhất.

Veo 3.1 nâng cao khả năng tạo video với các tính năng tiên tiến.

Veo 3.1 nâng cao khả năng tạo video với các tính năng tiên tiến.

0:00 15/1/26

Veo vừa công bố những cải tiến cho tính năng "Từ hình ảnh tham khảo đến video", cho phép người dùng tạo ra những video biểu cảm và sáng tạo hơn từ hình ảnh tham khảo.

bottom of page