top of page

Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

logo.png

Nhân chủng học “Nghiên cứu khái quát hóa các mô hình ngôn ngữ quy mô lớn sử dụng các hàm ảnh hưởng”

Generatived

9:40 16/8/23

Anthropic gần đây đã xuất bản một bài báo mang tính đột phá có tựa đề "Nghiên cứu sự khái quát hóa các mô hình ngôn ngữ quy mô lớn bằng cách sử dụng các hàm ảnh hưởng". Bài viết này xem xét cách tiếp cận từ trên xuống để hiểu hoạt động bên trong của các mô hình ngôn ngữ và tiết lộ cách các mô hình này khái quát hóa từ dữ liệu huấn luyện. Khi các mô hình ngôn ngữ trở nên mạnh mẽ hơn và rủi ro của chúng trở nên rõ ràng hơn, nhu cầu hiểu rõ nguyên nhân khiến các mô hình ngôn ngữ hành xử trở nên ngày càng tăng. Nghiên cứu trước đây của Anthropic đã chỉ ra rằng các mô hình ngôn ngữ quy mô lớn thể hiện những thay đổi trong tính cách và hành vi do việc mở rộng quy mô và tinh chỉnh. Để thực sự hiểu những thay đổi này, điều quan trọng là phải xem xét kỹ hơn cách hoạt động của mô hình và xác định xem đầu ra của nó phụ thuộc vào bộ nhớ hay xử lý cấp cao hơn. Trong bài báo mới nhất của họ, Anthropic giới thiệu các hàm ảnh hưởng như một cách tiếp cận bổ sung cho khả năng diễn giải. Hàm ảnh hưởng là một phương pháp thống kê xác định sự đóng góp đáng kể của các mẫu huấn luyện vào đầu ra của mô hình. Bằng cách phân tích tác động của các trình tự huấn luyện cụ thể, các nhà nghiên cứu có thể hiểu rõ hơn về cách một mô hình khái quát hóa từ dữ liệu huấn luyện. Một trong những phát hiện chính của nghiên cứu này là khi kích thước mô hình tăng lên, mô hình khái quát hóa trở nên trừu tượng hơn. Ví dụ: khi kiểm tra phản hồi của mô hình đối với truy vấn về việc không bị tắt, các chuỗi ảnh hưởng đến mô hình nhỏ hơn không liên quan về mặt ngữ nghĩa nhưng được chia sẻ các mã thông báo chồng chéo. Ngược lại, các trình tự ảnh hưởng đến mô hình lớn hơn có liên quan về mặt khái niệm và liên quan đến các chủ đề như bản năng sinh tồn và cảm xúc giống con người trong AI. Nghiên cứu này cũng điều tra các tác động đa ngôn ngữ và chứng minh rằng khi kích thước mô hình tăng lên, tác động của các truy vấn được dịch sẽ trở nên mạnh mẽ hơn đáng kể. Phát hiện này nhấn mạnh tầm quan trọng của việc xem xét tính đa dạng ngôn ngữ khi phân tích các mô hình khái quát hóa trong các mô hình ngôn ngữ. Hơn nữa, nghiên cứu này xua tan quan niệm cho rằng kết quả đầu ra của mô hình là kết quả của việc ghi nhớ thuần túy. Ảnh hưởng thường tuân theo phân bố luật lũy thừa, trong đó một phần nhỏ dữ liệu huấn luyện có ảnh hưởng lớn nhất, nhưng ảnh hưởng vẫn còn lan tỏa. Mô hình này minh họa một quá trình khái quát hóa phức tạp và nhiều sắc thái hơn là chỉ liệt kê các ví dụ đào tạo riêng lẻ ở cấp độ mã thông báo. Hàm ảnh hưởng không chỉ cung cấp điểm ảnh hưởng có giá trị vô hướng cho mỗi chuỗi huấn luyện mà còn cung cấp cái nhìn sâu sắc về cách phân bổ ảnh hưởng trong mạng lưới thần kinh. Trung bình, ảnh hưởng được phân bổ đều giữa các lớp khác nhau của mạng. Tuy nhiên, đối với các truy vấn ảnh hưởng cụ thể, ảnh hưởng có xu hướng được tập trung vào các phần cụ thể của mạng, với các lớp dưới cùng và trên cùng nắm bắt thông tin văn bản chi tiết và các lớp giữa nắm bắt các cấp độ chủ đề trừu tượng hơn. Mặc dù nghiên cứu này tập trung vào các mô hình được đào tạo trước, nhưng Anthropic cũng muốn mở rộng nghiên cứu sang việc tinh chỉnh. Tinh chỉnh bao gồm các mô hình đào tạo dựa trên các mục tiêu học tăng cường có giám sát khác nhau, điều này có thể dẫn đến những kết quả và thách thức đáng ngạc nhiên. Khả năng bản địa hóa các ảnh hưởng đến các lớp hoặc mã thông báo cụ thể cũng mở ra khả năng liên kết các chức năng ảnh hưởng với khả năng diễn giải cơ học, cuối cùng là xác định các nơ-ron và mạch liên quan đến các mẫu khái quát hóa cụ thể. Bằng cách khám phá các cơ chế đằng sau kết quả đầu ra của mô hình và mô hình khái quát hóa, các nhà nghiên cứu có thể dự đoán chính xác hơn các khả năng của AI và điều chỉnh hệ thống AI theo sở thích của con người. Kết quả của nghiên cứu này có ý nghĩa sâu rộng đối với sự phát triển và triển khai các mô hình ngôn ngữ quy mô lớn trong tương lai.

Chia sẻ bài viết này:

Tin tức mới nhất
Trình bày kết quả hỗ trợ AI cho ranh giới giá trị mới

Trình bày kết quả hỗ trợ AI cho ranh giới giá trị mới

0:00 15/1/26

Công ty New Value Frontier (Shibuya-ku, Tokyo) đã công bố kết quả triển khai hệ thống "Dolphin", một hệ thống trí tuệ nhân tạo (AI) hỗ trợ các nhà tổ chức đám cưới.

Công nghệ xây dựng thương hiệu và Trí tuệ nhân tạo Nhật Bản, phát triển tác nhân phân tích truy cập

Công nghệ xây dựng thương hiệu và Trí tuệ nhân tạo Nhật Bản, phát triển tác nhân phân tích truy cập

0:00 15/1/26

Công ty Branding Technology (Shibuya-ku, Tokyo) đã công bố phát triển "Hệ thống đề xuất cải tiến phân tích truy cập" phối hợp với JAPAN AI (Shinjuku-ku, Tokyo)

Nền tảng hợp tác giữa công nghệ pháp lý và dữ liệu AI đã ra mắt.

Nền tảng hợp tác giữa công nghệ pháp lý và dữ liệu AI đã ra mắt.

0:00 15/1/26

Công ty Legal Tech (Minato-ku, Tokyo) và AI Data (Minato-ku, Tokyo) thông báo sẽ cùng nhau ra mắt một nền tảng bán bản quyền để xây dựng mô hình doanh thu mới dựa trên sở hữu trí tuệ trong ngành công nghiệp robot.

Hỗ trợ ra mắt dịch vụ AI đồng sáng tạo của JMAC

Hỗ trợ ra mắt dịch vụ AI đồng sáng tạo của JMAC

0:00 15/1/26

JMAC (quận Minato, Tokyo) đã ra mắt "meadas+," một dịch vụ AI hợp tác sáng tạo kết nối công nghệ doanh nghiệp với các vấn đề xã hội.

Copyright © 2024 Generatived - All right Reserved.

Chia sẻ bài viết này:

Chia sẻ bài viết này:

Generatived AI Logo

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

  • Facebook
  • X

Hãy theo dõi chúng tôi

Ngôn ngữ

Tin tức mới nhất
Trình bày kết quả hỗ trợ AI cho ranh giới giá trị mới

Trình bày kết quả hỗ trợ AI cho ranh giới giá trị mới

0:00 15/1/26

Công ty New Value Frontier (Shibuya-ku, Tokyo) đã công bố kết quả triển khai hệ thống "Dolphin", một hệ thống trí tuệ nhân tạo (AI) hỗ trợ các nhà tổ chức đám cưới.

Công nghệ xây dựng thương hiệu và Trí tuệ nhân tạo Nhật Bản, phát triển tác nhân phân tích truy cập

Công nghệ xây dựng thương hiệu và Trí tuệ nhân tạo Nhật Bản, phát triển tác nhân phân tích truy cập

0:00 15/1/26

Công ty Branding Technology (Shibuya-ku, Tokyo) đã công bố phát triển "Hệ thống đề xuất cải tiến phân tích truy cập" phối hợp với JAPAN AI (Shinjuku-ku, Tokyo)

Nền tảng hợp tác giữa công nghệ pháp lý và dữ liệu AI đã ra mắt.

Nền tảng hợp tác giữa công nghệ pháp lý và dữ liệu AI đã ra mắt.

0:00 15/1/26

Công ty Legal Tech (Minato-ku, Tokyo) và AI Data (Minato-ku, Tokyo) thông báo sẽ cùng nhau ra mắt một nền tảng bán bản quyền để xây dựng mô hình doanh thu mới dựa trên sở hữu trí tuệ trong ngành công nghiệp robot.

Hỗ trợ ra mắt dịch vụ AI đồng sáng tạo của JMAC

Hỗ trợ ra mắt dịch vụ AI đồng sáng tạo của JMAC

0:00 15/1/26

JMAC (quận Minato, Tokyo) đã ra mắt "meadas+," một dịch vụ AI hợp tác sáng tạo kết nối công nghệ doanh nghiệp với các vấn đề xã hội.

bottom of page