Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

Argos nâng cao độ tin cậy của tác nhân AI thông qua các cải tiến.
Generatived
0:00 22/1/26
Mặc dù các hệ thống AI đã đạt được những bước tiến lớn trong nhận dạng hình ảnh, tạo ngôn ngữ và thực thi tác vụ, chúng thường mắc phải những lỗi khó lường, làm dấy lên lo ngại về an toàn và độ tin cậy. Những lỗi này xuất phát từ việc các tác nhân AI học dựa trên tính hợp lý hơn là độ chính xác, tạo ra các kết quả dường như đúng dựa trên thông tin không chính xác. Khi AI ngày càng được tích hợp vào các ứng dụng thực tế, việc đảm bảo các quyết định của AI dựa trên dữ liệu môi trường thực tế trở nên thiết yếu.
Argos, một khung công tác mới, nhằm mục đích cải thiện độ tin cậy của các tác nhân AI bằng cách tập trung vào học tăng cường, trong đó các mô hình AI học thông qua phần thưởng và hình phạt. Không giống như các mô hình truyền thống chỉ thưởng cho các hành động đúng, Argos cũng đánh giá lý luận đằng sau những hành động này. Bằng cách tận dụng các mô hình quy mô lớn hơn và các kiểm tra dựa trên quy tắc, nó đảm bảo rằng AI tham chiếu các đối tượng và sự kiện trong đầu vào của nó và các suy luận của nó nhất quán với các quan sát.
Argos hoạt động như một lớp xác thực trên các mô hình đa phương thức, kiểm tra kỹ lưỡng độ chính xác của đầu ra mô hình, sự tồn tại của các đối tượng và sự kiện được tham chiếu, và tính nhất quán của các suy luận với bằng chứng trực quan. Argos sử dụng các hàm tổng hợp có cổng để cân bằng tầm quan trọng của các điểm số khác nhau, và chỉ nhấn mạnh việc kiểm tra suy luận khi đầu ra chính xác. Cách tiếp cận này ngăn chặn phản hồi không đáng tin cậy ảnh hưởng đến quá trình huấn luyện và cung cấp tín hiệu phần thưởng ổn định cho học tăng cường.
Tác động của Argos thể hiện rõ ở khả năng huấn luyện các mô hình vượt trội hơn các mô hình cơ bản hiện có trong các nhiệm vụ suy luận không gian và giảm thiểu ảo giác. Argos cũng cho phép các mô hình hoạt động tốt hơn trong các nhiệm vụ thực tế với ít mẫu huấn luyện hơn, làm nổi bật tầm quan trọng của thiết kế phần thưởng trong việc tạo ra các tác nhân AI hiệu quả. Nghiên cứu này cho thấy sự chuyển dịch sang các tác nhân AI xây dựng suy luận một cách có hệ thống dựa trên đầu vào thực tế, với các ứng dụng tiềm năng trên nhiều lĩnh vực khác nhau và tăng cường tính an toàn và độ tin cậy của các hệ thống AI.
Chia sẻ bài viết này:
Tin tức mới nhất
Systena hợp tác trưng bày tại Triển lãm Ô tô 2026.
0:00 21/1/26
Công ty Systena (Minato-ku, Tokyo) sẽ tham gia triển lãm Automotive World lần thứ 18, diễn ra tại Tokyo Big Sight trong ba ngày từ 21 đến 23 tháng 1 năm 2026.
Công cụ tự động hóa kinh doanh AI cơ bản đã được ra mắt.
0:00 21/1/26
Công ty Basic (Chiyoda-ku, Tokyo) đã ra mắt "workrun", một dịch vụ sử dụng trí tuệ nhân tạo (AI) để tự động thực hiện các quy trình kinh doanh giữa các công cụ.
Phát triển AI cho việc kiểm tra tháp Waymark trong cơ sở hạ tầng.
0:00 21/1/26
Công ty Japan Infrastructure Waymark (Minato-ku, Tokyo) đã phát triển trí tuệ nhân tạo hỗ trợ kiểm tra tháp dựa trên kinh nghiệm kiểm tra hơn 500 tháp thép bằng máy bay
Copyright © 2024 Generatived - All right Reserved.
Chia sẻ bài viết này:
Chia sẻ bài viết này:
Danh mục
Tin tức
AI và luật/hệ thống/kinh tế/xã hội
Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.
Tin tức mới nhất
Systena hợp tác trưng bày tại Triển lãm Ô tô 2026.
0:00 21/1/26
Công ty Systena (Minato-ku, Tokyo) sẽ tham gia triển lãm Automotive World lần thứ 18, diễn ra tại Tokyo Big Sight trong ba ngày từ 21 đến 23 tháng 1 năm 2026.
Công cụ tự động hóa kinh doanh AI cơ bản đã được ra mắt.
0:00 21/1/26
Công ty Basic (Chiyoda-ku, Tokyo) đã ra mắt "workrun", một dịch vụ sử dụng trí tuệ nhân tạo (AI) để tự động thực hiện các quy trình kinh doanh giữa các công cụ.
Phát triển AI cho việc kiểm tra tháp Waymark trong cơ sở hạ tầng.
0:00 21/1/26
Công ty Japan Infrastructure Waymark (Minato-ku, Tokyo) đã phát triển trí tuệ nhân tạo hỗ trợ kiểm tra tháp dựa trên kinh nghiệm kiểm tra hơn 500 tháp thép bằng máy bay

%20(1).webp)



