Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo
%20(1).webp)
FrontierScience công bố đạt được Benchmark khoa học GPT-5 thành công.
Generatived
0:00 18/12/25
FrontierScience là một chuẩn mực mới được thiết kế để đánh giá khả năng suy luận khoa học của trí tuệ nhân tạo trong các lĩnh vực vật lý, hóa học và sinh học. Chuẩn mực này nhằm mục đích đánh giá khả năng đạt được hiệu suất chuyên gia của AI, thách thức nó trong việc tạo ra và kiểm tra giả thuyết, cũng như nhớ lại sự kiện và tích hợp các ý tưởng từ nhiều lĩnh vực khoa học khác nhau.
Những tiến bộ gần đây trong AI đã cho phép các mô hình như GPT-5 đạt được những bước tiến đáng kể, giành huy chương vàng trong các cuộc thi học thuật quốc tế. Các nhà nghiên cứu hiện đang tận dụng các mô hình này để giảm thời gian thực hiện các nhiệm vụ trước đây mất nhiều ngày hoặc nhiều tuần xuống chỉ còn vài giờ. Sự tiến bộ này được nêu bật trong một bài báo mô tả chi tiết các thí nghiệm ban đầu với GPT-5, cho thấy mô hình này có thể tăng tốc đáng kể quy trình làm việc khoa học.
FrontierScience bao gồm hai phần: "Đường đua Olympic", tập trung vào suy luận khoa học theo phong cách Olympic, và "Đường đua Nghiên cứu", tập trung vào khả năng nghiên cứu khoa học thực tế. Chuẩn mực này được các chuyên gia xây dựng tỉ mỉ và bao gồm hàng trăm bài toán đầy thách thức. Các đánh giá ban đầu cho thấy GPT-5.2 được xếp hạng là mô hình hàng đầu trong cả hai lĩnh vực, chứng tỏ sự tiến bộ đáng kể trong việc giải quyết các vấn đề khoa học phức tạp, đồng thời cũng chỉ ra vẫn còn chỗ để cải thiện trong các câu hỏi nghiên cứu mở.
Những người tạo ra bộ tiêu chuẩn này nhận thấy rằng mặc dù FrontierScience cung cấp một thước đo thách thức và ý nghĩa hơn để đánh giá khả năng khoa học của AI, nhưng nó không bao quát tất cả các khía cạnh trong công việc hàng ngày của một nhà khoa học. Họ xem đây là một bước tiến hướng tới việc đánh giá khoa học nghiêm ngặt hơn, minh họa rõ ràng hơn những điểm mạnh của các mô hình AI và những lĩnh vực cần phát triển thêm. Khi AI phát triển, FrontierScience sẽ được liên tục tinh chỉnh, với mục tiêu xây dựng các hệ thống AI trở thành cộng tác viên đáng tin cậy trong việc theo đuổi khám phá khoa học.
Chia sẻ bài viết này:
Tin tức mới nhất
Điểm cao trong kỳ thi Legalscape AI Judicial Scrivener
0:00 18/12/25
Công ty Legalscape (Bunkyo-ku, Tokyo) thông báo rằng trí tuệ nhân tạo (AI) do chính họ phát triển đã đạt điểm cao trong phần trắc nghiệm của kỳ thi Thư ký Tòa án năm 2024.
Matsurika công bố chức năng tìm kiếm AI được nâng cấp.
0:00 18/12/25
Matsurika (Chuo-ku, Tokyo) đã ra mắt chức năng tìm kiếm bằng trí tuệ nhân tạo (AI) cho phần mềm hỗ trợ bán hàng và tiếp thị "Mazrica Engage".
Dịch vụ chẩn đoán bảo mật AI mới an toàn cho NRI
0:00 18/12/25
NRI Secure (Tokyo) đã ra mắt dịch vụ mới có tên "Deep AI Red Team" để đánh giá rủi ro bảo mật trong các hệ thống tác nhân AI.
Copyright © 2024 Generatived - All right Reserved.
Chia sẻ bài viết này:
Chia sẻ bài viết này:
Danh mục
Tin tức
AI và luật/hệ thống/kinh tế/xã hội
Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.
Tin tức mới nhất
Điểm cao trong kỳ thi Legalscape AI Judicial Scrivener
0:00 18/12/25
Công ty Legalscape (Bunkyo-ku, Tokyo) thông báo rằng trí tuệ nhân tạo (AI) do chính họ phát triển đã đạt điểm cao trong phần trắc nghiệm của kỳ thi Thư ký Tòa án năm 2024.
Matsurika công bố chức năng tìm kiếm AI được nâng cấp.
0:00 18/12/25
Matsurika (Chuo-ku, Tokyo) đã ra mắt chức năng tìm kiếm bằng trí tuệ nhân tạo (AI) cho phần mềm hỗ trợ bán hàng và tiếp thị "Mazrica Engage".
Dịch vụ chẩn đoán bảo mật AI mới an toàn cho NRI
0:00 18/12/25
NRI Secure (Tokyo) đã ra mắt dịch vụ mới có tên "Deep AI Red Team" để đánh giá rủi ro bảo mật trong các hệ thống tác nhân AI.





