top of page

Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

logo.png

FrontierScience công bố đạt được Benchmark khoa học GPT-5 thành công.

Generatived

0:00 18/12/25

FrontierScience là một chuẩn mực mới được thiết kế để đánh giá khả năng suy luận khoa học của trí tuệ nhân tạo trong các lĩnh vực vật lý, hóa học và sinh học. Chuẩn mực này nhằm mục đích đánh giá khả năng đạt được hiệu suất chuyên gia của AI, thách thức nó trong việc tạo ra và kiểm tra giả thuyết, cũng như nhớ lại sự kiện và tích hợp các ý tưởng từ nhiều lĩnh vực khoa học khác nhau.

Những tiến bộ gần đây trong AI đã cho phép các mô hình như GPT-5 đạt được những bước tiến đáng kể, giành huy chương vàng trong các cuộc thi học thuật quốc tế. Các nhà nghiên cứu hiện đang tận dụng các mô hình này để giảm thời gian thực hiện các nhiệm vụ trước đây mất nhiều ngày hoặc nhiều tuần xuống chỉ còn vài giờ. Sự tiến bộ này được nêu bật trong một bài báo mô tả chi tiết các thí nghiệm ban đầu với GPT-5, cho thấy mô hình này có thể tăng tốc đáng kể quy trình làm việc khoa học.

FrontierScience bao gồm hai phần: "Đường đua Olympic", tập trung vào suy luận khoa học theo phong cách Olympic, và "Đường đua Nghiên cứu", tập trung vào khả năng nghiên cứu khoa học thực tế. Chuẩn mực này được các chuyên gia xây dựng tỉ mỉ và bao gồm hàng trăm bài toán đầy thách thức. Các đánh giá ban đầu cho thấy GPT-5.2 được xếp hạng là mô hình hàng đầu trong cả hai lĩnh vực, chứng tỏ sự tiến bộ đáng kể trong việc giải quyết các vấn đề khoa học phức tạp, đồng thời cũng chỉ ra vẫn còn chỗ để cải thiện trong các câu hỏi nghiên cứu mở.

Những người tạo ra bộ tiêu chuẩn này nhận thấy rằng mặc dù FrontierScience cung cấp một thước đo thách thức và ý nghĩa hơn để đánh giá khả năng khoa học của AI, nhưng nó không bao quát tất cả các khía cạnh trong công việc hàng ngày của một nhà khoa học. Họ xem đây là một bước tiến hướng tới việc đánh giá khoa học nghiêm ngặt hơn, minh họa rõ ràng hơn những điểm mạnh của các mô hình AI và những lĩnh vực cần phát triển thêm. Khi AI phát triển, FrontierScience sẽ được liên tục tinh chỉnh, với mục tiêu xây dựng các hệ thống AI trở thành cộng tác viên đáng tin cậy trong việc theo đuổi khám phá khoa học.

Chia sẻ bài viết này:

Tin tức mới nhất
LegalOn công bố tiêu chuẩn đánh giá hiệu năng AI trong lĩnh vực pháp lý.

LegalOn công bố tiêu chuẩn đánh giá hiệu năng AI trong lĩnh vực pháp lý.

0:00 17/12/25

Công ty LegalOn Technologies (Shibuya-ku, Tokyo) đã phát hành "Legal Rikai: Open Benchmark"

Hỗ trợ tuyển dụng sinh viên mới tốt nghiệp tại TechSuite Maeda Road

Hỗ trợ tuyển dụng sinh viên mới tốt nghiệp tại TechSuite Maeda Road

0:00 17/12/25

TechSuite (Tokyo) đã cung cấp "AI Scout-kun" cho Maeda Road (Tokyo) để hỗ trợ nỗ lực tuyển dụng nhân sự mới tốt nghiệp.

Bài giảng về phát triển tác nhân AI của Acroquest

Bài giảng về phát triển tác nhân AI của Acroquest

0:00 17/12/25

Công ty Acroquest (Yokohama, tỉnh Kanagawa) sẽ tham gia sự kiện "JAWS-UG Presents - AI Builders Day" được tổ chức vào ngày 20 tháng 12 năm 2025.

Việc giám sát AI của Gively bắt đầu.

Việc giám sát AI của Gively bắt đầu.

0:00 17/12/25

Công ty Givery (quận Shibuya, Tokyo) đã ra mắt "Givery AI Monitoring", một dịch vụ trực quan hóa việc sử dụng Trí tuệ Generative AI ) trong các công ty.

Copyright © 2024 Generatived - All right Reserved.

Chia sẻ bài viết này:

Chia sẻ bài viết này:

Generatived AI Logo

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

  • Facebook
  • X

Hãy theo dõi chúng tôi

Ngôn ngữ

Tin tức mới nhất
LegalOn công bố tiêu chuẩn đánh giá hiệu năng AI trong lĩnh vực pháp lý.

LegalOn công bố tiêu chuẩn đánh giá hiệu năng AI trong lĩnh vực pháp lý.

0:00 17/12/25

Công ty LegalOn Technologies (Shibuya-ku, Tokyo) đã phát hành "Legal Rikai: Open Benchmark"

Hỗ trợ tuyển dụng sinh viên mới tốt nghiệp tại TechSuite Maeda Road

Hỗ trợ tuyển dụng sinh viên mới tốt nghiệp tại TechSuite Maeda Road

0:00 17/12/25

TechSuite (Tokyo) đã cung cấp "AI Scout-kun" cho Maeda Road (Tokyo) để hỗ trợ nỗ lực tuyển dụng nhân sự mới tốt nghiệp.

Bài giảng về phát triển tác nhân AI của Acroquest

Bài giảng về phát triển tác nhân AI của Acroquest

0:00 17/12/25

Công ty Acroquest (Yokohama, tỉnh Kanagawa) sẽ tham gia sự kiện "JAWS-UG Presents - AI Builders Day" được tổ chức vào ngày 20 tháng 12 năm 2025.

Việc giám sát AI của Gively bắt đầu.

Việc giám sát AI của Gively bắt đầu.

0:00 17/12/25

Công ty Givery (quận Shibuya, Tokyo) đã ra mắt "Givery AI Monitoring", một dịch vụ trực quan hóa việc sử dụng Trí tuệ Generative AI ) trong các công ty.

bottom of page