top of page

Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

logo.png

FrontierScience công bố đạt được Benchmark khoa học GPT-5 thành công.

Generatived

0:00 18/12/25

FrontierScience là một chuẩn mực mới được thiết kế để đánh giá khả năng suy luận khoa học của trí tuệ nhân tạo trong các lĩnh vực vật lý, hóa học và sinh học. Chuẩn mực này nhằm mục đích đánh giá khả năng đạt được hiệu suất chuyên gia của AI, thách thức nó trong việc tạo ra và kiểm tra giả thuyết, cũng như nhớ lại sự kiện và tích hợp các ý tưởng từ nhiều lĩnh vực khoa học khác nhau.

Những tiến bộ gần đây trong AI đã cho phép các mô hình như GPT-5 đạt được những bước tiến đáng kể, giành huy chương vàng trong các cuộc thi học thuật quốc tế. Các nhà nghiên cứu hiện đang tận dụng các mô hình này để giảm thời gian thực hiện các nhiệm vụ trước đây mất nhiều ngày hoặc nhiều tuần xuống chỉ còn vài giờ. Sự tiến bộ này được nêu bật trong một bài báo mô tả chi tiết các thí nghiệm ban đầu với GPT-5, cho thấy mô hình này có thể tăng tốc đáng kể quy trình làm việc khoa học.

FrontierScience bao gồm hai phần: "Đường đua Olympic", tập trung vào suy luận khoa học theo phong cách Olympic, và "Đường đua Nghiên cứu", tập trung vào khả năng nghiên cứu khoa học thực tế. Chuẩn mực này được các chuyên gia xây dựng tỉ mỉ và bao gồm hàng trăm bài toán đầy thách thức. Các đánh giá ban đầu cho thấy GPT-5.2 được xếp hạng là mô hình hàng đầu trong cả hai lĩnh vực, chứng tỏ sự tiến bộ đáng kể trong việc giải quyết các vấn đề khoa học phức tạp, đồng thời cũng chỉ ra vẫn còn chỗ để cải thiện trong các câu hỏi nghiên cứu mở.

Những người tạo ra bộ tiêu chuẩn này nhận thấy rằng mặc dù FrontierScience cung cấp một thước đo thách thức và ý nghĩa hơn để đánh giá khả năng khoa học của AI, nhưng nó không bao quát tất cả các khía cạnh trong công việc hàng ngày của một nhà khoa học. Họ xem đây là một bước tiến hướng tới việc đánh giá khoa học nghiêm ngặt hơn, minh họa rõ ràng hơn những điểm mạnh của các mô hình AI và những lĩnh vực cần phát triển thêm. Khi AI phát triển, FrontierScience sẽ được liên tục tinh chỉnh, với mục tiêu xây dựng các hệ thống AI trở thành cộng tác viên đáng tin cậy trong việc theo đuổi khám phá khoa học.

Chia sẻ bài viết này:

Tin tức mới nhất
Hao AI Lab tích hợp NVIDIA DGX cho nghiên cứu LLM

Hao AI Lab tích hợp NVIDIA DGX cho nghiên cứu LLM

0:00 19/12/25

Phòng thí nghiệm AI Hao tại Đại học California, San Diego, gần đây đã tích hợp hệ thống NVIDIA DGX B200 vào cơ sở hạ tầng nghiên cứu của mình.

OpenAI ra mắt Học viện AI dành cho nhà báo

OpenAI ra mắt Học viện AI dành cho nhà báo

0:00 19/12/25

OpenAI vừa công bố ra mắt nền tảng giáo dục mới, Học viện OpenAI dành cho các Tổ chức Tin tức, hợp tác với Dự án Báo chí Hoa Kỳ và Viện Lenfest.

Dự án Giáng sinh AI đám mây khách hàng

Dự án Giáng sinh AI đám mây khách hàng

0:00 18/12/25

Công ty Customer Cloud (Tokyo) đã khởi động dự án "Giáng sinh AI của bạn", nhằm mục đích định nghĩa lại trí tuệ nhân tạo (AI) như một thực thể hỗ trợ các mối quan hệ giữa con người.

Sự tiến hóa của hệ thống quản lý nội bộ dựa trên AI của DATAFLUCT

Sự tiến hóa của hệ thống quản lý nội bộ dựa trên AI của DATAFLUCT

0:00 18/12/25

DATAFLUCT (Quận Shibuya, Tokyo) sẽ tham gia thuyết trình tại "Hội nghị Digital Transformation Văn phòng Hậu cần: Hai ngày Phát triển Hệ thống

Copyright © 2024 Generatived - All right Reserved.

Chia sẻ bài viết này:

Chia sẻ bài viết này:

Generatived AI Logo

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

  • Facebook
  • X

Hãy theo dõi chúng tôi

Ngôn ngữ

Tin tức mới nhất
Hao AI Lab tích hợp NVIDIA DGX cho nghiên cứu LLM

Hao AI Lab tích hợp NVIDIA DGX cho nghiên cứu LLM

0:00 19/12/25

Phòng thí nghiệm AI Hao tại Đại học California, San Diego, gần đây đã tích hợp hệ thống NVIDIA DGX B200 vào cơ sở hạ tầng nghiên cứu của mình.

OpenAI ra mắt Học viện AI dành cho nhà báo

OpenAI ra mắt Học viện AI dành cho nhà báo

0:00 19/12/25

OpenAI vừa công bố ra mắt nền tảng giáo dục mới, Học viện OpenAI dành cho các Tổ chức Tin tức, hợp tác với Dự án Báo chí Hoa Kỳ và Viện Lenfest.

Dự án Giáng sinh AI đám mây khách hàng

Dự án Giáng sinh AI đám mây khách hàng

0:00 18/12/25

Công ty Customer Cloud (Tokyo) đã khởi động dự án "Giáng sinh AI của bạn", nhằm mục đích định nghĩa lại trí tuệ nhân tạo (AI) như một thực thể hỗ trợ các mối quan hệ giữa con người.

Sự tiến hóa của hệ thống quản lý nội bộ dựa trên AI của DATAFLUCT

Sự tiến hóa của hệ thống quản lý nội bộ dựa trên AI của DATAFLUCT

0:00 18/12/25

DATAFLUCT (Quận Shibuya, Tokyo) sẽ tham gia thuyết trình tại "Hội nghị Digital Transformation Văn phòng Hậu cần: Hai ngày Phát triển Hệ thống

bottom of page