top of page

Generatived(Beta)|生成AIの最新ニュースとトレンドを提供

logo.png

FrontierScience、GPT-5の科学Benchmarkの成功を発表

Generatived

25/12/18 0:00

FrontierScienceは、物理学、化学、生物学の分野における人工知能の科学的推論能力を評価するために設計された新たなベンチマークとして登場しました。このベンチマークは、AIが専門家レベルのパフォーマンスを発揮できる能力を評価することを目的としており、事実の想起だけでなく、仮説の生成と検証、そして様々な科学分野にまたがるアイデアの統合といった課題に挑戦します。

近年のAIの進歩により、GPT-5などのモデルは大きな進歩を遂げ、国際的な学術コンテストで金メダルを獲得するなどの成果を上げています。現在、これらのモデルは、従来は数日から数週間かかっていたタスクをわずか数時間に短縮するために研究者によって活用されています。この進歩は、GPT-5の初期実験を詳述した論文で強調されており、このモデルが科学ワークフローを著しく高速化できることを示唆しています。

FrontierScienceは、オリンピック形式の科学的推論に焦点を当てた「オリンピックトラック」と、実社会における科学研究能力に焦点を当てた「リサーチトラック」の2つのセグメントで構成されています。このベンチマークは専門家によって綿密に作成されており、数百もの難問が含まれています。初期評価では、GPT-5.2が両方の分野でトップモデルと評価され、複雑な科学的課題の解決において大きな進歩を示す一方で、オープンエンドの研究課題においては改善の余地があることも示されました。

ベンチマークの作成者は、FrontierScienceがAIの科学的能力を測定するためのより挑戦的で有意義な指標を提供する一方で、科学者の日常業務のすべてを網羅しているわけではないことを認識しています。これは、AIモデルの優れた点とさらなる開発が必要な点をより明確に示し、より厳密な科学的ベンチマークへの一歩と捉えています。AIの進化に伴い、FrontierScienceは科学的発見の追求において信頼できる協力者となるAIシステムの構築を目指して、継続的に改良されていきます。

この記事を共有:

最新のニュース
マインディアAIで商品データ自動化

マインディアAIで商品データ自動化

25/12/19 0:00

マインディア(東京都港区)のAI Data Lab.は、商品のテキスト情報や画像を基に、AIモジュールを開発した。

インプレス新刊AIと仕事の進め方

インプレス新刊AIと仕事の進め方

25/12/19 0:00

インプレス(東京都千代田区)は、新刊『ヒトもAIも仕事は‘引き受け方’が9割』をNextPublishingより発行する。

レバテックAIチャット案件検索開始

レバテックAIチャット案件検索開始

25/12/19 0:00

レバテック(東京)は、ITフリーランス支援サービス「レバテックフリーランス」において、新機能「AIチャット案件検索(β版)」の提供を開始した。

楽天新AI「Rakuten AI 3.0」開発発表

楽天新AI「Rakuten AI 3.0」開発発表

25/12/19 0:00

楽天(東京)は、経済産業省とNEDOが進める「GENIAC」プロジェクトの一環で、新AIモデル「Rakuten AI 3.0」を開発したと発表。

Copyright © 2024 Generatived - All right Reserved.

この記事を共有:

この記事を共有:

Generatived AI Logo

Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。

  • Facebook
  • X

フォローをお願いします

言語

最新のニュース
マインディアAIで商品データ自動化

マインディアAIで商品データ自動化

25/12/19 0:00

マインディア(東京都港区)のAI Data Lab.は、商品のテキスト情報や画像を基に、AIモジュールを開発した。

インプレス新刊AIと仕事の進め方

インプレス新刊AIと仕事の進め方

25/12/19 0:00

インプレス(東京都千代田区)は、新刊『ヒトもAIも仕事は‘引き受け方’が9割』をNextPublishingより発行する。

レバテックAIチャット案件検索開始

レバテックAIチャット案件検索開始

25/12/19 0:00

レバテック(東京)は、ITフリーランス支援サービス「レバテックフリーランス」において、新機能「AIチャット案件検索(β版)」の提供を開始した。

楽天新AI「Rakuten AI 3.0」開発発表

楽天新AI「Rakuten AI 3.0」開発発表

25/12/19 0:00

楽天(東京)は、経済産業省とNEDOが進める「GENIAC」プロジェクトの一環で、新AIモデル「Rakuten AI 3.0」を開発したと発表。

bottom of page