top of page

Generatived(Beta)|生成AIの最新ニュースとトレンドを提供

logo.png

Weights&Biases Japan、大規模言語モデル20種の日本語性能をランキング

Generatived

23/8/21 9:34

Weights & Biases Japanは、2023年7月より大規模言語モデル(LLM)の日本語性能を評価結果のランキングを公開する「Nejumi LLMリーダーボード」(以下、Nejumiリーダーボード)を運用してきた。このたび評価されたLLMモデルの数が20を超え、日本語性能評価のLLMモデルリーダーボードとしては日本最大級の規模になった。本ランキングはオンライン上で公開されており、評価に使われているコードは実行可能なWandBジョブ形式で公開されている。Nejumiリーダーボードでは、JGLUEデータセットを使ったモデル評価を行っている。JGLUEは、早稲田大学とYahoo!JAPAN研究所が構築・公開した日本語言語理解ベンチマークで、Nejumiリーダーボードでは、特にLLMの能力を測るのに重要と思われる5つのタスクを使っている。さまざまなモデルの評価結果を検証すると、OpenAI社のChatGPTを構成するGPT-4およびGPT-3.5の高スコアが際立っている。また、Meta社が公開したLlama 2モデルも非常に高いスコアを出しており、さらに追加データで学習したモデルも現れている。Nejumiリーダーボードでは、Stability AI社がLlama 2モデルをファインチューニングしたモデル、StableBeluga2が初めてGPT-3.5を超える結果を出した。LLMの開発には更なる発展が見られるが、その方向性が多様化していることにも注目が必要だ。また、より少ないパラメーター数のモデルでも性能を上げるための研究や、より幅広いダウンストリームタスクでのLLM活用が進むことに合わせて、性能評価もより多様化していくことが求められる。W&B Japanは、国立情報学研究所(NII)の主宰するLLM-jpコラボレーションへの参画メンバーとして日本のLLM開発の課題を解決する開発に取り組んでいる。

この記事を共有:

最新のニュース
DryRun SecurityがAIコーディングエージェントの欠陥を暴露

DryRun SecurityがAIコーディングエージェントの欠陥を暴露

26/3/13 0:00

DryRun Securityは、AIコーディングエージェントがソフトウェア開発を加速させる一方で、セキュリティ上の脆弱性をもたらす傾向があることを示す新たな調査結果を発表しました。

Opinosis AnalyticsがAI統合準備ツールをリリース

Opinosis AnalyticsがAI統合準備ツールをリリース

26/3/13 0:00

ユタ州ウェストジョーダン – 企業がAI活用において直面する課題に対応するため、Opinosis Analyticsは新たな診断ツールを発表しました。

Entity、AIに最適化された4つの新しいMTIAチップを発表

Entity、AIに最適化された4つの新しいMTIAチップを発表

26/3/13 0:00

同社は、今後2年以内に4世代のカスタムビルドシリコンチップを開発・導入するという野心的な計画を発表しました。

AIヘルスイニシアチブがオーストラリアの遠隔医療を強化

AIヘルスイニシアチブがオーストラリアの遠隔医療を強化

26/3/13 0:00

オーストラリアの医療環境は、都市部に比べて心臓病による死亡リスクが60%高い遠隔地住民の健康状態改善を目指す新たな取り組みの恩恵を受けることになります。

Copyright © 2024 Generatived - All right Reserved.

この記事を共有:

この記事を共有:

Generatived AI Logo

Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。

  • Facebook
  • X

フォローをお願いします

言語

最新のニュース
DryRun SecurityがAIコーディングエージェントの欠陥を暴露

DryRun SecurityがAIコーディングエージェントの欠陥を暴露

26/3/13 0:00

DryRun Securityは、AIコーディングエージェントがソフトウェア開発を加速させる一方で、セキュリティ上の脆弱性をもたらす傾向があることを示す新たな調査結果を発表しました。

Opinosis AnalyticsがAI統合準備ツールをリリース

Opinosis AnalyticsがAI統合準備ツールをリリース

26/3/13 0:00

ユタ州ウェストジョーダン – 企業がAI活用において直面する課題に対応するため、Opinosis Analyticsは新たな診断ツールを発表しました。

Entity、AIに最適化された4つの新しいMTIAチップを発表

Entity、AIに最適化された4つの新しいMTIAチップを発表

26/3/13 0:00

同社は、今後2年以内に4世代のカスタムビルドシリコンチップを開発・導入するという野心的な計画を発表しました。

AIヘルスイニシアチブがオーストラリアの遠隔医療を強化

AIヘルスイニシアチブがオーストラリアの遠隔医療を強化

26/3/13 0:00

オーストラリアの医療環境は、都市部に比べて心臓病による死亡リスクが60%高い遠隔地住民の健康状態改善を目指す新たな取り組みの恩恵を受けることになります。

bottom of page