top of page

Generatived(Beta)|生成AIの最新ニュースとトレンドを提供

logo.png

NVIDIA、NeMoでLLM向けRL実践法公開

Generatived

26/7/3 0:00

NVIDIA(米カリフォルニア州サンタクララ)は、大規模言語モデル(LLM)やAIエージェント向けの強化学習(RL)の実践ガイドを公開した。企業が独自業務向けAIを高精度化するための手法として、RLの活用方法や学習環境を体系的に整理した内容という。

ガイドでは、検索拡張生成(RAG)や教師ありファインチューニング(SFT)、直接選好最適化(DPO)との使い分けを示し、検証可能な報酬を用いるRLVRとGRPOを中心とした学習フローを紹介。業務環境で評価可能なタスクを段階的に改善する手法を推奨するとした。

また、Nemotron、NeMo RL、NeMo Gym、NeMo Data Designerなどのツール群を活用し、データ生成から環境構築、学習、評価までを一貫して実施できる仕組みを提供。企業向けエージェントの継続的な性能改善を支援する考えを示した。

NVIDIAは、長時間にわたるエージェント処理では、本番環境で発生した失敗事例を評価データや学習環境へ反映させる改善サイクルが重要と説明。AIエージェントの継続的な最適化を実現する開発基盤としてNeMo関連製品の活用を呼び掛けた。

この記事を共有:

最新のニュース
NVIDIAが科学AI基盤を強化

NVIDIAが科学AI基盤を強化

26/7/2 0:00

NVIDIAは、Anthropicが発表した研究向けAIワークベンチ「Claude Science」と「NVIDIA BioNeMo Agent Toolkit」の連携を発表した。

MicrosoftがAIエージェント攻撃解説

MicrosoftがAIエージェント攻撃解説

26/7/2 0:00

Microsoftは、AIエージェントが外部ツールと連携する際に発生する新たなサプライチェーンリスクについて解説するセキュリティーリポートを公開した。

USFとAWSが防衛研究基盤強化

USFとAWSが防衛研究基盤強化

26/7/2 0:00

The University of South Florida(米フロリダ州)は、Amazon Web Services(AWS)と連携し、防衛・航空宇宙分野の研究を支えるセキュアなクラウド基盤を整備すると発表した。

サイバーエージェント AI介在分析機能公開

サイバーエージェント AI介在分析機能公開

26/7/1 0:00

サイバーエージェント(東京都渋谷区)は、コーディングエージェントの実行履歴を分析し、人間による確認や介入(Human-in-the-Loop)の頻度や内容を可視化するスキル「hitl-harness-improver」をGitHubで公開したと発表した。

Copyright © 2024 Generatived - All right Reserved.

この記事を共有:

この記事を共有:

Generatived AI Logo

Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。

  • Facebook
  • X

フォローをお願いします

言語

最新のニュース
NVIDIAが科学AI基盤を強化

NVIDIAが科学AI基盤を強化

26/7/2 0:00

NVIDIAは、Anthropicが発表した研究向けAIワークベンチ「Claude Science」と「NVIDIA BioNeMo Agent Toolkit」の連携を発表した。

MicrosoftがAIエージェント攻撃解説

MicrosoftがAIエージェント攻撃解説

26/7/2 0:00

Microsoftは、AIエージェントが外部ツールと連携する際に発生する新たなサプライチェーンリスクについて解説するセキュリティーリポートを公開した。

USFとAWSが防衛研究基盤強化

USFとAWSが防衛研究基盤強化

26/7/2 0:00

The University of South Florida(米フロリダ州)は、Amazon Web Services(AWS)と連携し、防衛・航空宇宙分野の研究を支えるセキュアなクラウド基盤を整備すると発表した。

サイバーエージェント AI介在分析機能公開

サイバーエージェント AI介在分析機能公開

26/7/1 0:00

サイバーエージェント(東京都渋谷区)は、コーディングエージェントの実行履歴を分析し、人間による確認や介入(Human-in-the-Loop)の頻度や内容を可視化するスキル「hitl-harness-improver」をGitHubで公開したと発表した。

bottom of page