Generatived(Beta)|生成AIの最新ニュースとトレンドを提供

NVIDIA、NeMoでLLM向けRL実践法公開
Generatived
26/7/3 0:00
NVIDIA(米カリフォルニア州サンタクララ)は、大規模言語モデル(LLM)やAIエージェント向けの強化学習(RL)の実践ガイドを公開した。企業が独自業務向けAIを高精度化するための手法として、RLの活用方法や学習環境を体系的に整理した内容という。
ガイドでは、検索拡張生成(RAG)や教師ありファインチューニング(SFT)、直接選好最適化(DPO)との使い分けを示し、検証可能な報酬を用いるRLVRとGRPOを中心とした学習フローを紹介。業務環境で評価可能なタスクを段階的に改善する手法を推奨するとした。
また、Nemotron、NeMo RL、NeMo Gym、NeMo Data Designerなどのツール群を活用し、データ生成から環境構築、学習、評価までを一貫して実施できる仕組みを提供。企業向けエージェントの継続的な性能改善を支援する考えを示した。
NVIDIAは、長時間にわたるエージェント処理では、本番環境で発生した失敗事例を評価データや学習環境へ反映させる改善サイクルが重要と説明。AIエージェントの継続的な最適化を実現する開発基盤としてNeMo関連製品の活用を呼び掛けた。
最新のニュース
NOB DATA、ダイキンAI人材育成支援
26/7/1 0:00
NOB DATA(福岡市)は、ダイキン工業が運営する「ダイキン情報技術大学(DICT)」で実施した既存社員向けAI・データ分析人材育成施策の支援事例を公開した。
UNCOVER TRUTH、AI分析を自社向け最適化
26/7/1 0:00
UNCOVER TRUTH(東京都渋谷区)は、分析AIエージェント搭載Web解析ツール「Content Analytics」に、企業ごとのブランド情報や分析前提をAIへ事前登録できる「AIパーソナライズ機能」を追加したと発表した。
Retell AI、Conductorを提供開始
26/7/1 0:00
Retell AI(米カリフォルニア州レッドウッドシティ)は、音声AIエージェント向けレビューシステム「Conductor」の提供開始を発表した。
Copyright © 2024 Generatived - All right Reserved.
ニュース
Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。
最新のニュース
NOB DATA、ダイキンAI人材育成支援
26/7/1 0:00
NOB DATA(福岡市)は、ダイキン工業が運営する「ダイキン情報技術大学(DICT)」で実施した既存社員向けAI・データ分析人材育成施策の支援事例を公開した。
UNCOVER TRUTH、AI分析を自社向け最適化
26/7/1 0:00
UNCOVER TRUTH(東京都渋谷区)は、分析AIエージェント搭載Web解析ツール「Content Analytics」に、企業ごとのブランド情報や分析前提をAIへ事前登録できる「AIパーソナライズ機能」を追加したと発表した。
Retell AI、Conductorを提供開始
26/7/1 0:00
Retell AI(米カリフォルニア州レッドウッドシティ)は、音声AIエージェント向けレビューシステム「Conductor」の提供開始を発表した。





