Generatived(Beta)|生成AIの最新ニュースとトレンドを提供

LangGraph Tech AIエージェントがCLI操作の安全性を向上
Generatived
26/1/19 0:00
最近の開発では、LangGraph Platform CLIを事前知識なしで操作できるように新しいAIエージェントがトレーニングされ、大規模推論モデルの適応性を示しました。このエージェントは、以前のエージェントとは異なり、実行前に人間による確認を必要とする検証可能なコマンドインターフェースを介して、サーバーの起動、コンテナの構築、Dockerfileの生成を行うことができます。トレーニングプロセスでは、合成データ生成と検証可能な報酬を伴う強化学習が活用され、グループ相対ポリシー最適化によって最適化されており、効率性と安全性の両方が確保されています。
新しいCLIツールを実行するために設計されたこの特化エージェントは、有効なLangGraph CLIコマンドを提案し、何らかのアクションを実行する前に明示的な人間の承認を求めるように微調整されています。エージェントは合成シードデータから新しいサブコマンドを学習し、検証可能な報酬を伴う強化学習を用いて単一のGPU上でトレーニングされます。トレーニング済みモデルとの典型的なインタラクションでは、エージェントがコマンドを提案し、ユーザーの確認を求めます。ユーザーが承認すると、コマンドが実行され、結果が報告されます。
AIエージェントの学習アプローチは、データ不足という課題と、特殊なCLIツールの操作に伴う安全性と精度のトレードオフを克服することを伴います。合成データ生成により、限られた数のシードコマンドから包括的な学習データセットを作成でき、検証可能な報酬を伴う強化学習により、構文的に正しいコマンドの生成が保証されます。この手法は、独自ツールへの迅速な適応が求められるエンタープライズ環境に特に有益です。
このシステムをセットアップするには、NVIDIA GPUやシステムRAMなどの特定のハードウェアに加え、 PythonやCUDAなどのソフトウェアへのアクセスが必要です。コアコンポーネントには、LangGraph CLIツール、RLトレーニング環境用のNeMo Gym、強化学習用のUnsloth、合成データ生成用のNeMo Data Designerが含まれます。使用されるベースモデルはNemotron-Nano-9B-V2で、 Hugging Faceから入手可能です。詳細なインストール手順と使用方法については、リンク先のドキュメントをご覧ください。この革新的なトレーニングパイプラインにより、専用で安全なCLIエージェントを迅速に導入でき、ワークフローの自動化と生産性向上ツールの強化のための新たなソリューションを提供します。
最新のニュース
ナビタイムAI駅混雑予測機能開始
25/12/30 0:00
ナビタイムジャパン(東京都港区)は、2025年12月24日より、『NAVITIME』と『鉄道時刻表クラウド by NAVITIME』でAIを用いた新機能を開始する。
エクスコアAI歯科選択支援サービス開始
25/12/30 0:00
エクスコア(東京都渋谷区)は、歯科医院選びにおけるユーザーの行動変容に関する調査を行い、生成AIを利用するユーザーが半数を超えることを明らかにした。
Copyright © 2024 Generatived - All right Reserved.
ニュース
Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。
最新のニュース
ナビタイムAI駅混雑予測機能開始
25/12/30 0:00
ナビタイムジャパン(東京都港区)は、2025年12月24日より、『NAVITIME』と『鉄道時刻表クラウド by NAVITIME』でAIを用いた新機能を開始する。
エクスコアAI歯科選択支援サービス開始
25/12/30 0:00
エクスコア(東京都渋谷区)は、歯科医院選びにおけるユーザーの行動変容に関する調査を行い、生成AIを利用するユーザーが半数を超えることを明らかにした。

%20(1).webp)


%20(1).webp)

