Generatived(Beta)|生成AIの最新ニュースとトレンドを提供

LangGraph Tech AIエージェントがCLI操作の安全性を向上
Generatived
26/1/19 0:00
最近の開発では、LangGraph Platform CLIを事前知識なしで操作できるように新しいAIエージェントがトレーニングされ、大規模推論モデルの適応性を示しました。このエージェントは、以前のエージェントとは異なり、実行前に人間による確認を必要とする検証可能なコマンドインターフェースを介して、サーバーの起動、コンテナの構築、Dockerfileの生成を行うことができます。トレーニングプロセスでは、合成データ生成と検証可能な報酬を伴う強化学習が活用され、グループ相対ポリシー最適化によって最適化されており、効率性と安全性の両方が確保されています。
新しいCLIツールを実行するために設計されたこの特化エージェントは、有効なLangGraph CLIコマンドを提案し、何らかのアクションを実行する前に明示的な人間の承認を求めるように微調整されています。エージェントは合成シードデータから新しいサブコマンドを学習し、検証可能な報酬を伴う強化学習を用いて単一のGPU上でトレーニングされます。トレーニング済みモデルとの典型的なインタラクションでは、エージェントがコマンドを提案し、ユーザーの確認を求めます。ユーザーが承認すると、コマンドが実行され、結果が報告されます。
AIエージェントの学習アプローチは、データ不足という課題と、特殊なCLIツールの操作に伴う安全性と精度のトレードオフを克服することを伴います。合成データ生成により、限られた数のシードコマンドから包括的な学習データセットを作成でき、検証可能な報酬を伴う強化学習により、構文的に正しいコマンドの生成が保証されます。この手法は、独自ツールへの迅速な適応が求められるエンタープライズ環境に特に有益です。
このシステムをセットアップするには、NVIDIA GPUやシステムRAMなどの特定のハードウェアに加え、 PythonやCUDAなどのソフトウェアへのアクセスが必要です。コアコンポーネントには、LangGraph CLIツール、RLトレーニング環境用のNeMo Gym、強化学習用のUnsloth、合成データ生成用のNeMo Data Designerが含まれます。使用されるベースモデルはNemotron-Nano-9B-V2で、 Hugging Faceから入手可能です。詳細なインストール手順と使用方法については、リンク先のドキュメントをご覧ください。この革新的なトレーニングパイプラインにより、専用で安全なCLIエージェントを迅速に導入でき、ワークフローの自動化と生産性向上ツールの強化のための新たなソリューションを提供します。
最新のニュース
L is B矢作建設AI安全指示ボット開発
26/1/19 0:00
L is B(東京都千代田区)と矢作建設工業(愛知県名古屋市)は、建設現場の安全指示を高度化する「AIあんぜん指示ボット」を開発した。
ホスピタリティテック、レストランネットワーク標準にキンペルを任命
26/1/19 0:00
EnsembleIQのホスピタリティテクノロジー部門は、レストランテクノロジーネットワーク(RTN)の最高標準・AI責任者にスキップ・キンペル氏を任命したことを発表しました。
Capgemini研究所、AI統合戦略の転換を発表
26/1/19 0:00
Capgemini・リサーチ・インスティテュートの最新レポートによると、ビジネスリーダーはAI戦略に対し、より現実的なアプローチを採用し、AIを意思決定プロセスに統合していることが明らかになりました。


%20(1).webp)

