Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif

Agen AI LangGraph Tech Meningkatkan Keamanan Operasi CLI
Generatived
19/1/26, 00.00
Dalam perkembangan terbaru, agen AI baru telah dilatih untuk mengoperasikan CLI Platform LangGraph tanpa pengetahuan sebelumnya, yang menunjukkan kemampuan adaptasi model inferensi skala besar. Tidak seperti agen sebelumnya, agen ini dapat meluncurkan server, membangun kontainer, dan menghasilkan Dockerfile melalui antarmuka perintah yang dapat diverifikasi yang memerlukan konfirmasi manusia sebelum dieksekusi. Proses pelatihan menggunakan pembelajaran penguatan dengan pembuatan data sintetis dan imbalan yang dapat diverifikasi, dan dioptimalkan menggunakan optimasi kebijakan relatif kelompok untuk memastikan efisiensi dan keamanan.
Dirancang untuk menjalankan alat CLI baru, agen khusus ini disempurnakan untuk menyarankan perintah CLI LangGraph yang valid dan meminta persetujuan manusia secara eksplisit sebelum mengambil tindakan apa pun. Agen mempelajari subperintah baru dari data awal sintetis dan dilatih pada satu GPU menggunakan pembelajaran penguatan dengan imbalan yang dapat diverifikasi. Interaksi tipikal dengan model yang terlatih melibatkan agen yang menyarankan perintah dan meminta konfirmasi pengguna. Jika pengguna menyetujui, perintah dieksekusi dan hasilnya dilaporkan.
Pendekatan kami dalam melatih agen AI melibatkan mengatasi tantangan kelangkaan data dan pertukaran antara keamanan dan akurasi yang melekat dalam pengoperasian alat CLI khusus. Pembuatan data sintetis memungkinkan kami untuk membuat kumpulan data pelatihan yang komprehensif dari sejumlah perintah awal yang terbatas, sementara pembelajaran penguatan dengan imbalan yang dapat diverifikasi memastikan pembuatan perintah yang benar secara sintaksis. Teknik ini sangat bermanfaat di lingkungan perusahaan di mana adaptasi cepat terhadap alat-alat milik perusahaan diperlukan.
Pengaturan sistem ini memerlukan perangkat keras khusus seperti GPU NVIDIA dan RAM sistem, serta akses ke perangkat lunak seperti Python dan CUDA. Komponen intinya meliputi alat CLI LangGraph, NeMo Gym untuk lingkungan pelatihan RL, Unsloth untuk pembelajaran penguatan (reinforcement learning), dan NeMo Data Designer untuk pembuatan data sintetis. Model dasar yang digunakan adalah Nemotron-Nano-9B-V2, yang tersedia dari Hugging Face. Instruksi instalasi dan penggunaan yang detail dapat ditemukan dalam dokumentasi yang tertaut. Pipeline pelatihan inovatif ini memungkinkan penerapan agen CLI khusus dan aman dengan cepat, memberikan solusi baru untuk otomatisasi alur kerja dan alat peningkatan produktivitas.
Bagikan artikel ini:
Tin tức mới nhất
L adalah B Yahagi Construction, pengembangan bot instruksi keselamatan AI.
19/1/26, 00.00
L is B (Chiyoda-ku, Tokyo) dan Yahagi Construction Industry (Kota Nagoya, Prefektur Aichi) telah mengembangkan "Bot Instruksi Keselamatan AI" yang meningkatkan instruksi keselamatan di lokasi konstruksi.
Hospitality Tech Menunjuk Kimpel ke Standar Jaringan Restoran
19/1/26, 00.00
Divisi teknologi perhotelan EnsembleIQ mengumumkan penunjukan Skip Kimpel sebagai Chief Standards and AI Officer untuk Restaurant Technology Network (RTN).
Capgemini Research Mengumumkan Pergeseran Strategi Integrasi AI
19/1/26, 00.00
Sebuah laporan baru dari Capgemini Research Institute mengungkapkan bahwa para pemimpin bisnis mengambil pendekatan yang lebih pragmatis terhadap strategi AI mereka
Copyright © 2024 Generatived - All right Reserved.
Bagikan artikel ini:
Bagikan artikel ini:
Kategori
Berita
AI dan hukum/peraturan/masyarakat
Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.
Berita terkini
L adalah B Yahagi Construction, pengembangan bot instruksi keselamatan AI.
19/1/26, 00.00
L is B (Chiyoda-ku, Tokyo) dan Yahagi Construction Industry (Kota Nagoya, Prefektur Aichi) telah mengembangkan "Bot Instruksi Keselamatan AI" yang meningkatkan instruksi keselamatan di lokasi konstruksi.
Hospitality Tech Menunjuk Kimpel ke Standar Jaringan Restoran
19/1/26, 00.00
Divisi teknologi perhotelan EnsembleIQ mengumumkan penunjukan Skip Kimpel sebagai Chief Standards and AI Officer untuk Restaurant Technology Network (RTN).
Capgemini Research Mengumumkan Pergeseran Strategi Integrasi AI
19/1/26, 00.00
Sebuah laporan baru dari Capgemini Research Institute mengungkapkan bahwa para pemimpin bisnis mengambil pendekatan yang lebih pragmatis terhadap strategi AI mereka


%20(1).webp)



