Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif

Google Cloud meluncurkan strategi pembelajaran penguatan yang dapat diskalakan
Generatived
12/11/25, 00.00
Seiring meningkatnya permintaan akan model bahasa (LLM) yang canggih dan berskala besar, integrasi pembelajaran penguatan (RL) menjadi penting untuk mengadaptasi model-model ini dengan preferensi manusia dan tugas-tugas kompleks. Namun, perusahaan menghadapi tantangan infrastruktur yang signifikan saat menskalakan RL untuk LLM. Tantangan ini meliputi pengelolaan perebutan memori antara beberapa model besar dan menyeimbangkan tuntutan fase inferensi latensi tinggi dan fase pelatihan throughput tinggi.
Google Cloud telah mengembangkan strategi komprehensif untuk memenuhi kebutuhan unik RL skala besar. Pendekatannya mencakup segalanya, mulai dari perangkat keras TPU kustom hingga kemampuan orkestrasi Google Kubernetes Engine (GKE). Dengan menawarkan opsi komputasi yang fleksibel, termasuk TPU dan GPU, serta mengoptimalkan seluruh tumpukan, mulai dari perangkat keras hingga orkestrasi, Google Cloud bertujuan untuk meminimalkan latency di seluruh sistem yang menghambat beban kerja RL hibrida.
Komitmen perusahaan terhadap kepemimpinan sumber terbuka terbukti dalam kontribusinya terhadap Kubernetes dan kemitraan dengan orkestrator seperti Ray. Perusahaan juga telah membuka sumber pustaka berkinerja tinggi, MaxText dan Tunix, untuk memfasilitasi integrasi alat yang paling sesuai untuk tugas-tugas pembelajaran penguatan. Lebih lanjut, megakluster AI GKE Google Cloud, yang mampu mendukung hingga 65.000 node, menunjukkan kemampuannya dalam mengelola sumber daya komputasi besar yang dibutuhkan untuk pembelajaran penguatan pasca-pelatihan.
Bagi perusahaan yang ingin menerapkan beban kerja RL, infrastruktur GKE Google Cloud yang sudah ada menawarkan solusi yang tangguh. Infrastruktur ini menyediakan dukungan perangkat keras yang diperlukan, termasuk CPU, GPU, dan TPU, serta memanfaatkan solusi penyimpanan berkinerja tinggi. Lapisan Kubernetes terkelola GKE menangani orkestrasi dan penjadwalan sumber daya berskala besar, sementara lapisan kerangka kerja terbukanya menyediakan lingkungan eksekusi yang aman dan terisolasi. Untuk membangun alur kerja RL, Anda harus terlebih dahulu menentukan kasus penggunaan yang jelas, memilih algoritme dan perangkat keras yang tepat, serta mengonfigurasi komponen yang diperlukan dalam kluster GKE Anda.
Bagikan artikel ini:
Tin tức mới nhất
Lokakarya Desain AI UX DAYS TOKYO
12/11/25, 00.00
UX DAYS TOKYO (Shinagawa-ku, Tokyo) akan menyelenggarakan lokakarya daring tentang desain AI, mengundang Vitaly Friedman dari Smashing Magazine, media desain web global.
Asosiasi Mode Future AI yang diselenggarakan oleh Authentic AI
12/11/25, 00.00
Authentic AI (Minato-ku, Tokyo) mengumumkan bahwa Kelompok Riset AI Masyarakat Bisnis Mode, yang dipimpin oleh perwakilan Toru Ueda, akan mengadakan acara pada tanggal 21 November 2025.
Layanan pencarian AI baru NTT Town Pages diluncurkan
12/11/25, 00.00
NTT Town Pages (Nakano-ku, Tokyo) mengumumkan akan mulai menawarkan layanan baru yang kompatibel dengan pencarian AI, "AI Search Countermeasure Pack," mulai 10 November 2025.
Copyright © 2024 Generatived - All right Reserved.
Bagikan artikel ini:
Bagikan artikel ini:
Kategori
Berita
AI dan hukum/peraturan/masyarakat
Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.
Berita terkini
Lokakarya Desain AI UX DAYS TOKYO
12/11/25, 00.00
UX DAYS TOKYO (Shinagawa-ku, Tokyo) akan menyelenggarakan lokakarya daring tentang desain AI, mengundang Vitaly Friedman dari Smashing Magazine, media desain web global.
Asosiasi Mode Future AI yang diselenggarakan oleh Authentic AI
12/11/25, 00.00
Authentic AI (Minato-ku, Tokyo) mengumumkan bahwa Kelompok Riset AI Masyarakat Bisnis Mode, yang dipimpin oleh perwakilan Toru Ueda, akan mengadakan acara pada tanggal 21 November 2025.
Layanan pencarian AI baru NTT Town Pages diluncurkan
12/11/25, 00.00
NTT Town Pages (Nakano-ku, Tokyo) mengumumkan akan mulai menawarkan layanan baru yang kompatibel dengan pencarian AI, "AI Search Countermeasure Pack," mulai 10 November 2025.




%20(1).webp)

