Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif

Bantuan Pembelajaran Penguatan Model Bahasa Google Cloud
Generatived
18/11/25, 00.00
Google Cloud (AS) menawarkan pendekatan terintegrasi tumpukan penuh untuk mengatasi tantangan infrastruktur pembelajaran penguatan (RL) bagi model bahasa skala besar (LLM). Dalam sebuah postingan blog, perusahaan tersebut merinci bagaimana mereka memenuhi tuntutan RL skala besar, mulai dari perangkat keras TPU kustom hingga lapisan orkestrasi GKE.
RL adalah siklus umpan balik yang menggabungkan pelatihan dan inferensi, di mana "model penghargaan" memberikan skor pada jawaban yang dihasilkan oleh LLM, dan algoritma RL memperbarui parameternya. Google Cloud menyediakan opsi komputasi yang fleksibel dengan TPU dan GPU, optimasi tumpukan penuh, kepemimpinan sumber terbuka, dan orkestrasi skala besar untuk mendukung proses ini.
Pendekatan Google Cloud mencakup akselerator TPU khusus, penyimpanan throughput tinggi, dan orkestrasi GKE, yang memungkinkan latency sistem terendah untuk beban kerja RL, dan integrasi dengan alat sumber terbuka memungkinkan pelanggan memilih alat terbaik untuk pekerjaan tersebut.
Megakluster AI GKE mendukung hingga 65.000 node, dan Google berinvestasi dalam solusi multi-kluster untuk meningkatkan skala beban kerja RL. Infrastruktur GKE sangat ideal untuk beban kerja RL dan menawarkan efisiensi. Membangun alur kerja RL memerlukan identifikasi kasus penggunaan yang jelas, pemilihan algoritma, penyediaan kluster GKE, dan penerapan Ray sebagai orkestrator.
Bagikan artikel ini:
Tin tức mới nhất
Microsoft Membagikan Praktik Peninjauan Risiko Perusahaan
1/5/26, 00.00
Microsoft(米ワシントン州レドモンド)は、副CISOのRico Mariani氏によるブログで、AI時代におけるサイバー脅威の拡大を背景に、企業向けのリスクレビュー手法を解説したと発表した。
NVIDIA Memperluas Panduan Arsitektur Pabrik AI Perusahaan
1/5/26, 00.00
NVIDIA merinci Arsitektur Referensi Perusahaan dan konfigurasi pabrik AI yang dirancang untuk mendukung penerapan sistem AI agen
OpenAI Memperluas Infrastruktur AI Stargate di Seluruh Negeri
1/5/26, 00.00
OpenAI menyatakan telah mempercepat pengembangan inisiatif infrastruktur AI "Stargate" miliknya, melampaui target penyebaran komputasi jangka panjang lebih awal dari
Copyright © 2024 Generatived - All right Reserved.
Bagikan artikel ini:
Bagikan artikel ini:
Kategori
Berita
AI dan hukum/peraturan/masyarakat
Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.
Berita terkini
Microsoft Membagikan Praktik Peninjauan Risiko Perusahaan
1/5/26, 00.00
Microsoft(米ワシントン州レドモンド)は、副CISOのRico Mariani氏によるブログで、AI時代におけるサイバー脅威の拡大を背景に、企業向けのリスクレビュー手法を解説したと発表した。
NVIDIA Memperluas Panduan Arsitektur Pabrik AI Perusahaan
1/5/26, 00.00
NVIDIA merinci Arsitektur Referensi Perusahaan dan konfigurasi pabrik AI yang dirancang untuk mendukung penerapan sistem AI agen
OpenAI Memperluas Infrastruktur AI Stargate di Seluruh Negeri
1/5/26, 00.00
OpenAI menyatakan telah mempercepat pengembangan inisiatif infrastruktur AI "Stargate" miliknya, melampaui target penyebaran komputasi jangka panjang lebih awal dari

%20(1).webp)
%20(1).webp)
%20(1).webp)
%20(1).webp)

