Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif
%20(1).webp)
Deteksi Orang yang Tertinggal Secara Otomatis di Google Cloud
Generatived
1/9/25, 00.00
Sistem yang tertinggal menjadi tantangan bagi para pengembang yang menangani beban kerja pembelajaran mesin (ML) skala besar. Seiring sistem tumbuh lebih besar dan lebih bertenaga, masalah dengan komponen kecil memengaruhi kinerja secara keseluruhan. Kelas superkomputer baru dibutuhkan untuk melatih model skala besar generasi berikutnya.
Kegagalan dapat dibagi menjadi dua jenis: "fail-stop" dan "fail-throw". Fail-stop menyebabkan komponen crash, sementara fail-throw hanya memperlambat sistem. Node yang berkinerja buruk memengaruhi keseluruhan sistem, sehingga memperpanjang waktu pelatihan.
Untuk meningkatkan keandalan, penting untuk meningkatkan waktu rata-rata antar gangguan (MTBI) dan mengurangi waktu rata-rata pemulihan (MTTR). Proses pemulihan dapat dibagi menjadi empat tahap: deteksi masalah, identifikasi, konfigurasi ulang sistem, dan analisis akar penyebab.
Google Cloud telah memperkenalkan metode untuk mendeteksi akselerator yang tertinggal secara otomatis. Dalam pelatihan terdistribusi skala besar, semua akselerator beroperasi secara sinkron, dan jika satu akselerator tertinggal, akselerator lain akan menganggur. Keterlambatan ini dapat disebabkan oleh berbagai masalah, termasuk kegagalan perangkat keras dan bug perangkat lunak.
Mengidentifikasi penyebab perlambatan memang sulit, tetapi pendekatan Google didasarkan pada analisis kausal. Sistem dipahami sebagai grafik yang saling terhubung dan klaster GPU dipantau secara pasif. Sistem ini bekerja dalam dua langkah: membangun grafik komunikasi dan mengidentifikasi penyebab perlambatan.
Pendekatan otomatis ini mengurangi cakupan pencarian dari ribuan node menjadi hanya beberapa node, sehingga mempersingkat waktu pencarian dari hitungan hari menjadi hitungan menit. Jika terjadi penundaan, layanan akan menandainya dan mengambil tindakan yang tepat.
Magic bermitra dengan Google untuk mengembangkan Frontier LLM. Sebelum algoritma deteksi straggler otomatis diperkenalkan, pemecahan masalah manual diperlukan. Kini, deteksi straggler diaktifkan secara default. Ai2 juga dilatih di Google Cloud, sehingga meningkatkan produktivitas riset.
Bagikan artikel ini:
Tin tức mới nhất
Google Tech meluncurkan Gemini untuk memperkuat keamanan AI di tempat
1/9/25, 00.00
Google Distributed Cloud (GDC) baru-baru ini membuat gebrakan besar dengan pengumuman peluncuran Gemini di GDC.
GeminiTech Merilis Model Teks-Gambar Terpadu Baru
1/9/25, 00.00
Gemini 2.5 Flash Image memperkenalkan model baru yang mengintegrasikan pemrosesan teks dan gambar secara mulus dalam satu langkah.
Realtime Tech Mengumumkan Model Ucapan gpt-realtime yang Disempurnakan
1/9/25, 00.00
Kemajuan terbaru dalam teknologi ucapan terbukti dengan dirilisnya model sintesis ucapan yang disempurnakan, gpt-realtime, dan penyempurnaan pada Realtime API.
Copyright © 2024 Generatived - All right Reserved.
Bagikan artikel ini:
Bagikan artikel ini:
Kategori
Berita
AI dan hukum/peraturan/masyarakat
Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.
Berita terkini
Google Tech meluncurkan Gemini untuk memperkuat keamanan AI di tempat
1/9/25, 00.00
Google Distributed Cloud (GDC) baru-baru ini membuat gebrakan besar dengan pengumuman peluncuran Gemini di GDC.
GeminiTech Merilis Model Teks-Gambar Terpadu Baru
1/9/25, 00.00
Gemini 2.5 Flash Image memperkenalkan model baru yang mengintegrasikan pemrosesan teks dan gambar secara mulus dalam satu langkah.
Realtime Tech Mengumumkan Model Ucapan gpt-realtime yang Disempurnakan
1/9/25, 00.00
Kemajuan terbaru dalam teknologi ucapan terbukti dengan dirilisnya model sintesis ucapan yang disempurnakan, gpt-realtime, dan penyempurnaan pada Realtime API.