top of page
Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif
logo.png

Perkembangan baru dalam infrastruktur AI Google dan kinerja ultra-tinggi

Generatived

28/1/25, 04.30

Google(Tokyo) mengumumkan kemajuan terbaru dalam infrastruktur AI-nya, termasuk peluncuran TPU "Trillium" generasi ke-6, peluncuran "A3 Ultra VM" dengan GPU NVIDIA H200, dan dukungan hingga 65.000 node pada Google Kubernetes Engine (GKE). Selain itu, "Parallelstore" menyediakan layanan sistem file terdistribusi untuk beban kerja HPC dan AI.

AI Hypercomputer merupakan pendekatan tingkat sistem yang didasarkan pada pengalaman Google selama puluhan tahun, yang menggabungkan perangkat keras yang dioptimalkan dengan perangkat lunak terbuka, kerangka kerja, dan model konsumsi yang fleksibel. Saat membangun solusi AI di Google Cloud, Anda dapat memilih komponen infrastruktur khusus Anda sendiri.

VM A3 Ultra menggunakan GPU NVIDIA Hopper, dengan bandwidth jaringan GPU-ke-GPU dan HBM dua kali lipat. VM ini menggabungkan adaptor jaringan Titanium ML dengan NIC NVIDIA ConnectX-7 untuk bekerja dengan jaringan pusat data Google guna menghadirkan komunikasi hingga 3,2 Tbps antar GPU. VM ini juga tersedia melalui GKE, yang berguna untuk melatih dan melayani beban kerja AI.

Hypercompute Cluster adalah platform layanan superkomputer pada AI Hypercomputer yang dapat menerapkan dan mengelola beberapa akselerator sebagai satu unit. Platform ini dilengkapi jaringan latency sangat rendah, konfigurasi target, dan manajemen pemeliharaan tingkat lanjut untuk membantu mencapai sasaran throughput dan ketahanan. LG AI Research menggunakan infrastruktur ini untuk memajukan inisiatif AI-nya.

Google Cloud TPU telah membuat langkah besar dalam inferensi AI, dengan Trillium TPU yang mencapai throughput inferensi hingga 3x lebih tinggi dibandingkan dengan TPU v5e generasi sebelumnya. Beberapa opsi penyajian tersedia tergantung pada kebutuhan pengguna, termasuk Vertex AI, JetStream, MaxDiffusion, Optimum TPU, dan Hugging Face TGI. Google Colab kini mendukung Cloud TPU (TPU v5e), yang memungkinkan lebih banyak pengguna untuk mencoba TPU.

Google Cloud terus mendorong batasan infrastruktur AI dengan AI Hypercomputer-nya, dan tujuan Google adalah memanfaatkan kemampuan baru untuk memberikan kinerja, efisiensi, dan kemudahan penggunaan guna mempercepat perjalanan AI Anda.

Bagikan artikel ini:

Tin tức mới nhất
Givery menambahkan fitur interaktif ke wawancara AI

Givery menambahkan fitur interaktif ke wawancara AI

23/4/26, 00.00

Givery mengumumkan bahwa alat wawancara AI-nya, "Track AI Interview," kini menyertakan fitur interaktif yang dirancang

Cadence memperluas kemitraan dengan NVIDIA untuk sistem AI.

Cadence memperluas kemitraan dengan NVIDIA untuk sistem AI.

23/4/26, 00.00

Cadence mengumumkan perluasan kemitraan strategis dengan NVIDIA untuk meningkatkan alur kerja rekayasa di seluruh desain semikonduktor dan pengembangan sistem AI

Peluncuran Chitose AI Chiko di seluruh fasilitas penitipan anak.

Peluncuran Chitose AI Chiko di seluruh fasilitas penitipan anak.

23/4/26, 00.00

Chitose mengumumkan peluncuran “AI Chiko-chan” di seluruh fasilitas penitipan anak mulai April 2026, dengan tujuan mendukung staf

Telecy memproduksi iklan kampanye AI Obrolan Berpengetahuan.

Telecy memproduksi iklan kampanye AI Obrolan Berpengetahuan.

23/4/26, 00.00

Telecy mengumumkan telah memproduksi kampanye iklan TV pertama untuk Knowleful Chat, layanan obrolan AI dari CLINKS, yang bertujuan

Copyright © 2024 Generatived - All right Reserved.

Bagikan artikel ini:

Bagikan artikel ini:

Generatived

Hãy theo dõi chúng tôi

  • Facebook
  • X

Bahasa

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Generatived AI Logo

Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.

  • Facebook
  • X

Ikuti kami

Bahasa

Berita terkini
Givery menambahkan fitur interaktif ke wawancara AI

Givery menambahkan fitur interaktif ke wawancara AI

23/4/26, 00.00

Givery mengumumkan bahwa alat wawancara AI-nya, "Track AI Interview," kini menyertakan fitur interaktif yang dirancang

Cadence memperluas kemitraan dengan NVIDIA untuk sistem AI.

Cadence memperluas kemitraan dengan NVIDIA untuk sistem AI.

23/4/26, 00.00

Cadence mengumumkan perluasan kemitraan strategis dengan NVIDIA untuk meningkatkan alur kerja rekayasa di seluruh desain semikonduktor dan pengembangan sistem AI

Peluncuran Chitose AI Chiko di seluruh fasilitas penitipan anak.

Peluncuran Chitose AI Chiko di seluruh fasilitas penitipan anak.

23/4/26, 00.00

Chitose mengumumkan peluncuran “AI Chiko-chan” di seluruh fasilitas penitipan anak mulai April 2026, dengan tujuan mendukung staf

Telecy memproduksi iklan kampanye AI Obrolan Berpengetahuan.

Telecy memproduksi iklan kampanye AI Obrolan Berpengetahuan.

23/4/26, 00.00

Telecy mengumumkan telah memproduksi kampanye iklan TV pertama untuk Knowleful Chat, layanan obrolan AI dari CLINKS, yang bertujuan

bottom of page