Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif
%20(1).webp)
Platform manajemen data berbasis AI meningkatkan skalabilitas.
Generatived
8/1/26, 00.00
Seiring dengan terus berkembangnya kecerdasan buatan (AI), organisasi menghadapi tantangan dalam meningkatkan skala infrastruktur AI mereka untuk mengakomodasi alur kerja yang semakin kompleks. Ketika model AI mencapai triliunan parameter dan jendela konteks meluas hingga jutaan token, permintaan akan solusi memori dan penyimpanan yang efisien berada pada titik tertinggi sepanjang masa. Agen AI membutuhkan memori jangka panjang untuk mempertahankan konteks di seluruh interaksi, yang secara tradisional dikelola oleh cache key-value (KV). Namun, seiring dengan meningkatnya kebutuhan akan kapasitas cache KV, tekanan pada hierarki memori yang ada juga meningkat.
Kebutuhan yang semakin besar untuk menyeimbangkan memori bandwidth tinggi GPU (HBM) dengan solusi penyimpanan tujuan umum menyebabkan peningkatan konsumsi daya dan biaya, serta pemanfaatan sumber daya GPU yang mahal secara kurang optimal. Untuk mengatasi masalah ini, platform baru yang dirancang untuk meningkatkan skalabilitas infrastruktur inferensi organisasi berbasis AI telah diperkenalkan. Platform ini merestrukturisasi infrastruktur AI menjadi pod komputasi yang berisi GPU, jaringan Ethernet, dan penyimpanan, yang berfungsi sebagai blok bangunan dasar dari pabrik AI.
Di dalam pod ini, infrastruktur penyimpanan khusus menangani kebutuhan unik inferensi gigascale, menyediakan lapisan memori konteks baru yang melengkapi penyimpanan jaringan tradisional. Lapisan ini dioptimalkan untuk konteks inferensi yang sensitif terhadap latensi dan dapat digunakan kembali, serta telah dipersiapkan untuk meningkatkan pemanfaatan GPU. Hasilnya adalah token per detik yang jauh lebih banyak dan efisiensi daya lima kali lebih besar dibandingkan dengan metode penyimpanan tradisional.
Pengenalan platform ini menandai pergeseran signifikan dalam cara pengelolaan data asli AI, dengan memprioritaskan efisiensi dan kinerja. Dengan menciptakan lapisan memori konteks khusus, platform ini memungkinkan penggunaan kembali cache KV yang efisien, mengurangi kebutuhan akan lapisan penyimpanan tujuan umum yang mahal dan boros daya. Inovasi ini memungkinkan organisasi untuk memenuhi tuntutan era agen, mencapai throughput yang lebih tinggi dan penggunaan kembali cache KV yang terukur sambil mengoptimalkan total biaya kepemilikan (TCO).
Bagikan artikel ini:
Tin tức mới nhất
Solusi Otomatisasi PDF Korporat Irwin&co
8/1/26, 00.00
Irwin&co (Shibuya-ku, Tokyo) telah merilis solusi untuk bisnis yang menggunakan "teknologi penataan PDF" yang memanfaatkan Generative AI.
Penayangan khusus film STARGAZER VR AI "Summer Triangle".
8/1/26, 00.00
STARGAZER VR (Kota Kashiwa) akan mengadakan pemutaran khusus film fitur "Summer Triangle," yang memanfaatkan sepenuhnya teknologi AI, di Amuse Kashiwa Crystal Hall pada tanggal 18 Februari 2026.
Acompany menyambut Tsubasa Takahashi untuk memperkuat keamanan AI.
8/1/26, 00.00
Acompany (Nagoya, Prefektur Aichi) telah menyambut Tsubasa Takahashi, seorang tokoh terkemuka di bidang keamanan dan privasi AI, sebagai peneliti utamanya.
Copyright © 2024 Generatived - All right Reserved.
Bagikan artikel ini:
Bagikan artikel ini:
Kategori
Berita
AI dan hukum/peraturan/masyarakat
Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.
Berita terkini
Solusi Otomatisasi PDF Korporat Irwin&co
8/1/26, 00.00
Irwin&co (Shibuya-ku, Tokyo) telah merilis solusi untuk bisnis yang menggunakan "teknologi penataan PDF" yang memanfaatkan Generative AI.
Penayangan khusus film STARGAZER VR AI "Summer Triangle".
8/1/26, 00.00
STARGAZER VR (Kota Kashiwa) akan mengadakan pemutaran khusus film fitur "Summer Triangle," yang memanfaatkan sepenuhnya teknologi AI, di Amuse Kashiwa Crystal Hall pada tanggal 18 Februari 2026.
Acompany menyambut Tsubasa Takahashi untuk memperkuat keamanan AI.
8/1/26, 00.00
Acompany (Nagoya, Prefektur Aichi) telah menyambut Tsubasa Takahashi, seorang tokoh terkemuka di bidang keamanan dan privasi AI, sebagai peneliti utamanya.



%20(1).webp)


