top of page
Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif
logo.png

NVIDIA Memperkenalkan DGX Cloud untuk Skalabilitas AI Global

Generatived

19/3/25, 04.30

NVIDIA mengumumkan DGX Cloud Serverless Inference, solusi inferensi AI baru yang menyederhanakan penerapan aplikasi di berbagai lingkungan. Didukung oleh NVIDIA Cloud Functions, platform ini mengelola beban kerja AI, komputasi berperforma tinggi, dan aplikasi yang dikontainerisasi dengan lancar. Cukup terapkan sekali dan skalakan secara global, sehingga menghilangkan kerumitan dalam menyiapkan infrastruktur multi-kluster.

Vendor perangkat lunak independen (ISV) sering menghadapi tantangan dalam penskalaan aplikasi AI secara global. Solusi inferensi AI tanpa server NVIDIA mengatasi tantangan ini dengan menyediakan metodologi penerapan yang konsisten yang mengabstraksikan kompleksitas infrastruktur di berbagai cloud dan pusat data, sehingga memudahkan ISV untuk menerapkan aplikasi di dekat infrastruktur pelanggan mereka.

Platform DGX Cloud Serverless Inference bertindak sebagai agregator horizontal, yang memungkinkan ISV untuk menggabungkan sumber daya dari berbagai sumber, termasuk NVIDIA, mitra cloud, cloud pribadi, dan kapasitas lokal. Fleksibilitas ini khususnya bermanfaat bagi ISV yang ingin memperluas kapasitas atau menjajaki penyedia cloud baru tanpa melakukan investasi jangka panjang.

Solusi NVIDIA memungkinkan pengembang untuk menskalakan beban kerja AI di seluruh lingkungan cloud menggunakan satu titik akhir API . Pendekatan ini memfasilitasi penyeimbangan beban global dan penskalaan otomatis, yang menyediakan fleksibilitas multi-cloud untuk berbagai beban kerja. Platform ini mendukung berbagai beban kerja yang dikontainerisasi, termasuk beban kerja AI, grafis, dan pekerjaan, serta kompatibel dengan rangkaian teknologi AI dan simulasi NVIDIA. ISV dapat memulai dengan DGX Cloud Serverless Inference dengan memanfaatkan kontainer dan cetak biru layanan mikro NVIDIA atau mengintegrasikan kontainer khusus untuk penerapan yang lebih kompleks.

Bagikan artikel ini:

Tin tức mới nhất
NVIDIA DFlash Meningkatkan Performa Inferensi AI Secara Signifikan

NVIDIA DFlash Meningkatkan Performa Inferensi AI Secara Signifikan

25/6/26, 00.00

NVIDIA mengumumkan DFlash, teknologi dekode spekulatif sumber terbuka yang dirancang untuk meningkatkan efisiensi inferensi model bahasa besar pada platform GPU modern.

NVIDIA BioNeMo Mendukung Penelitian Ilmiah Agentik

NVIDIA BioNeMo Mendukung Penelitian Ilmiah Agentik

25/6/26, 00.00

NVIDIA mengumumkan kemajuan dalam BioNeMo, sebuah platform yang dirancang untuk membantu agen AI melakukan penelitian biomolekuler melalui akses terstruktur

Walkers Meluncurkan Platform Komunitas Praktik AI Hakobune

Walkers Meluncurkan Platform Komunitas Praktik AI Hakobune

25/6/26, 00.00

Walkers mengumumkan peluncuran "Hakobune," sebuah komunitas yang dirancang untuk membantu para profesional bisnis menerapkan AI generatif pada aktivitas bisnis nyata melalui kolaborasi

NTT Business Solutions Meluncurkan Uji Coba Platform Data AI

NTT Business Solutions Meluncurkan Uji Coba Platform Data AI

25/6/26, 00.00

NTT Business Solutions mengumumkan uji coba yang menggabungkan platform integrasi datanya dengan kemampuan MCP dan LLM swasta Jepang "tsuzumi 2"

Copyright © 2024 Generatived - All right Reserved.

Bagikan artikel ini:

Bagikan artikel ini:

Generatived

Hãy theo dõi chúng tôi

  • Facebook
  • X

Bahasa

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Generatived AI Logo

Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.

  • Facebook
  • X

Ikuti kami

Bahasa

Berita terkini
NVIDIA DFlash Meningkatkan Performa Inferensi AI Secara Signifikan

NVIDIA DFlash Meningkatkan Performa Inferensi AI Secara Signifikan

25/6/26, 00.00

NVIDIA mengumumkan DFlash, teknologi dekode spekulatif sumber terbuka yang dirancang untuk meningkatkan efisiensi inferensi model bahasa besar pada platform GPU modern.

NVIDIA BioNeMo Mendukung Penelitian Ilmiah Agentik

NVIDIA BioNeMo Mendukung Penelitian Ilmiah Agentik

25/6/26, 00.00

NVIDIA mengumumkan kemajuan dalam BioNeMo, sebuah platform yang dirancang untuk membantu agen AI melakukan penelitian biomolekuler melalui akses terstruktur

Walkers Meluncurkan Platform Komunitas Praktik AI Hakobune

Walkers Meluncurkan Platform Komunitas Praktik AI Hakobune

25/6/26, 00.00

Walkers mengumumkan peluncuran "Hakobune," sebuah komunitas yang dirancang untuk membantu para profesional bisnis menerapkan AI generatif pada aktivitas bisnis nyata melalui kolaborasi

NTT Business Solutions Meluncurkan Uji Coba Platform Data AI

NTT Business Solutions Meluncurkan Uji Coba Platform Data AI

25/6/26, 00.00

NTT Business Solutions mengumumkan uji coba yang menggabungkan platform integrasi datanya dengan kemampuan MCP dan LLM swasta Jepang "tsuzumi 2"

bottom of page