top of page
Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif
logo.png

AWS mengintegrasikan NVIDIA NIM untuk mendukung layanan AI

Generatived

5/12/24, 04.30

Amazon Web Services memperluas kemitraannya dengan NVIDIA untuk mengintegrasikan layanan mikro NVIDIA NIM ke dalam layanan AI guna mendukung inferensi AI dan mengurangi latensi untuk aplikasi AI generatif. Langkah ini, yang diumumkan pada konferensi AWS re:Invent, bertujuan untuk menyederhanakan penerapan model AI dan memberikan solusi inferensi yang dioptimalkan NVIDIA kepada pengembang melalui AWS Marketplace, Amazon Bedrock Marketplace, dan Amazon SageMaker JumpStart.

Layanan mikro NIM NVIDIA, yang merupakan komponen rangkaian perangkat lunak NVIDIA AI Enterprise, dirancang untuk memfasilitasi penerapan inferensi model AI yang berkinerja tinggi dan andal. Dengan memanfaatkan mesin tangguh seperti NVIDIA Triton Inference Server dan TensorRT, layanan ini saat ini dapat diakses di AWS dan mendukung berbagai model AI. Pengembang dapat memanfaatkan layanan ini di berbagai platform AWS, termasuk EC2, EKS, dan SageMaker, dan menerapkan lebih dari 100 kontainer siap pakai dari katalog API NVIDIA.

Ketersediaan layanan mikro NIM di AWS menguntungkan pelanggan dan mitra di berbagai sektor, memungkinkan mereka menjalankan aplikasi AI generatif dengan lebih cepat sekaligus menjaga keamanan dan mengurangi biaya. Penyedia layanan digital SoftServe telah mengembangkan beberapa solusi AI di AWS, yang dipercepat oleh NVIDIA NIM. Solusi ini, berdasarkan Cetak Biru NVIDIA AI, dirancang untuk mempercepat pengembangan aplikasi AI dan tersedia di AWS Marketplace.

Pengembang yang tertarik menggunakan layanan mikro NVIDIA NIM dapat menyesuaikan penerapannya di AWS untuk memenuhi kebutuhan spesifik mereka. Dapatkan AI berkinerja tinggi di seluruh layanan AWS dengan akses ke berbagai kontainer inferensi yang dioptimalkan NVIDIA. Untuk menjelajahi model yang tersedia, pengembang dapat mengunjungi Katalog API NVIDIA dan meminta lisensi pengembang atau uji coba perangkat lunak NVIDIA AI Enterprise.

Bagikan artikel ini:

Tin tức mới nhất
Memperluas platform AI khusus industri data AI

Memperluas platform AI khusus industri data AI

16/2/26, 00.00

AI Data (Minato-ku, Tokyo) telah mengumumkan perluasan platform AI khusus bisnisnya. Perusahaan akan memperkuat "AI Factory" yang menyediakan dukungan lintas industri

Peluncuran Layanan Dukungan Divisi Bisnis AIX Baru Bloom

Peluncuran Layanan Dukungan Divisi Bisnis AIX Baru Bloom

16/2/26, 00.00

Bloom (Chiyoda-ku, Tokyo) berfokus pada penggunaan AI untuk meningkatkan efisiensi bisnis dan menyediakan layanan dukungan AI kepada perusahaan.

Peningkatan Keamanan AI Digeon ENSOU

Peningkatan Keamanan AI Digeon ENSOU

16/2/26, 00.00

Digeon (Kobe, Prefektur Hyogo) telah menambahkan otentikasi masuk tunggal menggunakan akun Microsoft dan fungsi pembatasan alamat IP ke agen Generative AI

Peluncuran rekrutmen agen AI PeopleX

Peluncuran rekrutmen agen AI PeopleX

16/2/26, 00.00

PeopleX (Shinjuku-ku, Tokyo) telah meluncurkan layanan agen AI-nya, "PeopleX AI Copilot."

Copyright © 2024 Generatived - All right Reserved.

Bagikan artikel ini:

Bagikan artikel ini:

Generatived

Hãy theo dõi chúng tôi

  • Facebook
  • X

Bahasa

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Generatived AI Logo

Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.

  • Facebook
  • X

Ikuti kami

Bahasa

Berita terkini
Memperluas platform AI khusus industri data AI

Memperluas platform AI khusus industri data AI

16/2/26, 00.00

AI Data (Minato-ku, Tokyo) telah mengumumkan perluasan platform AI khusus bisnisnya. Perusahaan akan memperkuat "AI Factory" yang menyediakan dukungan lintas industri

Peluncuran Layanan Dukungan Divisi Bisnis AIX Baru Bloom

Peluncuran Layanan Dukungan Divisi Bisnis AIX Baru Bloom

16/2/26, 00.00

Bloom (Chiyoda-ku, Tokyo) berfokus pada penggunaan AI untuk meningkatkan efisiensi bisnis dan menyediakan layanan dukungan AI kepada perusahaan.

Peningkatan Keamanan AI Digeon ENSOU

Peningkatan Keamanan AI Digeon ENSOU

16/2/26, 00.00

Digeon (Kobe, Prefektur Hyogo) telah menambahkan otentikasi masuk tunggal menggunakan akun Microsoft dan fungsi pembatasan alamat IP ke agen Generative AI

Peluncuran rekrutmen agen AI PeopleX

Peluncuran rekrutmen agen AI PeopleX

16/2/26, 00.00

PeopleX (Shinjuku-ku, Tokyo) telah meluncurkan layanan agen AI-nya, "PeopleX AI Copilot."

bottom of page