Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

AWS tích hợp NVIDIA NIM để hỗ trợ các dịch vụ AI

Generatived

4:30 5/12/24

Amazon Web Services mở rộng quan hệ đối tác với NVIDIA để tích hợp các vi dịch vụ NVIDIA NIM vào các dịch vụ AI nhằm hỗ trợ khả năng suy luận AI và giảm độ trễ cho các ứng dụng AI tổng hợp. Động thái này được công bố tại hội nghị AWS re:Invent nhằm mục đích hợp lý hóa việc triển khai các mô hình AI và cung cấp các giải pháp suy luận được tối ưu hóa cho NVIDIA cho các nhà phát triển thông qua AWS Marketplace, Amazon Bedrock Marketplace và Amazon SageMaker JumpStart.

Các dịch vụ vi mô NIM của NVIDIA, một thành phần của bộ phần mềm NVIDIA AI Enterprise, được thiết kế để tạo điều kiện thuận lợi cho việc triển khai suy luận mô hình AI đáng tin cậy, hiệu suất cao. Tận dụng các công cụ mạnh mẽ như NVIDIA Triton Inference Server và TensorRT, các dịch vụ này hiện có thể truy cập được trên AWS và hỗ trợ nhiều mô hình AI. Các nhà phát triển có thể tận dụng các dịch vụ này trên nhiều nền tảng AWS khác nhau, bao gồm EC2, EKS và SageMaker, đồng thời triển khai hơn 100 bộ chứa dựng sẵn từ danh mục API NVIDIA.

Sự sẵn có của các vi dịch vụ NIM trên AWS mang lại lợi ích cho khách hàng và đối tác trên nhiều lĩnh vực, cho phép họ triển khai các ứng dụng AI tổng hợp nhanh hơn trong khi vẫn duy trì tính bảo mật và giảm chi phí. Nhà cung cấp dịch vụ kỹ thuật số SoftServe đã phát triển nhiều giải pháp AI trên AWS, được tăng tốc bởi NVIDIA NIM. Các giải pháp này, dựa trên NVIDIA AI Blueprints, được thiết kế để tăng tốc độ phát triển ứng dụng AI và có sẵn trên AWS Marketplace.

Các nhà phát triển quan tâm đến việc sử dụng vi dịch vụ NVIDIA NIM có thể tùy chỉnh hoạt động triển khai trên AWS để đáp ứng nhu cầu cụ thể của họ. Nhận AI hiệu suất cao trên các dịch vụ AWS với quyền truy cập vào nhiều bộ chứa suy luận được NVIDIA tối ưu hóa. Để khám phá các mô hình có sẵn, nhà phát triển có thể truy cập Danh mục API NVIDIA và yêu cầu giấy phép dành cho nhà phát triển hoặc bản dùng thử phần mềm NVIDIA AI Enterprise.

Nguồn: Blog nhà phát triển NVIDIA

Chia sẻ bài viết này:

Tin tức mới nhất

NVIDIA cho phép lập lịch Slurm trên các cụm Kubernetes.

0:00 13/4/26

NVIDIA (California) đã mô tả một phương pháp để chạy Slurm trên Kubernetes bằng cách sử dụng Slinky slurm-operator.

đọc thêm

Microsoft phác thảo mô hình hoạt động an ninh mạng SOC dựa trên tác nhân

0:00 13/4/26

Microsoft (Washington) đã phác thảo mô hình “ SOC chủ động”, chuyển hoạt động bảo mật từ phản ứng thụ động sang dự đoán hành vi của kẻ tấn công và hạn chế các con đường tấn công.

đọc thêm

AI Data ra mắt nền tảng GovOffice AI.

0:00 13/4/26

Công ty AI Data (Tokyo) đã giới thiệu một nền tảng trí tuệ nhân tạo (AI) được thiết kế dành cho các cơ quan chính phủ

đọc thêm

Webetter ra mắt nền tảng AI doanh nghiệp TakoFlow.

0:00 13/4/26

Webetter (Tokyo) đã giới thiệu nền tảng thực thi AI doanh nghiệp có tên TakoFlow, nhằm mục đích cải thiện hiệu quả hoạt động và năng suất của tổ chức.

đọc thêm

Chia sẻ bài viết này:

Danh mục

Trình nâng cao hình ảnh AI

Trình tạo mã AI

Quản lý tác vụ AI

Không có mã/mã thấp

Trình tạo thiết kế đồ họa AI

Trình tạo minh họa/nghệ thuật AI

Tất cả công cụ

Tin tức

AI và luật/hệ thống/kinh tế/xã hội

Các công ty/sản phẩm/công nghệ AI

AI công nghệ lớn

OpenAI/ChatGPT

AI thế hệ sáng tạo

AI thế hệ dựa trên văn bản

AI sáng tạo của Nhật Bản

Cơ bản về AI sáng tạo

Hướng dẫn ứng dụng AI cơ bản

Hồ sơ công ty

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng trang web

Công ty điều hành

Hãy theo dõi chúng tôi

Ngôn ngữ

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Hãy theo dõi chúng tôi

Ngôn ngữ

Danh mục

Tất cả công cụ

Quản lý tác vụ AI

Trình tạo thiết kế đồ họa AI

Không có mã/mã thấp

Trình tạo mã AI

Trình nâng cao hình ảnh AI

Trình tạo minh họa/nghệ thuật AI

AI và luật/hệ thống/kinh tế/xã hội

Các công ty/sản phẩm/công nghệ AI

AI công nghệ lớn

OpenAI/ChatGPT

AI thế hệ sáng tạo

AI thế hệ dựa trên văn bản

AI sáng tạo của Nhật Bản

Cơ bản về AI tạo ra

Hướng dẫn ứng dụng AI cơ bản

Tin tức

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng của trang web

Công ty điều hành

Hồ sơ công ty

Tin tức mới nhất

NVIDIA cho phép lập lịch Slurm trên các cụm Kubernetes.

0:00 13/4/26

NVIDIA (California) đã mô tả một phương pháp để chạy Slurm trên Kubernetes bằng cách sử dụng Slinky slurm-operator.

đọc thêm

Microsoft phác thảo mô hình hoạt động an ninh mạng SOC dựa trên tác nhân

0:00 13/4/26

Microsoft (Washington) đã phác thảo mô hình “ SOC chủ động”, chuyển hoạt động bảo mật từ phản ứng thụ động sang dự đoán hành vi của kẻ tấn công và hạn chế các con đường tấn công.

đọc thêm

AI Data ra mắt nền tảng GovOffice AI.

0:00 13/4/26

Công ty AI Data (Tokyo) đã giới thiệu một nền tảng trí tuệ nhân tạo (AI) được thiết kế dành cho các cơ quan chính phủ

đọc thêm

Webetter ra mắt nền tảng AI doanh nghiệp TakoFlow.

0:00 13/4/26

Webetter (Tokyo) đã giới thiệu nền tảng thực thi AI doanh nghiệp có tên TakoFlow, nhằm mục đích cải thiện hiệu quả hoạt động và năng suất của tổ chức.

đọc thêm