Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

AWS tích hợp NVIDIA NIM để hỗ trợ các dịch vụ AI
Generatived
4:30 5/12/24
Amazon Web Services mở rộng quan hệ đối tác với NVIDIA để tích hợp các vi dịch vụ NVIDIA NIM vào các dịch vụ AI nhằm hỗ trợ khả năng suy luận AI và giảm độ trễ cho các ứng dụng AI tổng hợp. Động thái này được công bố tại hội nghị AWS re:Invent nhằm mục đích hợp lý hóa việc triển khai các mô hình AI và cung cấp các giải pháp suy luận được tối ưu hóa cho NVIDIA cho các nhà phát triển thông qua AWS Marketplace, Amazon Bedrock Marketplace và Amazon SageMaker JumpStart.
Các dịch vụ vi mô NIM của NVIDIA, một thành phần của bộ phần mềm NVIDIA AI Enterprise, được thiết kế để tạo điều kiện thuận lợi cho việc triển khai suy luận mô hình AI đáng tin cậy, hiệu suất cao. Tận dụng các công cụ mạnh mẽ như NVIDIA Triton Inference Server và TensorRT, các dịch vụ này hiện có thể truy cập được trên AWS và hỗ trợ nhiều mô hình AI. Các nhà phát triển có thể tận dụng các dịch vụ này trên nhiều nền tảng AWS khác nhau, bao gồm EC2, EKS và SageMaker, đồng thời triển khai hơn 100 bộ chứa dựng sẵn từ danh mục API NVIDIA.
Sự sẵn có của các vi dịch vụ NIM trên AWS mang lại lợi ích cho khách hàng và đối tác trên nhiều lĩnh vực, cho phép họ triển khai các ứng dụng AI tổng hợp nhanh hơn trong khi vẫn duy trì tính bảo mật và giảm chi phí. Nhà cung cấp dịch vụ kỹ thuật số SoftServe đã phát triển nhiều giải pháp AI trên AWS, được tăng tốc bởi NVIDIA NIM. Các giải pháp này, dựa trên NVIDIA AI Blueprints, được thiết kế để tăng tốc độ phát triển ứng dụng AI và có sẵn trên AWS Marketplace.
Các nhà phát triển quan tâm đến việc sử dụng vi dịch vụ NVIDIA NIM có thể tùy chỉnh hoạt động triển khai trên AWS để đáp ứng nhu cầu cụ thể của họ. Nhận AI hiệu suất cao trên các dịch vụ AWS với quyền truy cập vào nhiều bộ chứa suy luận được NVIDIA tối ưu hóa. Để khám phá các mô hình có sẵn, nhà phát triển có thể truy cập Danh mục API NVIDIA và yêu cầu giấy phép dành cho nhà phát triển hoặc bản dùng thử phần mềm NVIDIA AI Enterprise.
Chia sẻ bài viết này:
Tin tức mới nhất
DataX bổ sung chức năng tối ưu hóa tự động cho thử nghiệm AB
4:30 21/3/25
Data X (Shinjuku, Tokyo) đã thêm chức năng "tối ưu hóa tự động thử nghiệm AB" vào nền tảng tiếp thị dữ liệu "b→dash".
Hệ thống chẩn đoán bảo hiểm AI WDC OEM bắt đầu
4:30 21/3/25
WDC (Thành phố Funabashi, Tỉnh Chiba) đã bắt đầu cung cấp hệ thống chẩn đoán bảo hiểm dựa trên AI "Riaho" theo hình thức OEM.
Nền tảng quản lý tích hợp sở hữu trí tuệ dữ liệu AI
4:30 21/3/25
AI Data (Minato-ku, Tokyo) đã bắt đầu cung cấp "IDX x AI Kongming™ x Tokkyo.Ai", một nền tảng cho phép quản lý tích hợp dữ liệu nghiên cứu và sở hữu trí tuệ cho các phòng
Copyright © 2024 Generatived - All right Reserved.
Chia sẻ bài viết này:
Chia sẻ bài viết này:
Danh mục
Tin tức
AI và luật/hệ thống/kinh tế/xã hội
Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.
Tin tức mới nhất
DataX bổ sung chức năng tối ưu hóa tự động cho thử nghiệm AB
4:30 21/3/25
Data X (Shinjuku, Tokyo) đã thêm chức năng "tối ưu hóa tự động thử nghiệm AB" vào nền tảng tiếp thị dữ liệu "b→dash".
Hệ thống chẩn đoán bảo hiểm AI WDC OEM bắt đầu
4:30 21/3/25
WDC (Thành phố Funabashi, Tỉnh Chiba) đã bắt đầu cung cấp hệ thống chẩn đoán bảo hiểm dựa trên AI "Riaho" theo hình thức OEM.
Nền tảng quản lý tích hợp sở hữu trí tuệ dữ liệu AI
4:30 21/3/25
AI Data (Minato-ku, Tokyo) đã bắt đầu cung cấp "IDX x AI Kongming™ x Tokkyo.Ai", một nền tảng cho phép quản lý tích hợp dữ liệu nghiên cứu và sở hữu trí tuệ cho các phòng