top of page

Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

logo.png

NVIDIA công bố GPU Spark không máy chủ trên Azure

Generatived

0:00 25/7/25

Quá trình chuyển đổi văn bản thành dữ liệu số (nhúng) đóng vai trò then chốt trong hoạt động của Trí tuệ Generative AI. Các công nghệ như tìm kiếm ngữ nghĩa và hệ thống đề xuất dựa vào nhúng để giúp các mô hình ngôn ngữ quy mô lớn (LLM) và các mô hình AI khác hiểu dữ liệu. Apache Spark được sử dụng rộng rãi để phân bổ các tác vụ xử lý dữ liệu trên nhiều cụm nhằm xử lý việc tạo nhúng quy mô lớn. Tuy nhiên, độ phức tạp về mặt tính toán của việc tạo nhúng đòi hỏi phải tăng tốc tính toán, khiến việc quản lý cơ sở hạ tầng GPU trở nên phức tạp.

Trong bản demo gần đây, chúng tôi đã trình bày cách giải quyết những thách thức này bằng cách triển khai ứng dụng Spark phân tán trên Azure Container Apps (ACA) với GPU không máy chủ. Cấu hình này cho phép Spark quản lý các tập dữ liệu lớn, trong khi ACA đơn giản hóa sự phức tạp của việc quản lý tính toán và mở rộng quy mô. Trong bản demo, chúng tôi đã tạo ra các container worker chuyên dụng tích hợp các thư viện hiệu suất cao như NVIDIA RAPIDS Accelerator cho Spark và mô hình mã nguồn mở Hugging Face để cung cấp một giải pháp có khả năng mở rộng.

Kết quả là một nền tảng không máy chủ, trả tiền theo nhu cầu sử dụng, mang lại thông lượng cao và latency thấp cho các ứng dụng AI và xử lý dữ liệu. Phương pháp này đóng vai trò là một khuôn mẫu linh hoạt, có thể dễ dàng điều chỉnh theo các nhu cầu khác nhau. Đối với các doanh nghiệp đang tìm kiếm hiệu suất và hỗ trợ tốt nhất, kiến trúc có thể được cải thiện bằng cách tích hợp các dịch vụ vi mô NVIDIA NIM thay vì các worker được xây dựng riêng.

Giải pháp có kiến trúc đơn giản nhưng hiệu quả, bao gồm hai ứng dụng container không máy chủ chính trong môi trường Azure Container Apps: ứng dụng điều khiển front-end Apache Spark điều phối khối lượng công việc và tiếp nhận các yêu cầu công việc, trong khi ứng dụng worker Spark được tăng tốc bằng GPU chịu trách nhiệm xử lý dữ liệu. Lớp lưu trữ dữ liệu dùng chung sử dụng Azure Files tạo điều kiện thuận lợi cho việc chia sẻ mã, mô hình và dữ liệu giữa Azure và các worker, giúp đơn giản hóa quá trình phát triển và triển khai.

Để triển khai giải pháp này, bạn cần đăng ký Azure , một phiên bản SQL Server với dữ liệu văn bản và kiến thức về Azure Container Apps, Apache Spark, Docker và Python. GitHubGitHubAzure-Serverless-GPU-Embedding cung cấp mã mẫu để bạn bắt đầu. Quy trình triển khai bao gồm thiết lập ứng dụng bộ điều khiển Spark, triển khai ứng dụng Spark worker được tăng tốc bằng GPU và chạy các tác vụ nhúng văn bản phân tán. Các tác vụ này có thể được chạy bằng Jupyter ở chế độ phát triển hoặc với trình kích hoạt HTTP ở chế độ sản xuất.

Việc tận dụng các ứng dụng Apache Spark được tăng tốc bằng GPU tùy chỉnh trên GPU không máy chủ trong Azure Container Apps cho phép các tổ chức xây dựng các giải pháp xử lý dữ liệu phân tán hiệu quả, có khả năng mở rộng và tiết kiệm chi phí mà không cần phải quản lý cơ sở hạ tầng. Mô hình không máy chủ này cho phép mở rộng tài nguyên GPU một cách linh hoạt để đáp ứng nhu cầu của khối lượng công việc AI. Tính linh hoạt trong việc chuyển đổi từ môi trường phát triển dựa trên Jupyter sang các hệ thống sẵn sàng cho môi trường production trong cùng một khuôn khổ giúp dễ dàng chuyển các tác vụ dữ liệu khó khăn sang production. Để nâng cao hiệu suất và hỗ trợ, các dịch vụ vi mô NVIDIA NIM cũng có thể được tích hợp vào kiến trúc. Các bên quan tâm có thể truy cập mã trong kho lưu trữ GitHub NVIDIA/GenerativeAIExamples và tìm hiểu thêm trong hướng dẫn demo ""Bảo mật ứng dụng AI thế hệ tiếp theo với GPU không máy chủ trong Azure Container Apps"".

Chia sẻ bài viết này:

Tin tức mới nhất
Hội thảo xe điện Stockmark: Tập trung vào chất bán dẫn thế hệ tiếp theo

Hội thảo xe điện Stockmark: Tập trung vào chất bán dẫn thế hệ tiếp theo

0:00 17/2/26

Công ty Stockmark (Minato-ku, Tokyo) sẽ tổ chức hội thảo trực tuyến vào ngày 19 tháng 2 với chủ đề "Công nghệ điện tử công suất tiên tiến thúc đẩy sự phát triển của xe điện

Phiên thảo luận về vấn đề AI của Librex bắt đầu.

Phiên thảo luận về vấn đề AI của Librex bắt đầu.

0:00 17/2/26

Librex (quận Shibuya, Tokyo) sẽ tổ chức "Phiên tư vấn AI" trên cộng đồng AI "b-Crew" của mình.

Cuộc thi Hackathon AI của Kansai Electric Power được tổ chức phối hợp với VOLTMIND.

Cuộc thi Hackathon AI của Kansai Electric Power được tổ chức phối hợp với VOLTMIND.

0:00 17/2/26

VOLTMIND (Thành phố Osaka) sẽ tham gia với tư cách đối tác trong cuộc thi "Kansai Electric Power KOI x VOLTMIND Generative AI Hackathon" do Kansai Electric Power tổ chức.

TIMEWELL: Tiếp tục hỗ trợ sự phát triển của các doanh nhân trẻ.

TIMEWELL: Tiếp tục hỗ trợ sự phát triển của các doanh nhân trẻ.

0:00 17/2/26

TIMEWELL (Yokohama, tỉnh Kanagawa) đã được chọn làm đơn vị mở rộng cho dự án "TOKYO SUTEAM" của Tokyo.

Copyright © 2024 Generatived - All right Reserved.

Chia sẻ bài viết này:

Chia sẻ bài viết này:

Generatived AI Logo

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

  • Facebook
  • X

Hãy theo dõi chúng tôi

Ngôn ngữ

Tin tức mới nhất
Hội thảo xe điện Stockmark: Tập trung vào chất bán dẫn thế hệ tiếp theo

Hội thảo xe điện Stockmark: Tập trung vào chất bán dẫn thế hệ tiếp theo

0:00 17/2/26

Công ty Stockmark (Minato-ku, Tokyo) sẽ tổ chức hội thảo trực tuyến vào ngày 19 tháng 2 với chủ đề "Công nghệ điện tử công suất tiên tiến thúc đẩy sự phát triển của xe điện

Phiên thảo luận về vấn đề AI của Librex bắt đầu.

Phiên thảo luận về vấn đề AI của Librex bắt đầu.

0:00 17/2/26

Librex (quận Shibuya, Tokyo) sẽ tổ chức "Phiên tư vấn AI" trên cộng đồng AI "b-Crew" của mình.

Cuộc thi Hackathon AI của Kansai Electric Power được tổ chức phối hợp với VOLTMIND.

Cuộc thi Hackathon AI của Kansai Electric Power được tổ chức phối hợp với VOLTMIND.

0:00 17/2/26

VOLTMIND (Thành phố Osaka) sẽ tham gia với tư cách đối tác trong cuộc thi "Kansai Electric Power KOI x VOLTMIND Generative AI Hackathon" do Kansai Electric Power tổ chức.

TIMEWELL: Tiếp tục hỗ trợ sự phát triển của các doanh nhân trẻ.

TIMEWELL: Tiếp tục hỗ trợ sự phát triển của các doanh nhân trẻ.

0:00 17/2/26

TIMEWELL (Yokohama, tỉnh Kanagawa) đã được chọn làm đơn vị mở rộng cho dự án "TOKYO SUTEAM" của Tokyo.

bottom of page