top of page

Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

logo.png

NVIDIA công bố GPU Spark không máy chủ trên Azure

Generatived

0:00 25/7/25

Quá trình chuyển đổi văn bản thành dữ liệu số (nhúng) đóng vai trò then chốt trong hoạt động của Trí tuệ Generative AI. Các công nghệ như tìm kiếm ngữ nghĩa và hệ thống đề xuất dựa vào nhúng để giúp các mô hình ngôn ngữ quy mô lớn (LLM) và các mô hình AI khác hiểu dữ liệu. Apache Spark được sử dụng rộng rãi để phân bổ các tác vụ xử lý dữ liệu trên nhiều cụm nhằm xử lý việc tạo nhúng quy mô lớn. Tuy nhiên, độ phức tạp về mặt tính toán của việc tạo nhúng đòi hỏi phải tăng tốc tính toán, khiến việc quản lý cơ sở hạ tầng GPU trở nên phức tạp.

Trong bản demo gần đây, chúng tôi đã trình bày cách giải quyết những thách thức này bằng cách triển khai ứng dụng Spark phân tán trên Azure Container Apps (ACA) với GPU không máy chủ. Cấu hình này cho phép Spark quản lý các tập dữ liệu lớn, trong khi ACA đơn giản hóa sự phức tạp của việc quản lý tính toán và mở rộng quy mô. Trong bản demo, chúng tôi đã tạo ra các container worker chuyên dụng tích hợp các thư viện hiệu suất cao như NVIDIA RAPIDS Accelerator cho Spark và mô hình mã nguồn mở Hugging Face để cung cấp một giải pháp có khả năng mở rộng.

Kết quả là một nền tảng không máy chủ, trả tiền theo nhu cầu sử dụng, mang lại thông lượng cao và latency thấp cho các ứng dụng AI và xử lý dữ liệu. Phương pháp này đóng vai trò là một khuôn mẫu linh hoạt, có thể dễ dàng điều chỉnh theo các nhu cầu khác nhau. Đối với các doanh nghiệp đang tìm kiếm hiệu suất và hỗ trợ tốt nhất, kiến trúc có thể được cải thiện bằng cách tích hợp các dịch vụ vi mô NVIDIA NIM thay vì các worker được xây dựng riêng.

Giải pháp có kiến trúc đơn giản nhưng hiệu quả, bao gồm hai ứng dụng container không máy chủ chính trong môi trường Azure Container Apps: ứng dụng điều khiển front-end Apache Spark điều phối khối lượng công việc và tiếp nhận các yêu cầu công việc, trong khi ứng dụng worker Spark được tăng tốc bằng GPU chịu trách nhiệm xử lý dữ liệu. Lớp lưu trữ dữ liệu dùng chung sử dụng Azure Files tạo điều kiện thuận lợi cho việc chia sẻ mã, mô hình và dữ liệu giữa Azure và các worker, giúp đơn giản hóa quá trình phát triển và triển khai.

Để triển khai giải pháp này, bạn cần đăng ký Azure , một phiên bản SQL Server với dữ liệu văn bản và kiến thức về Azure Container Apps, Apache Spark, Docker và Python. GitHubGitHubAzure-Serverless-GPU-Embedding cung cấp mã mẫu để bạn bắt đầu. Quy trình triển khai bao gồm thiết lập ứng dụng bộ điều khiển Spark, triển khai ứng dụng Spark worker được tăng tốc bằng GPU và chạy các tác vụ nhúng văn bản phân tán. Các tác vụ này có thể được chạy bằng Jupyter ở chế độ phát triển hoặc với trình kích hoạt HTTP ở chế độ sản xuất.

Việc tận dụng các ứng dụng Apache Spark được tăng tốc bằng GPU tùy chỉnh trên GPU không máy chủ trong Azure Container Apps cho phép các tổ chức xây dựng các giải pháp xử lý dữ liệu phân tán hiệu quả, có khả năng mở rộng và tiết kiệm chi phí mà không cần phải quản lý cơ sở hạ tầng. Mô hình không máy chủ này cho phép mở rộng tài nguyên GPU một cách linh hoạt để đáp ứng nhu cầu của khối lượng công việc AI. Tính linh hoạt trong việc chuyển đổi từ môi trường phát triển dựa trên Jupyter sang các hệ thống sẵn sàng cho môi trường production trong cùng một khuôn khổ giúp dễ dàng chuyển các tác vụ dữ liệu khó khăn sang production. Để nâng cao hiệu suất và hỗ trợ, các dịch vụ vi mô NVIDIA NIM cũng có thể được tích hợp vào kiến trúc. Các bên quan tâm có thể truy cập mã trong kho lưu trữ GitHub NVIDIA/GenerativeAIExamples và tìm hiểu thêm trong hướng dẫn demo ""Bảo mật ứng dụng AI thế hệ tiếp theo với GPU không máy chủ trong Azure Container Apps"".

Chia sẻ bài viết này:

Tin tức mới nhất
Đã thêm các tính năng mới vào Rakuten LinkSurge

Đã thêm các tính năng mới vào Rakuten LinkSurge

0:00 17/2/26

LinkShare Japan, một thành viên của tập đoàn Rakuten, đã bổ sung chức năng bảng điều khiển vào LinkSurge, phần mềm được phát triển với sự hợp tác của Benji.

Hỗ trợ Avatar AI đám mây khách hàng

Hỗ trợ Avatar AI đám mây khách hàng

0:00 17/2/26

Công ty Customer Cloud (Shibuya-ku, Tokyo) đã ra mắt dịch vụ sử dụng trí tuệ Generative AI) và công nghệ avatar AI để hỗ trợ phát triển avatar kỹ thuật số cho các nghệ sĩ và người nổi tiếng.

Thí nghiệm trình diễn công nghệ sạc xe điện Verbex ENEOS bằng trí tuệ nhân tạo bắt đầu.

Thí nghiệm trình diễn công nghệ sạc xe điện Verbex ENEOS bằng trí tuệ nhân tạo bắt đầu.

0:00 17/2/26

Verbex đang hợp tác với ENEOS Holdings và ENEOS để triển khai dự án thí điểm nhằm cải thiện chất lượng dịch vụ khách hàng cho dịch vụ sạc xe điện.

CyberAgent đã thành công trong việc tối ưu hóa quá trình phát triển trí tuệ nhân tạo.

CyberAgent đã thành công trong việc tối ưu hóa quá trình phát triển trí tuệ nhân tạo.

0:00 17/2/26

Công ty CyberAgent (Tokyo) đã triển khai thành công quy trình phát triển dựa trên trí tuệ nhân tạo (AI), góp phần nâng cao năng suất của các kỹ sư.

Copyright © 2024 Generatived - All right Reserved.

Chia sẻ bài viết này:

Chia sẻ bài viết này:

Generatived AI Logo

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

  • Facebook
  • X

Hãy theo dõi chúng tôi

Ngôn ngữ

Tin tức mới nhất
Đã thêm các tính năng mới vào Rakuten LinkSurge

Đã thêm các tính năng mới vào Rakuten LinkSurge

0:00 17/2/26

LinkShare Japan, một thành viên của tập đoàn Rakuten, đã bổ sung chức năng bảng điều khiển vào LinkSurge, phần mềm được phát triển với sự hợp tác của Benji.

Hỗ trợ Avatar AI đám mây khách hàng

Hỗ trợ Avatar AI đám mây khách hàng

0:00 17/2/26

Công ty Customer Cloud (Shibuya-ku, Tokyo) đã ra mắt dịch vụ sử dụng trí tuệ Generative AI) và công nghệ avatar AI để hỗ trợ phát triển avatar kỹ thuật số cho các nghệ sĩ và người nổi tiếng.

Thí nghiệm trình diễn công nghệ sạc xe điện Verbex ENEOS bằng trí tuệ nhân tạo bắt đầu.

Thí nghiệm trình diễn công nghệ sạc xe điện Verbex ENEOS bằng trí tuệ nhân tạo bắt đầu.

0:00 17/2/26

Verbex đang hợp tác với ENEOS Holdings và ENEOS để triển khai dự án thí điểm nhằm cải thiện chất lượng dịch vụ khách hàng cho dịch vụ sạc xe điện.

CyberAgent đã thành công trong việc tối ưu hóa quá trình phát triển trí tuệ nhân tạo.

CyberAgent đã thành công trong việc tối ưu hóa quá trình phát triển trí tuệ nhân tạo.

0:00 17/2/26

Công ty CyberAgent (Tokyo) đã triển khai thành công quy trình phát triển dựa trên trí tuệ nhân tạo (AI), góp phần nâng cao năng suất của các kỹ sư.

bottom of page