Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

NVIDIA công bố GPU Spark không máy chủ trên Azure

Generatived

0:00 25/7/25

Quá trình chuyển đổi văn bản thành dữ liệu số (nhúng) đóng vai trò then chốt trong hoạt động của Trí tuệ Generative AI. Các công nghệ như tìm kiếm ngữ nghĩa và hệ thống đề xuất dựa vào nhúng để giúp các mô hình ngôn ngữ quy mô lớn (LLM) và các mô hình AI khác hiểu dữ liệu. Apache Spark được sử dụng rộng rãi để phân bổ các tác vụ xử lý dữ liệu trên nhiều cụm nhằm xử lý việc tạo nhúng quy mô lớn. Tuy nhiên, độ phức tạp về mặt tính toán của việc tạo nhúng đòi hỏi phải tăng tốc tính toán, khiến việc quản lý cơ sở hạ tầng GPU trở nên phức tạp.

Trong bản demo gần đây, chúng tôi đã trình bày cách giải quyết những thách thức này bằng cách triển khai ứng dụng Spark phân tán trên Azure Container Apps (ACA) với GPU không máy chủ. Cấu hình này cho phép Spark quản lý các tập dữ liệu lớn, trong khi ACA đơn giản hóa sự phức tạp của việc quản lý tính toán và mở rộng quy mô. Trong bản demo, chúng tôi đã tạo ra các container worker chuyên dụng tích hợp các thư viện hiệu suất cao như NVIDIA RAPIDS Accelerator cho Spark và mô hình mã nguồn mở Hugging Face để cung cấp một giải pháp có khả năng mở rộng.

Kết quả là một nền tảng không máy chủ, trả tiền theo nhu cầu sử dụng, mang lại thông lượng cao và latency thấp cho các ứng dụng AI và xử lý dữ liệu. Phương pháp này đóng vai trò là một khuôn mẫu linh hoạt, có thể dễ dàng điều chỉnh theo các nhu cầu khác nhau. Đối với các doanh nghiệp đang tìm kiếm hiệu suất và hỗ trợ tốt nhất, kiến trúc có thể được cải thiện bằng cách tích hợp các dịch vụ vi mô NVIDIA NIM thay vì các worker được xây dựng riêng.

Giải pháp có kiến trúc đơn giản nhưng hiệu quả, bao gồm hai ứng dụng container không máy chủ chính trong môi trường Azure Container Apps: ứng dụng điều khiển front-end Apache Spark điều phối khối lượng công việc và tiếp nhận các yêu cầu công việc, trong khi ứng dụng worker Spark được tăng tốc bằng GPU chịu trách nhiệm xử lý dữ liệu. Lớp lưu trữ dữ liệu dùng chung sử dụng Azure Files tạo điều kiện thuận lợi cho việc chia sẻ mã, mô hình và dữ liệu giữa Azure và các worker, giúp đơn giản hóa quá trình phát triển và triển khai.

Để triển khai giải pháp này, bạn cần đăng ký Azure , một phiên bản SQL Server với dữ liệu văn bản và kiến thức về Azure Container Apps, Apache Spark, Docker và Python. GitHubGitHubAzure-Serverless-GPU-Embedding cung cấp mã mẫu để bạn bắt đầu. Quy trình triển khai bao gồm thiết lập ứng dụng bộ điều khiển Spark, triển khai ứng dụng Spark worker được tăng tốc bằng GPU và chạy các tác vụ nhúng văn bản phân tán. Các tác vụ này có thể được chạy bằng Jupyter ở chế độ phát triển hoặc với trình kích hoạt HTTP ở chế độ sản xuất.

Việc tận dụng các ứng dụng Apache Spark được tăng tốc bằng GPU tùy chỉnh trên GPU không máy chủ trong Azure Container Apps cho phép các tổ chức xây dựng các giải pháp xử lý dữ liệu phân tán hiệu quả, có khả năng mở rộng và tiết kiệm chi phí mà không cần phải quản lý cơ sở hạ tầng. Mô hình không máy chủ này cho phép mở rộng tài nguyên GPU một cách linh hoạt để đáp ứng nhu cầu của khối lượng công việc AI. Tính linh hoạt trong việc chuyển đổi từ môi trường phát triển dựa trên Jupyter sang các hệ thống sẵn sàng cho môi trường production trong cùng một khuôn khổ giúp dễ dàng chuyển các tác vụ dữ liệu khó khăn sang production. Để nâng cao hiệu suất và hỗ trợ, các dịch vụ vi mô NVIDIA NIM cũng có thể được tích hợp vào kiến trúc. Các bên quan tâm có thể truy cập mã trong kho lưu trữ GitHub NVIDIA/GenerativeAIExamples và tìm hiểu thêm trong hướng dẫn demo ""Bảo mật ứng dụng AI thế hệ tiếp theo với GPU không máy chủ trong Azure Container Apps"".

Nguồn: Blog nhà phát triển NVIDIA

Chia sẻ bài viết này:

Tin tức mới nhất

Đã thêm các tính năng mới vào Rakuten LinkSurge

0:00 17/2/26

LinkShare Japan, một thành viên của tập đoàn Rakuten, đã bổ sung chức năng bảng điều khiển vào LinkSurge, phần mềm được phát triển với sự hợp tác của Benji.

đọc thêm

Hỗ trợ Avatar AI đám mây khách hàng

0:00 17/2/26

Công ty Customer Cloud (Shibuya-ku, Tokyo) đã ra mắt dịch vụ sử dụng trí tuệ Generative AI) và công nghệ avatar AI để hỗ trợ phát triển avatar kỹ thuật số cho các nghệ sĩ và người nổi tiếng.

đọc thêm

Thí nghiệm trình diễn công nghệ sạc xe điện Verbex ENEOS bằng trí tuệ nhân tạo bắt đầu.

0:00 17/2/26

Verbex đang hợp tác với ENEOS Holdings và ENEOS để triển khai dự án thí điểm nhằm cải thiện chất lượng dịch vụ khách hàng cho dịch vụ sạc xe điện.

đọc thêm

CyberAgent đã thành công trong việc tối ưu hóa quá trình phát triển trí tuệ nhân tạo.

0:00 17/2/26

Công ty CyberAgent (Tokyo) đã triển khai thành công quy trình phát triển dựa trên trí tuệ nhân tạo (AI), góp phần nâng cao năng suất của các kỹ sư.

đọc thêm

Chia sẻ bài viết này:

Danh mục

Trình nâng cao hình ảnh AI

Trình tạo mã AI

Quản lý tác vụ AI

Không có mã/mã thấp

Trình tạo thiết kế đồ họa AI

Trình tạo minh họa/nghệ thuật AI

Tất cả công cụ

Tin tức

AI và luật/hệ thống/kinh tế/xã hội

Các công ty/sản phẩm/công nghệ AI

AI công nghệ lớn

OpenAI/ChatGPT

AI thế hệ sáng tạo

AI thế hệ dựa trên văn bản

AI sáng tạo của Nhật Bản

Cơ bản về AI sáng tạo

Hướng dẫn ứng dụng AI cơ bản

Hồ sơ công ty

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng trang web

Công ty điều hành

Hãy theo dõi chúng tôi

Ngôn ngữ

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Hãy theo dõi chúng tôi

Ngôn ngữ

Danh mục

Tất cả công cụ

Quản lý tác vụ AI

Trình tạo thiết kế đồ họa AI

Không có mã/mã thấp

Trình tạo mã AI

Trình nâng cao hình ảnh AI

Trình tạo minh họa/nghệ thuật AI

AI và luật/hệ thống/kinh tế/xã hội

Các công ty/sản phẩm/công nghệ AI

AI công nghệ lớn

OpenAI/ChatGPT

AI thế hệ sáng tạo

AI thế hệ dựa trên văn bản

AI sáng tạo của Nhật Bản

Cơ bản về AI tạo ra

Hướng dẫn ứng dụng AI cơ bản

Tin tức

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng của trang web

Công ty điều hành

Hồ sơ công ty

Tin tức mới nhất

Đã thêm các tính năng mới vào Rakuten LinkSurge

0:00 17/2/26

LinkShare Japan, một thành viên của tập đoàn Rakuten, đã bổ sung chức năng bảng điều khiển vào LinkSurge, phần mềm được phát triển với sự hợp tác của Benji.

đọc thêm

Hỗ trợ Avatar AI đám mây khách hàng

0:00 17/2/26

Công ty Customer Cloud (Shibuya-ku, Tokyo) đã ra mắt dịch vụ sử dụng trí tuệ Generative AI) và công nghệ avatar AI để hỗ trợ phát triển avatar kỹ thuật số cho các nghệ sĩ và người nổi tiếng.

đọc thêm

Thí nghiệm trình diễn công nghệ sạc xe điện Verbex ENEOS bằng trí tuệ nhân tạo bắt đầu.

0:00 17/2/26

Verbex đang hợp tác với ENEOS Holdings và ENEOS để triển khai dự án thí điểm nhằm cải thiện chất lượng dịch vụ khách hàng cho dịch vụ sạc xe điện.

đọc thêm

CyberAgent đã thành công trong việc tối ưu hóa quá trình phát triển trí tuệ nhân tạo.

0:00 17/2/26

Công ty CyberAgent (Tokyo) đã triển khai thành công quy trình phát triển dựa trên trí tuệ nhân tạo (AI), góp phần nâng cao năng suất của các kỹ sư.

đọc thêm