Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

NVIDIA AutoDeploy đơn giản hóa việc triển khai các mô hình ngôn ngữ quy mô lớn.

Generatived

0:00 12/2/26

NVIDIA vừa công bố bản phát hành beta của AutoDeploy, một tính năng của TensorRT LLM. AutoDeploy đơn giản hóa việc triển khai các mô hình ngôn ngữ quy mô lớn (LLM) bằng cách tự động hóa quy trình tối ưu hóa công cụ suy luận. AutoDeploy cho phép các nhà phát triển chuyển đổi các mô hình PyTorch thành các đồ thị được tối ưu hóa mà không cần can thiệp thủ công, giúp đơn giản hóa quá trình chuyển đổi từ phát triển mô hình sang triển khai.

Tính năng mới này được thiết kế để giải quyết những phức tạp vốn có trong các kiến trúc LLM khác nhau, chẳng hạn như mô hình Transformer và mô hình ngôn ngữ-thị giác lai, bằng cách tự động hóa các tác vụ như quản lý bộ nhớ cache KV và hợp nhất hoạt động. Quy trình làm việc dựa trên trình biên dịch này cho phép người xây dựng mô hình tập trung vào việc tạo mô hình trong khi AutoDeploy xử lý các tối ưu hóa cụ thể cho suy luận.

AutoDeploy hỗ trợ nhiều loại mô hình, bao gồm hơn 100 LLM chuyển đổi văn bản sang văn bản, và cung cấp hỗ trợ sớm cho các mô hình ngôn ngữ-thị giác (VLM) và mô hình không gian trạng thái (SSM). Nó cũng cung cấp hỗ trợ được tối ưu hóa hiệu suất cho các mô hình như dòng Llama và Nemotron 3 Nano của NVIDIA. Tính năng này được tích hợp vào môi trường chạy TensorRT LLM, cho phép chuyển đổi và triển khai mô hình liền mạch khi khởi động, hứa hẹn cải thiện hiệu suất liên tục.

Kiến trúc AutoDeploy thu thập và tối ưu hóa đồ thị tính toán từ mô hình PyTorch và áp dụng một loạt các phép biến đổi tự động để cải thiện hiệu suất. Điều này bao gồm phân mảnh và tích hợp các nhân được tối ưu hóa cho suy luận đa GPU. Hệ thống cũng xử lý tích hợp thời gian chạy, quản lý các khía cạnh như lập lịch và quản lý bộ nhớ cache mà theo truyền thống đòi hỏi nhiều công sức thủ công.

AutoDeploy của NVIDIA đã chứng minh khả năng của mình bằng cách cho phép triển khai và tối ưu hóa nhanh chóng các mô hình phức tạp như Nemotron 3 Nano và Nemotron-Flash. Các mô hình này đã được tích hợp và tối ưu hóa trong vòng vài ngày, chứng minh khả năng của AutoDeploy trong việc tạo điều kiện triển khai nhanh chóng và duy trì hiệu suất suy luận cao trên các kiến trúc đa dạng. Các nhà phát triển và người đóng góp quan tâm có thể tham khảo tài liệu AutoDeploy và các tập lệnh mẫu để bắt đầu thử nghiệm tính năng này.

Nguồn: Blog dành cho nhà phát triển của NVIDIA

Chia sẻ bài viết này:

Tin tức mới nhất

Phát triển Lớp học Trí tuệ Nhân tạo trong Chương trình Tái thiết Khu vực Aryaumu

0:00 30/1/26

Ông Toshitaka, người điều hành "Hashimoto Suinin! DAO" của thành phố Hashimoto bằng cách sử dụng "Regional Revitalization Cooperation Team DAO" do Aru-Yaum (thành phố Sapporo)

đọc thêm

Dịch vụ tư vấn AI hàng tháng của AgLab đã ra mắt.

0:00 30/1/26

AgLab (quận Minato, Tokyo) đã ra mắt "AIKATA," dịch vụ "Cố vấn AI" theo hình thức đăng ký hàng tháng, cung cấp hỗ trợ toàn diện cho việc sử dụng AI của các công ty.

đọc thêm

CLACK và Micron hợp tác cung cấp chương trình giáo dục về Trí tuệ Nhân tạo tại Hiroshima.

0:00 30/1/26

CLACK (tỉnh Hiroshima) đã hợp tác với Quỹ Micron để khởi động chương trình "Cầu AI Hiroshima" dành cho học sinh trung học địa phương.

đọc thêm

Schwatto ra mắt dịch vụ chẩn đoán LLMO miễn phí

0:00 30/1/26

Schwat (Tokyo) sẽ bắt đầu cung cấp dịch vụ chẩn đoán miễn phí mới thông qua Marketing AIX, một dịch vụ hỗ trợ tiếp thị cho kỷ nguyên trí tuệ nhân tạo.

đọc thêm

Chia sẻ bài viết này:

Danh mục

Trình nâng cao hình ảnh AI

Trình tạo mã AI

Quản lý tác vụ AI

Không có mã/mã thấp

Trình tạo thiết kế đồ họa AI

Trình tạo minh họa/nghệ thuật AI

Tất cả công cụ

Tin tức

AI và luật/hệ thống/kinh tế/xã hội

Các công ty/sản phẩm/công nghệ AI

AI công nghệ lớn

OpenAI/ChatGPT

AI thế hệ sáng tạo

AI thế hệ dựa trên văn bản

AI sáng tạo của Nhật Bản

Cơ bản về AI sáng tạo

Hướng dẫn ứng dụng AI cơ bản

Hồ sơ công ty

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng trang web

Công ty điều hành

Hãy theo dõi chúng tôi

Ngôn ngữ

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Hãy theo dõi chúng tôi

Ngôn ngữ

Danh mục

Tất cả công cụ

Quản lý tác vụ AI

Trình tạo thiết kế đồ họa AI

Không có mã/mã thấp

Trình tạo mã AI

Trình nâng cao hình ảnh AI

Trình tạo minh họa/nghệ thuật AI

AI và luật/hệ thống/kinh tế/xã hội

Các công ty/sản phẩm/công nghệ AI

AI công nghệ lớn

OpenAI/ChatGPT

AI thế hệ sáng tạo

AI thế hệ dựa trên văn bản

AI sáng tạo của Nhật Bản

Cơ bản về AI tạo ra

Hướng dẫn ứng dụng AI cơ bản

Tin tức

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng của trang web

Công ty điều hành

Hồ sơ công ty

Tin tức mới nhất

Phát triển Lớp học Trí tuệ Nhân tạo trong Chương trình Tái thiết Khu vực Aryaumu

0:00 30/1/26

Ông Toshitaka, người điều hành "Hashimoto Suinin! DAO" của thành phố Hashimoto bằng cách sử dụng "Regional Revitalization Cooperation Team DAO" do Aru-Yaum (thành phố Sapporo)

đọc thêm

Dịch vụ tư vấn AI hàng tháng của AgLab đã ra mắt.

0:00 30/1/26

AgLab (quận Minato, Tokyo) đã ra mắt "AIKATA," dịch vụ "Cố vấn AI" theo hình thức đăng ký hàng tháng, cung cấp hỗ trợ toàn diện cho việc sử dụng AI của các công ty.

đọc thêm

CLACK và Micron hợp tác cung cấp chương trình giáo dục về Trí tuệ Nhân tạo tại Hiroshima.

0:00 30/1/26

CLACK (tỉnh Hiroshima) đã hợp tác với Quỹ Micron để khởi động chương trình "Cầu AI Hiroshima" dành cho học sinh trung học địa phương.

đọc thêm

Schwatto ra mắt dịch vụ chẩn đoán LLMO miễn phí

0:00 30/1/26

Schwat (Tokyo) sẽ bắt đầu cung cấp dịch vụ chẩn đoán miễn phí mới thông qua Marketing AIX, một dịch vụ hỗ trợ tiếp thị cho kỷ nguyên trí tuệ nhân tạo.

đọc thêm