Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

NVIDIA báo cáo sự gia tăng mạnh mẽ trong việc ứng dụng AI trên toàn ngành.

Generatived

0:00 11/3/26

Việc triển khai các mô hình ngôn ngữ lớn (LLM) trong các ứng dụng AI đã dẫn đến sự phát triển của các khung suy luận phân tán giúp tăng cường khả năng mở rộng và giảm latency. Các khung này sử dụng nhiều kỹ thuật khác nhau như phân tách phục vụ, tải bộ nhớ đệm KV và song song hóa chuyên gia rộng để quản lý tải tính toán trên nhiều GPU và nút. Ví dụ, phân tách phục vụ tách biệt các giai đoạn điền trước và giải mã trên các GPU khác nhau, đòi hỏi việc truyền dữ liệu hiệu quả giữa chúng. Tải bộ nhớ đệm KV tận dụng bộ nhớ để xử lý việc mở rộng bộ nhớ đệm, đặc biệt là trong các khối lượng công việc AI nhiều lượt, bằng cách truy xuất các kết quả trước đó từ bộ nhớ thay vì tính toán lại chúng. Song song hóa chuyên gia rộng liên quan đến việc phân phối 'chuyên gia' trên các GPU, yêu cầu giao tiếp có độ trễ cực thấp để truyền các kết quả trung gian.

Tính chất năng động của các dịch vụ này, có thể hoạt động liên tục, đòi hỏi một hệ thống có khả năng thích ứng với sự thay đổi mức sử dụng GPU dựa trên nhu cầu người dùng và đảm bảo khả năng phục hồi khi xảy ra sự cố. Điều này bao gồm khả năng hoạt động ở thông lượng giảm trong thời gian phục hồi. Ngoài ra, sự không đồng nhất của phần cứng về bộ nhớ, lưu trữ và khả năng tính toán đòi hỏi một thư viện có thể thống nhất các công nghệ truyền thông và lưu trữ, tạo điều kiện thuận lợi cho việc di chuyển dữ liệu hiệu quả trên các hệ thống phân cấp bộ nhớ và lưu trữ khác nhau.

Để giải quyết những thách thức này, Thư viện Truyền tải Suy luận NVIDIA (NIXL) đã được giới thiệu như một thư viện di chuyển dữ liệu mã nguồn mở, không phụ thuộc vào nhà cung cấp. NIXL được thiết kế để hỗ trợ các khung suy luận AI phức tạp bằng cách cung cấp API thống nhất cho việc truyền dữ liệu giữa các công nghệ bộ nhớ và lưu trữ khác nhau. Nó hỗ trợ một loạt các công nghệ bao gồm RDMA, mạng do GPU khởi tạo và các tùy chọn lưu trữ đám mây nâng cao. NIXL đã được tích hợp vào một số khung suy luận AI và tương thích với nhiều dịch vụ đám mây khác nhau, giúp tăng cường tính linh hoạt và hiệu suất của nó.

Kiến trúc của NIXL bao gồm một tác nhân truyền tải cốt lõi và hỗ trợ nhiều plugin phụ trợ truyền tải thông qua API. Nó cung cấp một quy trình hợp lý để thiết lập truyền tải dữ liệu giữa các tác nhân, bao gồm đăng ký bộ nhớ, trao đổi siêu dữ liệu, tạo và quản lý yêu cầu truyền tải. Thiết kế của thư viện cho phép mở rộng quy mô động và đảm bảo chi phí tối thiểu, cho phép chồng chéo hiệu quả giữa giao tiếp và tính toán. NIXL cũng bao gồm các công cụ đo hiệu năng như NIXLBench và KVBench, hỗ trợ xác minh và tối ưu hóa hệ thống. Thư viện có sẵn trên GitHub và hỗ trợ môi trường Linux, với các liên kết cho C, Python và Rust, khuyến khích các nhà phát triển tích hợp NIXL vào khối lượng công việc suy luận AI của họ.

ソース：NVIDIA Developer Blog

Chia sẻ bài viết này:

Tin tức mới nhất

Feedforce Answer IO hiện đã hỗ trợ GPT-5.4.

0:00 11/3/26

Feedforce (Minato-ku, Tokyo) đã bổ sung hỗ trợ cho mô hình "GPT-5.4" của OpenAI vào dịch vụ "Answer IO" của mình, dịch vụ này trực quan hóa điểm số thương hiệu trong

đọc thêm

Minh chứng hiệu quả của trí tuệ nhân tạo tại Bệnh viện Thành phố Nagano

0:00 11/3/26

Bệnh viện thành phố Nagano (thành phố Nagano, tỉnh Nagano) đã chứng minh rằng việc sử dụng trợ lý Trí tuệ Generative AI)

đọc thêm

Thông báo hỗ trợ Chatsense của Knowledge Sense

0:00 11/3/26

KnowledgeSense (quận Minato, Tokyo) thông báo rằng dịch vụ trợ lý ảo Generative AI dành cho doanh nghiệp, ChatSense, hiện đã tương thích với Nano Banana 2 của Google.

đọc thêm

Aurora Mobile ra mắt tính năng EngageLab Omni Connect

0:00 11/3/26

Aurora Mobile vừa ra mắt EngageLab Omni Connect, một tính năng mới được bổ sung vào nền tảng tương tác khách hàng ưu tiên trí tuệ nhân tạo (AI) của hãng, EngageLab.

đọc thêm

Chia sẻ bài viết này:

Danh mục

Trình nâng cao hình ảnh AI

Trình tạo mã AI

Quản lý tác vụ AI

Không có mã/mã thấp

Trình tạo thiết kế đồ họa AI

Trình tạo minh họa/nghệ thuật AI

Tất cả công cụ

Tin tức

AI và luật/hệ thống/kinh tế/xã hội

Các công ty/sản phẩm/công nghệ AI

AI công nghệ lớn

OpenAI/ChatGPT

AI thế hệ sáng tạo

AI thế hệ dựa trên văn bản

AI sáng tạo của Nhật Bản

Cơ bản về AI sáng tạo

Hướng dẫn ứng dụng AI cơ bản

Hồ sơ công ty

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng trang web

Công ty điều hành

Hãy theo dõi chúng tôi

Ngôn ngữ

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Hãy theo dõi chúng tôi

Ngôn ngữ

Danh mục

Tất cả công cụ

Quản lý tác vụ AI

Trình tạo thiết kế đồ họa AI

Không có mã/mã thấp

Trình tạo mã AI

Trình nâng cao hình ảnh AI

Trình tạo minh họa/nghệ thuật AI

AI và luật/hệ thống/kinh tế/xã hội

Các công ty/sản phẩm/công nghệ AI

AI công nghệ lớn

OpenAI/ChatGPT

AI thế hệ sáng tạo

AI thế hệ dựa trên văn bản

AI sáng tạo của Nhật Bản

Cơ bản về AI tạo ra

Hướng dẫn ứng dụng AI cơ bản

Tin tức

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng của trang web

Công ty điều hành

Hồ sơ công ty

Tin tức mới nhất

Feedforce Answer IO hiện đã hỗ trợ GPT-5.4.

0:00 11/3/26

Feedforce (Minato-ku, Tokyo) đã bổ sung hỗ trợ cho mô hình "GPT-5.4" của OpenAI vào dịch vụ "Answer IO" của mình, dịch vụ này trực quan hóa điểm số thương hiệu trong

đọc thêm

Minh chứng hiệu quả của trí tuệ nhân tạo tại Bệnh viện Thành phố Nagano

0:00 11/3/26

Bệnh viện thành phố Nagano (thành phố Nagano, tỉnh Nagano) đã chứng minh rằng việc sử dụng trợ lý Trí tuệ Generative AI)

đọc thêm

Thông báo hỗ trợ Chatsense của Knowledge Sense

0:00 11/3/26

KnowledgeSense (quận Minato, Tokyo) thông báo rằng dịch vụ trợ lý ảo Generative AI dành cho doanh nghiệp, ChatSense, hiện đã tương thích với Nano Banana 2 của Google.

đọc thêm

Aurora Mobile ra mắt tính năng EngageLab Omni Connect

0:00 11/3/26

Aurora Mobile vừa ra mắt EngageLab Omni Connect, một tính năng mới được bổ sung vào nền tảng tương tác khách hàng ưu tiên trí tuệ nhân tạo (AI) của hãng, EngageLab.

đọc thêm