Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

NVIDIA giới thiệu Helix Parallel Processing để Enhance AI

Generatived

0:00 10/7/25

Hệ thống Blackwell của NVIDIA giải quyết những thách thức của các ứng dụng AI hiện đại, đòi hỏi phải quản lý lượng dữ liệu khổng lồ và phản hồi nhanh chóng. Việc giới thiệu Helix Parallelism, được phát triển với sự hợp tác của Blackwell, là một bước tiến lớn trong công nghệ AI. Kỹ thuật mới này làm tăng đáng kể số lượng người dùng mà một tác nhân AI có thể xử lý đồng thời, cải thiện khả năng xử lý người dùng đồng thời lên đến 32 lần ở một latency định so với các kỹ thuật xử lý song song truyền thống.

Hiệu quả giải mã thời gian thực của các hệ thống AI bị cản trở bởi hai nút thắt cổ chai chính: truyền trực tuyến bộ đệm khóa-giá trị (KV) và tải trọng số mạng truyền thẳng (FFN) từ DRAM. Các chiến lược song song hóa truyền thống gặp khó khăn trong việc tối ưu hóa các nút thắt cổ chai này đồng thời. Tuy nhiên, Helix Parallelism giải quyết vấn đề này bằng cách sử dụng chiến lược phân mảnh lai tách các chiến lược song song hóa sự chú ý và FFN thành một đường ống thời gian. Cách tiếp cận này giải quyết hiệu quả các thách thức của việc truyền trực tuyến bộ đệm KV và tải trọng số FFN phát sinh khi giải mã các ngữ cảnh có hàng triệu mã thông báo.

Luồng thực thi của Helix Parallelism được thiết kế để tối đa hóa việc sử dụng GPU và giảm thiểu latency. Bằng cách phân mảnh bộ đệm KV và áp dụng Tensor Parallelism theo cách tránh trùng lặp trên các GPU, Helix đạt được tính toán chú ý hiệu quả. Chiến lược này cũng bao gồm Helix Overlapped Pipeline Batchwise (HOP-B), một kỹ thuật đường ống chi tiết, để giảm thêm latency giữa các mã thông báo bằng cách chồng chéo giao tiếp và tính toán. Trong giai đoạn FFN, cùng một GPU được sử dụng lại để thực thi các khối FFN mà không có thời gian nhàn rỗi, chứng minh tính linh hoạt và hiệu quả của chiến lược Helix.

Kết quả mô phỏng trên phần cứng Blackwell của NVIDIA cho thấy Helix Parallelism thiết lập chuẩn hiệu suất mới trong giải mã mô hình ngôn ngữ quy mô lớn (LLM) ngữ cảnh dài. Kỹ thuật này đạt được thông lượng cao ở latency thấp, cải thiện đáng kể tương tác của người dùng và khả năng mở rộng hệ thống. Khi NVIDIA tiếp tục tinh chỉnh tối ưu hóa này cho các khuôn khổ suy luận, Helix Parallelism là một sự phát triển đầy hứa hẹn để phục vụ các mô hình AI có thể mở rộng mà không ảnh hưởng đến hiệu suất thời gian thực.

Nguồn: Blog nhà phát triển NVIDIA

Chia sẻ bài viết này:

Tin tức mới nhất

Nền tảng phân tích phần mềm độc hại CoWorker AI vừa công bố.

0:00 13/3/26

CoWorker (Shinjuku-ku, Tokyo) đã công bố "Blue Agent for Malware Analysis", một nền tảng phân tích phần mềm độc hại được hỗ trợ bởi trí tuệ nhân tạo (AI).

đọc thêm

Ứng dụng tóm tắt tin tức root c AI ra mắt

0:00 13/3/26

Công ty Root c (thành phố Fukuoka) đã ra mắt "Morning AI", một ứng dụng dành cho iOS tóm tắt tin tức về trí tuệ nhân tạo (AI) chỉ trong ba dòng,

đọc thêm

Cơ quan Quản lý Phát triển Kinh tế (ABS) về Việc làm cho Người khuyết tật và Hỗ trợ Sử dụng Trí tuệ Nhân tạo (AI)

0:00 13/3/26

Công ty con AKKODiS Business Support (Minato-ku, Tokyo) là một công ty con chuyên hỗ trợ các hoạt động văn phòng của các công ty thuộc tập đoàn nhằm mục đích thúc đẩy việc làm

đọc thêm

Nền tảng hỗ trợ phát triển trí tuệ nhân tạo APTO đã được ra mắt.

0:00 13/3/26

APTO (Chiyoda-ku, Tokyo) cung cấp "harBest," một nền tảng thu thập và chú thích dữ liệu cho việc phát triển AI.

đọc thêm

Chia sẻ bài viết này:

Danh mục

Trình nâng cao hình ảnh AI

Trình tạo mã AI

Quản lý tác vụ AI

Không có mã/mã thấp

Trình tạo thiết kế đồ họa AI

Trình tạo minh họa/nghệ thuật AI

Tất cả công cụ

Tin tức

AI và luật/hệ thống/kinh tế/xã hội

Các công ty/sản phẩm/công nghệ AI

AI công nghệ lớn

OpenAI/ChatGPT

AI thế hệ sáng tạo

AI thế hệ dựa trên văn bản

AI sáng tạo của Nhật Bản

Cơ bản về AI sáng tạo

Hướng dẫn ứng dụng AI cơ bản

Hồ sơ công ty

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng trang web

Công ty điều hành

Hãy theo dõi chúng tôi

Ngôn ngữ

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Hãy theo dõi chúng tôi

Ngôn ngữ

Danh mục

Tất cả công cụ

Quản lý tác vụ AI

Trình tạo thiết kế đồ họa AI

Không có mã/mã thấp

Trình tạo mã AI

Trình nâng cao hình ảnh AI

Trình tạo minh họa/nghệ thuật AI

AI và luật/hệ thống/kinh tế/xã hội

Các công ty/sản phẩm/công nghệ AI

AI công nghệ lớn

OpenAI/ChatGPT

AI thế hệ sáng tạo

AI thế hệ dựa trên văn bản

AI sáng tạo của Nhật Bản

Cơ bản về AI tạo ra

Hướng dẫn ứng dụng AI cơ bản

Tin tức

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng của trang web

Công ty điều hành

Hồ sơ công ty

Tin tức mới nhất

Nền tảng phân tích phần mềm độc hại CoWorker AI vừa công bố.

0:00 13/3/26

CoWorker (Shinjuku-ku, Tokyo) đã công bố "Blue Agent for Malware Analysis", một nền tảng phân tích phần mềm độc hại được hỗ trợ bởi trí tuệ nhân tạo (AI).

đọc thêm

Ứng dụng tóm tắt tin tức root c AI ra mắt

0:00 13/3/26

Công ty Root c (thành phố Fukuoka) đã ra mắt "Morning AI", một ứng dụng dành cho iOS tóm tắt tin tức về trí tuệ nhân tạo (AI) chỉ trong ba dòng,

đọc thêm

Cơ quan Quản lý Phát triển Kinh tế (ABS) về Việc làm cho Người khuyết tật và Hỗ trợ Sử dụng Trí tuệ Nhân tạo (AI)

0:00 13/3/26

Công ty con AKKODiS Business Support (Minato-ku, Tokyo) là một công ty con chuyên hỗ trợ các hoạt động văn phòng của các công ty thuộc tập đoàn nhằm mục đích thúc đẩy việc làm

đọc thêm

Nền tảng hỗ trợ phát triển trí tuệ nhân tạo APTO đã được ra mắt.

0:00 13/3/26

APTO (Chiyoda-ku, Tokyo) cung cấp "harBest," một nền tảng thu thập và chú thích dữ liệu cho việc phát triển AI.

đọc thêm