Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

NVIDIA Blackwell Ultra tăng gấp đôi hiệu suất xử lý SFU.

Generatived

0:00 27/2/26

Những tiến bộ mới nhất trong công nghệ AI đang được thúc đẩy bởi nhu cầu quản lý các cơ chế chú ý phức tạp trong các mô hình ngôn ngữ lớn (LLM). Các mô hình này, vốn rất cần thiết để hiểu và tạo ra văn bản giống con người, ngày càng dựa vào các lược đồ chú ý tinh vi như Chú ý tiềm ẩn đa đầu (MLA) và Chú ý truy vấn nhóm (GQA). Tốc độ hoạt động của các mô hình này không chỉ phụ thuộc vào sức mạnh xử lý mà còn phụ thuộc vào hiệu quả của hàm softmax, một phép toán siêu việt rất quan trọng để chuẩn hóa điểm số chú ý.

Hàm softmax, đặc biệt là sự phụ thuộc của nó vào hàm mũ tự nhiên, đã trở thành một trở ngại tính toán đáng kể trong quá trình xử lý AI. Hàm này, được thực thi trên các Đơn vị Chức năng Đặc biệt (SFU), là một bước quan trọng trong cơ chế chú ý của LLM, nơi nó chuẩn hóa điểm chú ý để xác định mức độ liên quan của các mẩu thông tin khác nhau. Tuy nhiên, kiến trúc của các hệ thống AI hiện nay thường dẫn đến tắc nghẽn, vì các công cụ ma trận mạnh mẽ phải chờ SFU hoàn thành nhiệm vụ của chúng, gây ra sự chậm trễ trong toàn bộ quy trình xử lý.

Để giải quyết thách thức này, NVIDIA đã giới thiệu một cải tiến cho kiến trúc của mình, được gọi là Blackwell Ultra, giúp tăng gấp đôi thông lượng SFU so với kiến trúc Blackwell tiêu chuẩn. Cải tiến này được thiết kế để khắc phục nút thắt cổ chai softmax, cho phép xử lý cơ chế chú ý hiệu quả hơn và hiệu suất tổng thể nhanh hơn. Kiến trúc Blackwell Ultra đạt được điều này bằng cách giảm latency trong pha softmax của vòng lặp chú ý, từ đó giảm thiểu thời gian nhàn rỗi của các bộ xử lý ma trận và tối đa hóa thời gian xử lý hoạt động của chúng.

Tác động của kiến trúc Blackwell Ultra đối với xử lý AI là rất đáng kể, với các bài kiểm tra hiệu năng cho thấy sự gia tăng đáng kể về thông lượng cho nhiều hoạt động khác nhau. Điều này đặc biệt rõ ràng trong hiệu năng lan truyền tiến của các mô hình, nơi thông lượng SFU tăng lên dẫn đến việc thực thi nhanh hơn các lớp softmax trong các khối chú ý. Kết quả là, tốc độ tổng thể của quá trình lan truyền tiến được tăng lên, chứng tỏ tầm quan trọng của việc tối ưu hóa không chỉ các phép tính tuyến tính mà còn cả các phép toán phi tuyến tính trong các hệ thống AI. Việc NVIDIA tiếp tục tập trung vào thiết kế và tối ưu hóa đồng thời phần cứng và phần mềm dự kiến sẽ tiếp tục nâng cao khả năng của các mô hình AI và các ứng dụng của chúng.

Nguồn: Blog nhà phát triển NVIDIA

Chia sẻ bài viết này:

Tin tức mới nhất

Tăng cường hỗ trợ phát triển vật liệu AI hóa học dữ liệu.

0:00 27/2/26

Công ty Data Chemical (Shibuya-ku, Tokyo) đã tăng cường hệ thống hỗ trợ người dùng cho dịch vụ điện toán đám mây trí tuệ nhân tạo và máy học phục vụ phát triển vật liệu

đọc thêm

Hệ thống kiểm tra tài liệu EQUES AI đã được ra mắt.

0:00 27/2/26

EQUES (Bunkyo-ku, Tokyo) đã cho ra mắt "QAI Checker", một hệ thống kiểm tra tài liệu dựa trên trí tuệ nhân tạo (AI) nhằm đảm bảo chất lượng trong ngành dược phẩm.

đọc thêm

Các tính năng mới trong truyền thông trí tuệ nhân tạo nông nghiệp của Viện Metagri

0:00 27/2/26

Viện Nghiên cứu Metagri (thành phố Funabashi) đã bổ sung chức năng mới vào nền tảng thực hành trí tuệ nhân tạo dành cho nông dân, "Nogyo AI Tsuushin"

đọc thêm

Tăng cường hỗ trợ AI chuyên biệt cho ngành công nghiệp dữ liệu AI

0:00 27/2/26

Công ty AI Data (Minato-ku, Tokyo) đã bổ sung các mẫu kiến thức chuyên ngành vào nền tảng hỗ trợ khách hàng AI của mình, "AI ContactPro trên IDX".

đọc thêm

Chia sẻ bài viết này:

Danh mục

Trình nâng cao hình ảnh AI

Trình tạo mã AI

Quản lý tác vụ AI

Không có mã/mã thấp

Trình tạo thiết kế đồ họa AI

Trình tạo minh họa/nghệ thuật AI

Tất cả công cụ

Tin tức

AI và luật/hệ thống/kinh tế/xã hội

Các công ty/sản phẩm/công nghệ AI

AI công nghệ lớn

OpenAI/ChatGPT

AI thế hệ sáng tạo

AI thế hệ dựa trên văn bản

AI sáng tạo của Nhật Bản

Cơ bản về AI sáng tạo

Hướng dẫn ứng dụng AI cơ bản

Hồ sơ công ty

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng trang web

Công ty điều hành

Hãy theo dõi chúng tôi

Ngôn ngữ

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Hãy theo dõi chúng tôi

Ngôn ngữ

Danh mục

Tất cả công cụ

Quản lý tác vụ AI

Trình tạo thiết kế đồ họa AI

Không có mã/mã thấp

Trình tạo mã AI

Trình nâng cao hình ảnh AI

Trình tạo minh họa/nghệ thuật AI

AI và luật/hệ thống/kinh tế/xã hội

Các công ty/sản phẩm/công nghệ AI

AI công nghệ lớn

OpenAI/ChatGPT

AI thế hệ sáng tạo

AI thế hệ dựa trên văn bản

AI sáng tạo của Nhật Bản

Cơ bản về AI tạo ra

Hướng dẫn ứng dụng AI cơ bản

Tin tức

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng của trang web

Công ty điều hành

Hồ sơ công ty

Tin tức mới nhất

Tăng cường hỗ trợ phát triển vật liệu AI hóa học dữ liệu.

0:00 27/2/26

Công ty Data Chemical (Shibuya-ku, Tokyo) đã tăng cường hệ thống hỗ trợ người dùng cho dịch vụ điện toán đám mây trí tuệ nhân tạo và máy học phục vụ phát triển vật liệu

đọc thêm

Hệ thống kiểm tra tài liệu EQUES AI đã được ra mắt.

0:00 27/2/26

EQUES (Bunkyo-ku, Tokyo) đã cho ra mắt "QAI Checker", một hệ thống kiểm tra tài liệu dựa trên trí tuệ nhân tạo (AI) nhằm đảm bảo chất lượng trong ngành dược phẩm.

đọc thêm

Các tính năng mới trong truyền thông trí tuệ nhân tạo nông nghiệp của Viện Metagri

0:00 27/2/26

Viện Nghiên cứu Metagri (thành phố Funabashi) đã bổ sung chức năng mới vào nền tảng thực hành trí tuệ nhân tạo dành cho nông dân, "Nogyo AI Tsuushin"

đọc thêm

Tăng cường hỗ trợ AI chuyên biệt cho ngành công nghiệp dữ liệu AI

0:00 27/2/26

Công ty AI Data (Minato-ku, Tokyo) đã bổ sung các mẫu kiến thức chuyên ngành vào nền tảng hỗ trợ khách hàng AI của mình, "AI ContactPro trên IDX".

đọc thêm