Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

NVIDIA Blackwell Ultra tăng gấp đôi hiệu suất xử lý SFU.
Generatived
0:00 27/2/26
Những tiến bộ mới nhất trong công nghệ AI đang được thúc đẩy bởi nhu cầu quản lý các cơ chế chú ý phức tạp trong các mô hình ngôn ngữ lớn (LLM). Các mô hình này, vốn rất cần thiết để hiểu và tạo ra văn bản giống con người, ngày càng dựa vào các lược đồ chú ý tinh vi như Chú ý tiềm ẩn đa đầu (MLA) và Chú ý truy vấn nhóm (GQA). Tốc độ hoạt động của các mô hình này không chỉ phụ thuộc vào sức mạnh xử lý mà còn phụ thuộc vào hiệu quả của hàm softmax, một phép toán siêu việt rất quan trọng để chuẩn hóa điểm số chú ý.
Hàm softmax, đặc biệt là sự phụ thuộc của nó vào hàm mũ tự nhiên, đã trở thành một trở ngại tính toán đáng kể trong quá trình xử lý AI. Hàm này, được thực thi trên các Đơn vị Chức năng Đặc biệt (SFU), là một bước quan trọng trong cơ chế chú ý của LLM, nơi nó chuẩn hóa điểm chú ý để xác định mức độ liên quan của các mẩu thông tin khác nhau. Tuy nhiên, kiến trúc của các hệ thống AI hiện nay thường dẫn đến tắc nghẽn, vì các công cụ ma trận mạnh mẽ phải chờ SFU hoàn thành nhiệm vụ của chúng, gây ra sự chậm trễ trong toàn bộ quy trình xử lý.
Để giải quyết thách thức này, NVIDIA đã giới thiệu một cải tiến cho kiến trúc của mình, được gọi là Blackwell Ultra, giúp tăng gấp đôi thông lượng SFU so với kiến trúc Blackwell tiêu chuẩn. Cải tiến này được thiết kế để khắc phục nút thắt cổ chai softmax, cho phép xử lý cơ chế chú ý hiệu quả hơn và hiệu suất tổng thể nhanh hơn. Kiến trúc Blackwell Ultra đạt được điều này bằng cách giảm latency trong pha softmax của vòng lặp chú ý, từ đó giảm thiểu thời gian nhàn rỗi của các bộ xử lý ma trận và tối đa hóa thời gian xử lý hoạt động của chúng.
Tác động của kiến trúc Blackwell Ultra đối với xử lý AI là rất đáng kể, với các bài kiểm tra hiệu năng cho thấy sự gia tăng đáng kể về thông lượng cho nhiều hoạt động khác nhau. Điều này đặc biệt rõ ràng trong hiệu năng lan truyền tiến của các mô hình, nơi thông lượng SFU tăng lên dẫn đến việc thực thi nhanh hơn các lớp softmax trong các khối chú ý. Kết quả là, tốc độ tổng thể của quá trình lan truyền tiến được tăng lên, chứng tỏ tầm quan trọng của việc tối ưu hóa không chỉ các phép tính tuyến tính mà còn cả các phép toán phi tuyến tính trong các hệ thống AI. Việc NVIDIA tiếp tục tập trung vào thiết kế và tối ưu hóa đồng thời phần cứng và phần mềm dự kiến sẽ tiếp tục nâng cao khả năng của các mô hình AI và các ứng dụng của chúng.
Chia sẻ bài viết này:
Tin tức mới nhất
NVIDIA Blackwell Ultra tăng gấp đôi hiệu suất xử lý SFU.
0:00 27/2/26
Những tiến bộ mới nhất trong công nghệ AI đang được thúc đẩy bởi nhu cầu quản lý các cơ chế chú ý phức tạp trong các mô hình ngôn ngữ lớn (LLM).
Gemini 3 ra mắt bản cập nhật Circle to Search được nâng cấp.
0:00 27/2/26
Bản cập nhật mới nhất của Circle to Search đã mở rộng khả năng, cho phép người dùng khám phá nhiều đối tượng trong một hình ảnh cùng lúc.
Mẫu kính Rokid AI Future đã được ra mắt.
0:00 27/2/26
Công ty Future Model (Shinjuku-ku, Tokyo) vừa thông báo ra mắt kính thông minh Rokid Smart AI Glasses, sản phẩm mới từ nhà sản xuất thiết bị đeo thông minh Rokid.
Copyright © 2024 Generatived - All right Reserved.
Chia sẻ bài viết này:
Chia sẻ bài viết này:
Danh mục
Tin tức
AI và luật/hệ thống/kinh tế/xã hội
Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.
Tin tức mới nhất
NVIDIA Blackwell Ultra tăng gấp đôi hiệu suất xử lý SFU.
0:00 27/2/26
Những tiến bộ mới nhất trong công nghệ AI đang được thúc đẩy bởi nhu cầu quản lý các cơ chế chú ý phức tạp trong các mô hình ngôn ngữ lớn (LLM).
Gemini 3 ra mắt bản cập nhật Circle to Search được nâng cấp.
0:00 27/2/26
Bản cập nhật mới nhất của Circle to Search đã mở rộng khả năng, cho phép người dùng khám phá nhiều đối tượng trong một hình ảnh cùng lúc.
Mẫu kính Rokid AI Future đã được ra mắt.
0:00 27/2/26
Công ty Future Model (Shinjuku-ku, Tokyo) vừa thông báo ra mắt kính thông minh Rokid Smart AI Glasses, sản phẩm mới từ nhà sản xuất thiết bị đeo thông minh Rokid.


%20(1).webp)


