top of page

Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

logo.png

NVIDIA Blackwell Ultra tăng gấp đôi hiệu suất xử lý SFU.

Generatived

0:00 27/2/26

Những tiến bộ mới nhất trong công nghệ AI đang được thúc đẩy bởi nhu cầu quản lý các cơ chế chú ý phức tạp trong các mô hình ngôn ngữ lớn (LLM). Các mô hình này, vốn rất cần thiết để hiểu và tạo ra văn bản giống con người, ngày càng dựa vào các lược đồ chú ý tinh vi như Chú ý tiềm ẩn đa đầu (MLA) và Chú ý truy vấn nhóm (GQA). Tốc độ hoạt động của các mô hình này không chỉ phụ thuộc vào sức mạnh xử lý mà còn phụ thuộc vào hiệu quả của hàm softmax, một phép toán siêu việt rất quan trọng để chuẩn hóa điểm số chú ý.

Hàm softmax, đặc biệt là sự phụ thuộc của nó vào hàm mũ tự nhiên, đã trở thành một trở ngại tính toán đáng kể trong quá trình xử lý AI. Hàm này, được thực thi trên các Đơn vị Chức năng Đặc biệt (SFU), là một bước quan trọng trong cơ chế chú ý của LLM, nơi nó chuẩn hóa điểm chú ý để xác định mức độ liên quan của các mẩu thông tin khác nhau. Tuy nhiên, kiến ​​trúc của các hệ thống AI hiện nay thường dẫn đến tắc nghẽn, vì các công cụ ma trận mạnh mẽ phải chờ SFU hoàn thành nhiệm vụ của chúng, gây ra sự chậm trễ trong toàn bộ quy trình xử lý.

Để giải quyết thách thức này, NVIDIA đã giới thiệu một cải tiến cho kiến ​​trúc của mình, được gọi là Blackwell Ultra, giúp tăng gấp đôi thông lượng SFU so với kiến ​​trúc Blackwell tiêu chuẩn. Cải tiến này được thiết kế để khắc phục nút thắt cổ chai softmax, cho phép xử lý cơ chế chú ý hiệu quả hơn và hiệu suất tổng thể nhanh hơn. Kiến trúc Blackwell Ultra đạt được điều này bằng cách giảm latency trong pha softmax của vòng lặp chú ý, từ đó giảm thiểu thời gian nhàn rỗi của các bộ xử lý ma trận và tối đa hóa thời gian xử lý hoạt động của chúng.

Tác động của kiến ​​trúc Blackwell Ultra đối với xử lý AI là rất đáng kể, với các bài kiểm tra hiệu năng cho thấy sự gia tăng đáng kể về thông lượng cho nhiều hoạt động khác nhau. Điều này đặc biệt rõ ràng trong hiệu năng lan truyền tiến của các mô hình, nơi thông lượng SFU tăng lên dẫn đến việc thực thi nhanh hơn các lớp softmax trong các khối chú ý. Kết quả là, tốc độ tổng thể của quá trình lan truyền tiến được tăng lên, chứng tỏ tầm quan trọng của việc tối ưu hóa không chỉ các phép tính tuyến tính mà còn cả các phép toán phi tuyến tính trong các hệ thống AI. Việc NVIDIA tiếp tục tập trung vào thiết kế và tối ưu hóa đồng thời phần cứng và phần mềm dự kiến ​​sẽ tiếp tục nâng cao khả năng của các mô hình AI và các ứng dụng của chúng.

Chia sẻ bài viết này:

Tin tức mới nhất
Tăng cường hỗ trợ phát triển vật liệu AI hóa học dữ liệu.

Tăng cường hỗ trợ phát triển vật liệu AI hóa học dữ liệu.

0:00 27/2/26

Công ty Data Chemical (Shibuya-ku, Tokyo) đã tăng cường hệ thống hỗ trợ người dùng cho dịch vụ điện toán đám mây trí tuệ nhân tạo và máy học phục vụ phát triển vật liệu

Hệ thống kiểm tra tài liệu EQUES AI đã được ra mắt.

Hệ thống kiểm tra tài liệu EQUES AI đã được ra mắt.

0:00 27/2/26

EQUES (Bunkyo-ku, Tokyo) đã cho ra mắt "QAI Checker", một hệ thống kiểm tra tài liệu dựa trên trí tuệ nhân tạo (AI) nhằm đảm bảo chất lượng trong ngành dược phẩm.

Các tính năng mới trong truyền thông trí tuệ nhân tạo nông nghiệp của Viện Metagri

Các tính năng mới trong truyền thông trí tuệ nhân tạo nông nghiệp của Viện Metagri

0:00 27/2/26

Viện Nghiên cứu Metagri (thành phố Funabashi) đã bổ sung chức năng mới vào nền tảng thực hành trí tuệ nhân tạo dành cho nông dân, "Nogyo AI Tsuushin"

Tăng cường hỗ trợ AI chuyên biệt cho ngành công nghiệp dữ liệu AI

Tăng cường hỗ trợ AI chuyên biệt cho ngành công nghiệp dữ liệu AI

0:00 27/2/26

Công ty AI Data (Minato-ku, Tokyo) đã bổ sung các mẫu kiến ​​thức chuyên ngành vào nền tảng hỗ trợ khách hàng AI của mình, "AI ContactPro trên IDX".

Copyright © 2024 Generatived - All right Reserved.

Chia sẻ bài viết này:

Chia sẻ bài viết này:

Generatived AI Logo

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

  • Facebook
  • X

Hãy theo dõi chúng tôi

Ngôn ngữ

Tin tức mới nhất
Tăng cường hỗ trợ phát triển vật liệu AI hóa học dữ liệu.

Tăng cường hỗ trợ phát triển vật liệu AI hóa học dữ liệu.

0:00 27/2/26

Công ty Data Chemical (Shibuya-ku, Tokyo) đã tăng cường hệ thống hỗ trợ người dùng cho dịch vụ điện toán đám mây trí tuệ nhân tạo và máy học phục vụ phát triển vật liệu

Hệ thống kiểm tra tài liệu EQUES AI đã được ra mắt.

Hệ thống kiểm tra tài liệu EQUES AI đã được ra mắt.

0:00 27/2/26

EQUES (Bunkyo-ku, Tokyo) đã cho ra mắt "QAI Checker", một hệ thống kiểm tra tài liệu dựa trên trí tuệ nhân tạo (AI) nhằm đảm bảo chất lượng trong ngành dược phẩm.

Các tính năng mới trong truyền thông trí tuệ nhân tạo nông nghiệp của Viện Metagri

Các tính năng mới trong truyền thông trí tuệ nhân tạo nông nghiệp của Viện Metagri

0:00 27/2/26

Viện Nghiên cứu Metagri (thành phố Funabashi) đã bổ sung chức năng mới vào nền tảng thực hành trí tuệ nhân tạo dành cho nông dân, "Nogyo AI Tsuushin"

Tăng cường hỗ trợ AI chuyên biệt cho ngành công nghiệp dữ liệu AI

Tăng cường hỗ trợ AI chuyên biệt cho ngành công nghiệp dữ liệu AI

0:00 27/2/26

Công ty AI Data (Minato-ku, Tokyo) đã bổ sung các mẫu kiến ​​thức chuyên ngành vào nền tảng hỗ trợ khách hàng AI của mình, "AI ContactPro trên IDX".

bottom of page