top of page

Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

logo.png

NVIDIA Research Đài Loan công bố phương pháp nén mô hình EoRA

Generatived

0:00 11/6/25

NVIDIA Research Đài Loan đã trình bày một phương pháp tiếp cận mới tập trung vào việc sửa lỗi thường gặp trong quá trình nén mô hình. Phương pháp này, được gọi là EoRA, có hiệu quả làm giảm mất độ chính xác xảy ra trong quá trình nén mô hình bằng cách thêm một đường dẫn dư bậc thấp sử dụng phép xấp xỉ bậc thấp không gian riêng. Phương pháp này đặc biệt hiệu quả đối với các mô hình ngôn ngữ lớn và đạt được tối ưu hóa không cần tinh chỉnh có thể được thực hiện nhanh chóng với dữ liệu hiệu chuẩn tối thiểu.

EoRA vượt trội hơn các phương pháp trước đây, đặc biệt là khi xử lý các mô hình đã trải qua quá trình nén mạnh như cắt tỉa và lượng tử hóa. Trong các thử nghiệm liên quan đến các tác vụ tạo ngôn ngữ và suy luận, EoRA cho thấy những cải tiến đáng kể. Ví dụ, trong thử nghiệm ARC-Challenge với mô hình Llama3-8B được cắt tỉa 2:4, phương pháp này đã đạt được sự cải thiện hơn 4,5%. Phương pháp này vẫn mạnh mẽ ngay cả khi lượng tử hóa 3/4 bit, giảm thiểu mất độ chính xác và chứng minh tính thực tiễn của nó trong nhiều ứng dụng khác nhau.

Quá trình đằng sau EoRA là chiếu các lỗi nén vào không gian riêng của các kích hoạt đầu vào của mỗi lớp và áp dụng phân tích giá trị kỳ dị trong không gian này, cho phép xử lý các lỗi quan trọng nhất chính xác hơn và tận dụng tối đa sức mạnh biểu đạt cấp thấp hạn chế của mô hình. Toàn bộ quá trình tối ưu hóa chỉ mất vài phút, khiến EoRA trở thành giải pháp tiết kiệm thời gian để cải thiện các mô hình nén.

EoRA đã được tích hợp vào thư viện GPTQModel nguồn mở, giúp việc áp dụng dễ dàng hơn và cho phép người dùng dễ dàng cải thiện hiệu suất của các mô hình lượng tử hóa. Sự tiến bộ này dự kiến ​​sẽ hỗ trợ triển khai hiệu quả các mạng nơ-ron quy mô lớn trong nhiều lĩnh vực, chẳng hạn như thị giác máy tính và Generative AI, đồng thời duy trì sự cân bằng giữa độ chính xác của mô hình và hiệu quả tính toán. Để biết thêm thông tin về EoRA và các ứng dụng của nó, vui lòng xem các tài nguyên do NVIDIA cung cấp.

Chia sẻ bài viết này:

Tin tức mới nhất
0G Labs công bố sáng kiến ​​đào tạo lại AI DiLoCoX-107B.

0G Labs công bố sáng kiến ​​đào tạo lại AI DiLoCoX-107B.

0:00 26/3/26

San Francisco, CA, ngày 24 tháng 3 năm 2026 – Giữa những lời khen ngợi gần đây từ ngành công nghiệp tiền điện tử dành cho mô hình AI của Bittensor,

NVIDIA ra mắt giải pháp suy luận phân tán dựa trên Kubernetes.

NVIDIA ra mắt giải pháp suy luận phân tán dựa trên Kubernetes.

0:00 25/3/26

Khi độ phức tạp của các tác vụ suy luận mô hình ngôn ngữ lớn (LLM) tăng lên, phương pháp phục vụ đơn tiến trình truyền thống đang đạt đến giới hạn của nó.

NVIDIA ra mắt IGX Thor để tăng cường trí tuệ nhân tạo trong công nghiệp.

NVIDIA ra mắt IGX Thor để tăng cường trí tuệ nhân tạo trong công nghiệp.

0:00 25/3/26

NVIDIA vừa ra mắt IGX Thor, một nền tảng mới được thiết kế để tăng cường khả năng trí tuệ nhân tạo (AI) trong môi trường công nghiệp và y tế.

Sora Tech ra mắt nền tảng tạo video an toàn và sáng tạo.

Sora Tech ra mắt nền tảng tạo video an toàn và sáng tạo.

0:00 25/3/26

Mô hình Sora 2, cùng với ứng dụng Sora, giới thiệu các khả năng tạo video đột phá, nhấn mạnh vào việc sáng tạo cộng tác đồng thời ưu tiên sự an toàn của người dùng.

Copyright © 2024 Generatived - All right Reserved.

Chia sẻ bài viết này:

Chia sẻ bài viết này:

Generatived AI Logo

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

  • Facebook
  • X

Hãy theo dõi chúng tôi

Ngôn ngữ

Tin tức mới nhất
0G Labs công bố sáng kiến ​​đào tạo lại AI DiLoCoX-107B.

0G Labs công bố sáng kiến ​​đào tạo lại AI DiLoCoX-107B.

0:00 26/3/26

San Francisco, CA, ngày 24 tháng 3 năm 2026 – Giữa những lời khen ngợi gần đây từ ngành công nghiệp tiền điện tử dành cho mô hình AI của Bittensor,

NVIDIA ra mắt giải pháp suy luận phân tán dựa trên Kubernetes.

NVIDIA ra mắt giải pháp suy luận phân tán dựa trên Kubernetes.

0:00 25/3/26

Khi độ phức tạp của các tác vụ suy luận mô hình ngôn ngữ lớn (LLM) tăng lên, phương pháp phục vụ đơn tiến trình truyền thống đang đạt đến giới hạn của nó.

NVIDIA ra mắt IGX Thor để tăng cường trí tuệ nhân tạo trong công nghiệp.

NVIDIA ra mắt IGX Thor để tăng cường trí tuệ nhân tạo trong công nghiệp.

0:00 25/3/26

NVIDIA vừa ra mắt IGX Thor, một nền tảng mới được thiết kế để tăng cường khả năng trí tuệ nhân tạo (AI) trong môi trường công nghiệp và y tế.

Sora Tech ra mắt nền tảng tạo video an toàn và sáng tạo.

Sora Tech ra mắt nền tảng tạo video an toàn và sáng tạo.

0:00 25/3/26

Mô hình Sora 2, cùng với ứng dụng Sora, giới thiệu các khả năng tạo video đột phá, nhấn mạnh vào việc sáng tạo cộng tác đồng thời ưu tiên sự an toàn của người dùng.

bottom of page