Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

NVIDIA Research Đài Loan công bố phương pháp nén mô hình EoRA
Generatived
0:00 11/6/25
NVIDIA Research Đài Loan đã trình bày một phương pháp tiếp cận mới tập trung vào việc sửa lỗi thường gặp trong quá trình nén mô hình. Phương pháp này, được gọi là EoRA, có hiệu quả làm giảm mất độ chính xác xảy ra trong quá trình nén mô hình bằng cách thêm một đường dẫn dư bậc thấp sử dụng phép xấp xỉ bậc thấp không gian riêng. Phương pháp này đặc biệt hiệu quả đối với các mô hình ngôn ngữ lớn và đạt được tối ưu hóa không cần tinh chỉnh có thể được thực hiện nhanh chóng với dữ liệu hiệu chuẩn tối thiểu.
EoRA vượt trội hơn các phương pháp trước đây, đặc biệt là khi xử lý các mô hình đã trải qua quá trình nén mạnh như cắt tỉa và lượng tử hóa. Trong các thử nghiệm liên quan đến các tác vụ tạo ngôn ngữ và suy luận, EoRA cho thấy những cải tiến đáng kể. Ví dụ, trong thử nghiệm ARC-Challenge với mô hình Llama3-8B được cắt tỉa 2:4, phương pháp này đã đạt được sự cải thiện hơn 4,5%. Phương pháp này vẫn mạnh mẽ ngay cả khi lượng tử hóa 3/4 bit, giảm thiểu mất độ chính xác và chứng minh tính thực tiễn của nó trong nhiều ứng dụng khác nhau.
Quá trình đằng sau EoRA là chiếu các lỗi nén vào không gian riêng của các kích hoạt đầu vào của mỗi lớp và áp dụng phân tích giá trị kỳ dị trong không gian này, cho phép xử lý các lỗi quan trọng nhất chính xác hơn và tận dụng tối đa sức mạnh biểu đạt cấp thấp hạn chế của mô hình. Toàn bộ quá trình tối ưu hóa chỉ mất vài phút, khiến EoRA trở thành giải pháp tiết kiệm thời gian để cải thiện các mô hình nén.
EoRA đã được tích hợp vào thư viện GPTQModel nguồn mở, giúp việc áp dụng dễ dàng hơn và cho phép người dùng dễ dàng cải thiện hiệu suất của các mô hình lượng tử hóa. Sự tiến bộ này dự kiến sẽ hỗ trợ triển khai hiệu quả các mạng nơ-ron quy mô lớn trong nhiều lĩnh vực, chẳng hạn như thị giác máy tính và Generative AI, đồng thời duy trì sự cân bằng giữa độ chính xác của mô hình và hiệu quả tính toán. Để biết thêm thông tin về EoRA và các ứng dụng của nó, vui lòng xem các tài nguyên do NVIDIA cung cấp.
Chia sẻ bài viết này:
Tin tức mới nhất
Lightfield giới thiệu Swift AI CRM Migration Agent
0:00 27/3/26
Lightfield, nhà cung cấp CRM tích hợp trí tuệ nhân tạo, vừa giới thiệu một công cụ tự động chuyển đổi dữ liệu mới được thiết kế để hỗ trợ việc chuyển giao nhanh chóng các bản ghi CRM
Notch nhận được 30 triệu đô la để mở rộng việc tuân thủ các quy định về trí tuệ nhân tạo.
0:00 27/3/26
Notch, một nền tảng trí tuệ nhân tạo (AI) phục vụ các lĩnh vực được quản lý chặt chẽ, đã huy động thành công 30 triệu đô la trong vòng gọi vốn Series A.
OVHcloud mua lại Dragon LLM để Enhance AI.
0:00 27/3/26
OVHcloud vừa công bố bước đi chiến lược nhằm tăng cường năng lực trong lĩnh vực trí tuệ nhân tạo tạo sinh (generative AI) bằng việc ký kết thỏa thuận mua lại Dragon LLM
Copyright © 2024 Generatived - All right Reserved.
Chia sẻ bài viết này:
Chia sẻ bài viết này:
Danh mục
Tin tức
AI và luật/hệ thống/kinh tế/xã hội
Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.
Tin tức mới nhất
Lightfield giới thiệu Swift AI CRM Migration Agent
0:00 27/3/26
Lightfield, nhà cung cấp CRM tích hợp trí tuệ nhân tạo, vừa giới thiệu một công cụ tự động chuyển đổi dữ liệu mới được thiết kế để hỗ trợ việc chuyển giao nhanh chóng các bản ghi CRM
Notch nhận được 30 triệu đô la để mở rộng việc tuân thủ các quy định về trí tuệ nhân tạo.
0:00 27/3/26
Notch, một nền tảng trí tuệ nhân tạo (AI) phục vụ các lĩnh vực được quản lý chặt chẽ, đã huy động thành công 30 triệu đô la trong vòng gọi vốn Series A.
OVHcloud mua lại Dragon LLM để Enhance AI.
0:00 27/3/26
OVHcloud vừa công bố bước đi chiến lược nhằm tăng cường năng lực trong lĩnh vực trí tuệ nhân tạo tạo sinh (generative AI) bằng việc ký kết thỏa thuận mua lại Dragon LLM

%20(1).webp)
%20(1).webp)
%20(1).webp)

