top of page

Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

logo.png

NVIDIA công bố Dynamic-CP để đào tạo LLM hiệu quả.

Generatived

0:00 30/1/26

NVIDIA đã giới thiệu một kỹ thuật lập lịch mới có tên là Song song ngữ cảnh động (Dynamic Context Parallelism - Dynamic-CP) vào khung Megatron Core của mình, được thiết kế để cải thiện hiệu quả của việc huấn luyện mô hình ngôn ngữ (LLM) quy mô lớn và tạo video quy mô lớn. Kỹ thuật này tự động điều chỉnh kích thước song song ngữ cảnh (CP) của mỗi micro-batch, cho phép xử lý hiệu quả hơn các chuỗi có độ dài thay đổi thường thấy trong các tập dữ liệu thực tế. Việc triển khai Dynamic-CP đã chứng minh tốc độ tăng lên tới 1,48 lần trên các tập dữ liệu như vậy, cho thấy tiềm năng của nó trong việc tối ưu hóa tài nguyên tính toán.

Một thách thức trong việc huấn luyện các mô hình quy mô lớn nằm ở sự biến đổi về độ dài chuỗi trong dữ liệu, điều này có thể dẫn đến tắc nghẽn tính toán. Các kỹ thuật truyền thống như đóng gói ở cấp độ mẫu cố gắng giải quyết vấn đề này bằng cách đóng gói các chuỗi ngắn vào một micro-batch duy nhất. Tuy nhiên, bản chất bậc hai của cơ chế chú ý tích vô hướng có thể dẫn đến sự mất cân bằng trong khối lượng công việc tính toán và GPU nhàn rỗi. Dynamic-CP giải quyết những vấn đề này bằng cách điều chỉnh kích thước CP để phù hợp với các chuỗi đã được đóng gói, giảm thiểu sự thiếu hiệu quả trong tính toán và cải thiện việc sử dụng tài nguyên.

Dynamic-CP hoạt động bằng cách chọn kích thước CP phù hợp cho mỗi micro-batch dựa trên chiến lược đóng gói tối ưu được xác định bởi bộ giải. Bộ giải xem xét các chuỗi có độ dài thay đổi và tính toán kích thước CP và cách đóng gói hiệu quả nhất trong khi tuân thủ các ràng buộc về bộ nhớ GPU. Bộ giải nhằm mục đích giảm thiểu sự mất cân bằng song song dữ liệu và sự thiếu hiệu quả của CP bằng cách mô hình hóa chi phí tính toán và truyền thông. Cách tiếp cận động này trái ngược với các phương pháp tĩnh, vốn cố định kích thước CP dựa trên chuỗi dài nhất trong batch, điều này thường gây ra chi phí truyền thông CP không cần thiết.

Khung Megatron Core đã được sửa đổi để hỗ trợ Dynamic-CP. Điều này bao gồm việc xây dựng nhiều nhóm CP cho mỗi rank và giới thiệu một data_iterator_wrapper nhẹ để quản lý việc lập lịch lại động và đóng gói dữ liệu. Cách tiếp cận này giảm thiểu các thay đổi đối với logic lập lịch hiện có và đảm bảo thực thi nhất quán trên các giai đoạn của pipeline. Lợi ích của Dynamic-CP thể hiện rõ ở khả năng giảm thiểu các "bong bóng" trong pipeline và sự mất cân bằng song song dữ liệu, cải thiện đáng kể hiệu suất huấn luyện mô hình. Kho lưu trữ GitHub của Megatron Core cung cấp các tài nguyên cho những người quan tâm đến việc sử dụng các tối ưu hóa này để huấn luyện các mô hình với các chuỗi có độ dài thay đổi.

Chia sẻ bài viết này:

Tin tức mới nhất
Báo cáo của NVIDIA: Ứng dụng AI trong lĩnh vực dịch vụ tài chính tăng mạnh.

Báo cáo của NVIDIA: Ứng dụng AI trong lĩnh vực dịch vụ tài chính tăng mạnh.

0:00 26/1/26

Trí tuệ nhân tạo (AI) đã trở thành một công cụ quan trọng trong lĩnh vực dịch vụ tài chính, giúp nâng cao hiệu quả hoạt động từ phát hiện gian lận đến dịch vụ khách hàng.

ComfyUI ra mắt nền tảng Generative AI thân thiện với người dùng.

ComfyUI ra mắt nền tảng Generative AI thân thiện với người dùng.

0:00 26/1/26

Việc tạo nội dung bằng trí tuệ nhân tạo (AI) đang làm thay đổi ngành công nghiệp sáng tạo.

Các công ty toàn cầu bảo vệ cơ sở hạ tầng AI của họ bằng một nền tảng tích hợp.

Các công ty toàn cầu bảo vệ cơ sở hạ tầng AI của họ bằng một nền tảng tích hợp.

0:00 26/1/26

Trí tuệ nhân tạo (AI) đang làm thay đổi mạnh mẽ cách thức hoạt động của các doanh nghiệp, khiến vấn đề bảo mật trở nên đặc biệt quan trọng.

Bài giảng về Trí tuệ Nhân tạo Digirise dành cho Lực lượng Phòng vệ Trên không Chiến lược

Bài giảng về Trí tuệ Nhân tạo Digirise dành cho Lực lượng Phòng vệ Trên không Chiến lược

0:00 26/1/26

Công ty Digirise (quận Minato, Tokyo) đã trình bày bài giảng về "Chiến lược ứng dụng AI trong doanh nghiệp" tại Hội thảo R&D và Phát triển của Nhóm Thử nghiệm

Copyright © 2024 Generatived - All right Reserved.

Chia sẻ bài viết này:

Chia sẻ bài viết này:

Generatived AI Logo

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

  • Facebook
  • X

Hãy theo dõi chúng tôi

Ngôn ngữ

Tin tức mới nhất
Báo cáo của NVIDIA: Ứng dụng AI trong lĩnh vực dịch vụ tài chính tăng mạnh.

Báo cáo của NVIDIA: Ứng dụng AI trong lĩnh vực dịch vụ tài chính tăng mạnh.

0:00 26/1/26

Trí tuệ nhân tạo (AI) đã trở thành một công cụ quan trọng trong lĩnh vực dịch vụ tài chính, giúp nâng cao hiệu quả hoạt động từ phát hiện gian lận đến dịch vụ khách hàng.

ComfyUI ra mắt nền tảng Generative AI thân thiện với người dùng.

ComfyUI ra mắt nền tảng Generative AI thân thiện với người dùng.

0:00 26/1/26

Việc tạo nội dung bằng trí tuệ nhân tạo (AI) đang làm thay đổi ngành công nghiệp sáng tạo.

Các công ty toàn cầu bảo vệ cơ sở hạ tầng AI của họ bằng một nền tảng tích hợp.

Các công ty toàn cầu bảo vệ cơ sở hạ tầng AI của họ bằng một nền tảng tích hợp.

0:00 26/1/26

Trí tuệ nhân tạo (AI) đang làm thay đổi mạnh mẽ cách thức hoạt động của các doanh nghiệp, khiến vấn đề bảo mật trở nên đặc biệt quan trọng.

Bài giảng về Trí tuệ Nhân tạo Digirise dành cho Lực lượng Phòng vệ Trên không Chiến lược

Bài giảng về Trí tuệ Nhân tạo Digirise dành cho Lực lượng Phòng vệ Trên không Chiến lược

0:00 26/1/26

Công ty Digirise (quận Minato, Tokyo) đã trình bày bài giảng về "Chiến lược ứng dụng AI trong doanh nghiệp" tại Hội thảo R&D và Phát triển của Nhóm Thử nghiệm

bottom of page