top of page

Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

logo.png

Microsoft công bố mở rộng Microsoft 365 Copilot.

Generatived

0:00 11/3/26

NVIDIA Megatron Core đã trở thành một khung sườn quan trọng để huấn luyện các mô hình ngôn ngữ quy mô lớn, nhờ vào thư viện mã nguồn mở cung cấp khả năng song song hóa vượt trội và hiệu năng tối ưu hóa cho GPU. Khung sườn này hiện đang được phát triển theo phương pháp ưu tiên GitHub, cho phép sự tham gia rộng rãi hơn của cộng đồng và khả năng thích ứng cho việc phát triển các mô hình AI trong tương lai.

Viện Đổi mới Công nghệ (TII) đã có những đóng góp đáng kể cho Megatron Core, đặc biệt là việc tích hợp dòng mô hình Falcon. Việc TII triển khai kiến ​​trúc lai song song Falcon-H1 trong Megatron Bridge là một ví dụ nổi bật, giải quyết được sự phức tạp trong việc phối hợp các lớp Transformer và Mamba không đồng nhất với các bộ nhân µP không thể học được. Ngoài ra, TII đã tích hợp BitNet vào Megatron Core, thay thế các lớp tuyến tính tiêu chuẩn bằng các lớp tham số tam phân, nâng cao hiệu quả huấn luyện và khả năng mở rộng.

Những tiến bộ này minh họa tiềm năng cho người dùng Megatron Core trong việc tùy chỉnh khung phần mềm để phù hợp với các kiến ​​trúc mô hình độc đáo và các chức năng huấn luyện phức tạp. Việc tích hợp kiến ​​trúc lai Falcon-H1 vào Megatron Bridge đòi hỏi TII phải vượt qua những thách thức kỹ thuật đáng kể, dẫn đến một số đổi mới về kiến ​​trúc. Điều này bao gồm việc phát triển một hệ thống đặc tả lớp thống nhất và ánh xạ trọng lượng chuyên biệt cho việc chuyển đổi điểm kiểm tra, đảm bảo tích hợp liền mạch với hệ sinh thái Megatron.

Hơn nữa, việc TII tích hợp BitNet cho dòng Falcon Edge vào Megatron Core đánh dấu một bước tiến hướng tới quy trình huấn luyện trước có khả năng mở rộng với các mô hình ngôn ngữ 1-bit. Sự tích hợp này duy trì khả năng tương thích với các tính năng song song và hiệu năng của Megatron, đồng thời giới thiệu các lớp tuyến tính song song mới với logic lượng tử hóa BitNet. Kết quả là một mô hình có dung lượng bộ nhớ giảm và tốc độ suy luận nhanh hơn, mà không ảnh hưởng đến chất lượng cập nhật của trình tối ưu hóa.

Những cải tiến này đối với Megatron Core và Megatron Bridge của TII thể hiện nỗ lực hợp tác trong cộng đồng AI nhằm nâng cao khả năng của các mô hình nền tảng. Người dùng quan tâm đến việc tận dụng những đóng góp này có thể truy cập chúng thông qua các kho lưu trữ GitHub tương ứng, nơi họ có thể khám phá quá trình huấn luyện trước BitNet, hỗ trợ lớp ParallelHybrid, chuyển đổi điểm kiểm tra Falcon-H1 và xử lý bộ nhân µP.

Chia sẻ bài viết này:

Tin tức mới nhất
Feedforce Answer IO hiện đã hỗ trợ GPT-5.4.

Feedforce Answer IO hiện đã hỗ trợ GPT-5.4.

0:00 11/3/26

Feedforce (Minato-ku, Tokyo) đã bổ sung hỗ trợ cho mô hình "GPT-5.4" của OpenAI vào dịch vụ "Answer IO" của mình, dịch vụ này trực quan hóa điểm số thương hiệu trong

Minh chứng hiệu quả của trí tuệ nhân tạo tại Bệnh viện Thành phố Nagano

Minh chứng hiệu quả của trí tuệ nhân tạo tại Bệnh viện Thành phố Nagano

0:00 11/3/26

Bệnh viện thành phố Nagano (thành phố Nagano, tỉnh Nagano) đã chứng minh rằng việc sử dụng trợ lý Trí tuệ Generative AI)

Thông báo hỗ trợ Chatsense của Knowledge Sense

Thông báo hỗ trợ Chatsense của Knowledge Sense

0:00 11/3/26

KnowledgeSense (quận Minato, Tokyo) thông báo rằng dịch vụ trợ lý ảo Generative AI dành cho doanh nghiệp, ChatSense, hiện đã tương thích với Nano Banana 2 của Google.

Aurora Mobile ra mắt tính năng EngageLab Omni Connect

Aurora Mobile ra mắt tính năng EngageLab Omni Connect

0:00 11/3/26

Aurora Mobile vừa ra mắt EngageLab Omni Connect, một tính năng mới được bổ sung vào nền tảng tương tác khách hàng ưu tiên trí tuệ nhân tạo (AI) của hãng, EngageLab.

Copyright © 2024 Generatived - All right Reserved.

Chia sẻ bài viết này:

Chia sẻ bài viết này:

Generatived AI Logo

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

  • Facebook
  • X

Hãy theo dõi chúng tôi

Ngôn ngữ

Tin tức mới nhất
Feedforce Answer IO hiện đã hỗ trợ GPT-5.4.

Feedforce Answer IO hiện đã hỗ trợ GPT-5.4.

0:00 11/3/26

Feedforce (Minato-ku, Tokyo) đã bổ sung hỗ trợ cho mô hình "GPT-5.4" của OpenAI vào dịch vụ "Answer IO" của mình, dịch vụ này trực quan hóa điểm số thương hiệu trong

Minh chứng hiệu quả của trí tuệ nhân tạo tại Bệnh viện Thành phố Nagano

Minh chứng hiệu quả của trí tuệ nhân tạo tại Bệnh viện Thành phố Nagano

0:00 11/3/26

Bệnh viện thành phố Nagano (thành phố Nagano, tỉnh Nagano) đã chứng minh rằng việc sử dụng trợ lý Trí tuệ Generative AI)

Thông báo hỗ trợ Chatsense của Knowledge Sense

Thông báo hỗ trợ Chatsense của Knowledge Sense

0:00 11/3/26

KnowledgeSense (quận Minato, Tokyo) thông báo rằng dịch vụ trợ lý ảo Generative AI dành cho doanh nghiệp, ChatSense, hiện đã tương thích với Nano Banana 2 của Google.

Aurora Mobile ra mắt tính năng EngageLab Omni Connect

Aurora Mobile ra mắt tính năng EngageLab Omni Connect

0:00 11/3/26

Aurora Mobile vừa ra mắt EngageLab Omni Connect, một tính năng mới được bổ sung vào nền tảng tương tác khách hàng ưu tiên trí tuệ nhân tạo (AI) của hãng, EngageLab.

bottom of page