Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

Nemotron ra mắt AI nâng cao dành cho hệ thống đa tác nhân.
Generatived
0:00 13/3/26
Một mô hình AI mới, Nemotron 3 Super, đã được giới thiệu để tăng cường khả năng của các hệ thống đa tác tử trong các ứng dụng phức tạp như phát triển phần mềm và an ninh mạng. Mô hình này tự hào có tổng kích thước tham số là 120 tỷ với 12 tỷ tham số hoạt động, được thiết kế để tối đa hóa hiệu quả tính toán và độ chính xác. Nó được phát hành sau Nemotron 3 Nano và nhằm mục đích khắc phục những thách thức của "bùng nổ ngữ cảnh" và "gánh nặng tư duy" cản trở hiệu suất của các hệ thống đa tác tử.
Nemotron 3 Super tích hợp kiến trúc hỗn hợp chuyên gia (MoE), giúp tăng đáng kể thông lượng so với phiên bản tiền nhiệm. Nó có cửa sổ ngữ cảnh 1 triệu token, cung cấp cho các tác tử bộ nhớ dài hạn để duy trì sự phù hợp mục tiêu và độ chính xác suy luận. Mô hình này được cung cấp công khai, với các trọng số, tập dữ liệu và công thức có thể truy cập, cho phép các nhà phát triển tùy chỉnh và triển khai nó theo nhu cầu của họ.
Kiến trúc của Nemotron 3 Super bao gồm một số cải tiến để cân bằng giữa hiệu quả và độ chính xác. Mô hình sử dụng Latent MoE để tham khảo ý kiến của nhiều chuyên gia mà không làm tăng chi phí suy luận và sử dụng dự đoán đa token (MTP) để giảm thời gian tạo chuỗi dài. Mô hình cũng tích hợp kiến trúc Hybrid Mamba-Transformer để tăng hiệu quả chuỗi và độ chính xác trong suy luận. Ngoài ra, nó được huấn luyện trước bằng NVFP4 trên NVIDIA Blackwell, giúp tăng hiệu quả bộ nhớ và tốc độ suy luận.
Nemotron 3 Super được huấn luyện thông qua một quy trình toàn diện bao gồm huấn luyện trước, tinh chỉnh có giám sát và học tăng cường đa môi trường. Chế độ huấn luyện này đảm bảo kiến thức thế giới rộng lớn, định hình hành vi cụ thể theo nhiệm vụ và tinh chỉnh các kết quả có thể kiểm chứng trong các môi trường đa dạng. Mô hình đã chứng minh hiệu suất vượt trội trên các bộ dữ liệu chuẩn cho các tác nhân tự động chạy dài hạn, chẳng hạn như bộ kiểm thử PinchBench. Các nhà phát triển quan tâm đến việc sử dụng Nemotron 3 Super có thể truy cập một loạt các tài nguyên, bao gồm các điểm kiểm tra tham số đầy đủ, công thức huấn luyện và đánh giá, và sách hướng dẫn triển khai, để tùy chỉnh và tối ưu hóa mô hình cho các trường hợp sử dụng cụ thể của họ.
Chia sẻ bài viết này:
Tin tức mới nhất
DryRun Security vạch trần những lỗ hổng của các tác nhân mã hóa AI
0:00 13/3/26
DryRun Security vừa công bố nghiên cứu mới cho thấy các tác nhân lập trình AI, mặc dù giúp tăng tốc quá trình phát triển phần mềm, lại có xu hướng tạo ra các lỗ hổng bảo mật.
Opinosis Analytics ra mắt công cụ đánh giá khả năng tích hợp AI.
0:00 13/3/26
West Jordan, UTAH – Để giải quyết những thách thức mà các tổ chức gặp phải trong việc khai thác trí tuệ nhân tạo, Opinosis Analytics đã giới thiệu một công cụ chẩn đoán mới.
Entity ra mắt bốn chip MTIA mới được tối ưu hóa bằng trí tuệ nhân tạo.
0:00 13/3/26
Công ty này đã công bố một kế hoạch đầy tham vọng nhằm phát triển và triển khai bốn thế hệ chip silicon tùy chỉnh mới trong vòng hai năm tới
Copyright © 2024 Generatived - All right Reserved.
Chia sẻ bài viết này:
Chia sẻ bài viết này:
Danh mục
Tin tức
AI và luật/hệ thống/kinh tế/xã hội
Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.
Tin tức mới nhất
DryRun Security vạch trần những lỗ hổng của các tác nhân mã hóa AI
0:00 13/3/26
DryRun Security vừa công bố nghiên cứu mới cho thấy các tác nhân lập trình AI, mặc dù giúp tăng tốc quá trình phát triển phần mềm, lại có xu hướng tạo ra các lỗ hổng bảo mật.
Opinosis Analytics ra mắt công cụ đánh giá khả năng tích hợp AI.
0:00 13/3/26
West Jordan, UTAH – Để giải quyết những thách thức mà các tổ chức gặp phải trong việc khai thác trí tuệ nhân tạo, Opinosis Analytics đã giới thiệu một công cụ chẩn đoán mới.
Entity ra mắt bốn chip MTIA mới được tối ưu hóa bằng trí tuệ nhân tạo.
0:00 13/3/26
Công ty này đã công bố một kế hoạch đầy tham vọng nhằm phát triển và triển khai bốn thế hệ chip silicon tùy chỉnh mới trong vòng hai năm tới



%20(1).webp)


