top of page

Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

logo.png

Mẫu Kimi K2.5 được ra mắt dành cho các tác vụ AI đòi hỏi cao.

Generatived

0:00 6/2/26

Kimi vừa công bố Kimi K2.5, mô hình mới nhất trong dòng sản phẩm của hãng được thiết kế để mang lại hiệu năng vượt trội trong nhiều tác vụ đòi hỏi cao, bao gồm quy trình làm việc AI, trò chuyện, suy luận, lập trình và toán học. Mô hình này tận dụng khung phần mềm mã nguồn mở Megatron-LM, giúp tăng cường hiệu quả tính toán và tối ưu hóa GPU để huấn luyện các mô hình Transformer quy mô lớn. Kimi K2.5 sở hữu kiến ​​trúc với 384 chuyên gia và một lớp dày đặc duy nhất, cho phép định tuyến chuyên biệt cho các phương thức khác nhau và đạt tỷ lệ kích hoạt tham số ấn tượng là 3,2% trên mỗi token.

Mô hình Kimi K2.5 sở hữu vốn từ vựng toàn diện với khoảng 164.000 token, bao gồm cả các token chuyên dụng cho xử lý hình ảnh, để hỗ trợ các chức năng xử lý hình ảnh. Mô hình này tích hợp MoonViT3d Vision Tower, một thành phần chuyển đổi hình ảnh và khung hình video thành thông tin nhúng và tăng cường khả năng xử lý hình ảnh. Các nhà phát triển quan tâm đến việc sử dụng Kimi K2.5 có thể truy cập vào điểm cuối tăng tốc GPU miễn phí để tạo mẫu thông qua Chương trình Nhà phát triển NVIDIA. Ngoài ra, một dịch vụ vi mô NVIDIA NIM để suy luận trong môi trường sản xuất cũng sẽ sớm được cung cấp.

Đối với những ai muốn tích hợp Kimi K2.5 vào hệ thống của mình, mô hình này tương thích với API do NVIDIA cung cấp, có thể truy cập bằng cách đăng ký với Chương trình Nhà phát triển NVIDIA. Ngoài ra, mô hình có thể được tùy chỉnh và tinh chỉnh bằng cách sử dụng khung NeMo, cung cấp một bộ thư viện mở để huấn luyện mô hình có khả năng mở rộng và thích ứng với các tác vụ đa phương thức cụ thể. Thư viện NeMo AutoModel trong khung này cho phép huấn luyện thông lượng cao và thử nghiệm nhanh chóng, cung cấp cho các nhà phát triển và nhà nghiên cứu các công cụ linh hoạt để thúc đẩy các dự án của họ. Để biết thêm thông tin về khả năng của Kimi K2.5, hãy truy cập các trang mô hình Hugging Face và Kimi API Platform. Hoặc, bạn có thể thử nghiệm mô hình trực tiếp trên nền tảng xây dựng của NVIDIA.

Chia sẻ bài viết này:

Tin tức mới nhất
NVIDIA mở rộng khả năng dự đoán phức hợp protein bằng GPU.

NVIDIA mở rộng khả năng dự đoán phức hợp protein bằng GPU.

0:00 13/4/26

NVIDIA (California) đã báo cáo những tiến bộ trong dự đoán phức hợp protein quy mô lớn, mở rộng tập dữ liệu cấu trúc vượt ra ngoài các mô hình đơn phân.

NVIDIA cho phép lập lịch Slurm trên các cụm Kubernetes.

NVIDIA cho phép lập lịch Slurm trên các cụm Kubernetes.

0:00 13/4/26

NVIDIA (California) đã mô tả một phương pháp để chạy Slurm trên Kubernetes bằng cách sử dụng Slinky slurm-operator.

Microsoft phác thảo mô hình hoạt động an ninh mạng SOC dựa trên tác nhân

Microsoft phác thảo mô hình hoạt động an ninh mạng SOC dựa trên tác nhân

0:00 13/4/26

Microsoft (Washington) đã phác thảo mô hình “ SOC chủ động”, chuyển hoạt động bảo mật từ phản ứng thụ động sang dự đoán hành vi của kẻ tấn công và hạn chế các con đường tấn công.

AI Data ra mắt nền tảng GovOffice AI.

AI Data ra mắt nền tảng GovOffice AI.

0:00 13/4/26

Công ty AI Data (Tokyo) đã giới thiệu một nền tảng trí tuệ nhân tạo (AI) được thiết kế dành cho các cơ quan chính phủ

Copyright © 2024 Generatived - All right Reserved.

Chia sẻ bài viết này:

Chia sẻ bài viết này:

Generatived AI Logo

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

  • Facebook
  • X

Hãy theo dõi chúng tôi

Ngôn ngữ

Tin tức mới nhất
NVIDIA mở rộng khả năng dự đoán phức hợp protein bằng GPU.

NVIDIA mở rộng khả năng dự đoán phức hợp protein bằng GPU.

0:00 13/4/26

NVIDIA (California) đã báo cáo những tiến bộ trong dự đoán phức hợp protein quy mô lớn, mở rộng tập dữ liệu cấu trúc vượt ra ngoài các mô hình đơn phân.

NVIDIA cho phép lập lịch Slurm trên các cụm Kubernetes.

NVIDIA cho phép lập lịch Slurm trên các cụm Kubernetes.

0:00 13/4/26

NVIDIA (California) đã mô tả một phương pháp để chạy Slurm trên Kubernetes bằng cách sử dụng Slinky slurm-operator.

Microsoft phác thảo mô hình hoạt động an ninh mạng SOC dựa trên tác nhân

Microsoft phác thảo mô hình hoạt động an ninh mạng SOC dựa trên tác nhân

0:00 13/4/26

Microsoft (Washington) đã phác thảo mô hình “ SOC chủ động”, chuyển hoạt động bảo mật từ phản ứng thụ động sang dự đoán hành vi của kẻ tấn công và hạn chế các con đường tấn công.

AI Data ra mắt nền tảng GovOffice AI.

AI Data ra mắt nền tảng GovOffice AI.

0:00 13/4/26

Công ty AI Data (Tokyo) đã giới thiệu một nền tảng trí tuệ nhân tạo (AI) được thiết kế dành cho các cơ quan chính phủ

bottom of page