top of page

Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

logo.png

Crusoe công bố giải pháp suy luận được quản lý dành cho các nhà phát triển AI

Generatived

0:00 24/11/25

SAN FRANCISCO, ngày 20 tháng 11 năm 2025 – Crusoe đã công bố dịch vụ mới nhất của mình, Crusoe Managed Inference, được thiết kế để nâng cao khả năng suy luận mô hình AI với tốc độ và khả năng mở rộng vượt trội. Hiện đã có sẵn trên Crusoe Cloud, dịch vụ này mang lại latency cực thấp và tốc độ xử lý mã thông báo đầu tiên (TTFT) ấn tượng, đáp ứng nhu cầu của các nhà phát triển AI đang xử lý các tác vụ phức tạp như tạo văn bản dài và tác nhân AI. Crusoe Managed Inference cho phép triển khai nhanh chóng và tự động mở rộng quy mô các mô hình sẵn sàng cho sản xuất, giúp đơn giản hóa quy trình phát triển.

Dịch vụ này được hỗ trợ bởi công cụ suy luận độc quyền của Crusoe, tích hợp công nghệ MemoryAlloy. Công nghệ bộ nhớ đệm KV toàn cụm này cho phép GPU truy cập tức thời vào bộ nhớ đệm tiền tố từ cả nút cục bộ và nút từ xa, tránh việc điền trước dư thừa. MemoryAlloy của Crusoe là một nền tảng bộ nhớ gốc cụm, đảm bảo tính liên tục của phiên và ngữ cảnh, đồng thời cho phép mở rộng liền mạch trên các cụm. Sự đổi mới này mang đến cho các nhà phát triển AI một phương pháp suy luận hiệu quả và tiết kiệm chi phí hơn.

Erwan Menard, Phó Chủ tịch Cấp cao phụ trách Sản phẩm tại Crusoe, đã nêu bật những thách thức mà các nhà phát triển phải đối mặt trong việc cân bằng tốc độ suy luận, thông lượng và chi phí cơ sở hạ tầng. Crusoe Managed Inference giải quyết những thách thức này bằng cách loại bỏ sự phức tạp của ngăn xếp suy luận, cho phép các nhà phát triển tập trung vào việc phát triển các ứng dụng AI tiên tiến mà không phải chịu gánh nặng quản lý cơ sở hạ tầng. Công nghệ MemoryAlloy của dịch vụ đảm bảo TTFT và thông lượng vượt trội, cải thiện đáng kể việc triển khai các ứng dụng AI quy mô lớn.

Crusoe Managed Inference là một phần của Crusoe Intelligence Foundry, một trung tâm toàn diện giúp đẩy nhanh quá trình phát triển mô hình đến sản xuất của các nhà phát triển AI. Foundry cung cấp quyền truy cập vào các mô hình nguồn mở hàng đầu, các điểm cuối được quản lý với tối ưu hóa MemoryAlloy, cùng các công cụ giám sát và cho phép lưu lượng được cung cấp ở quy mô lớn. Môi trường tích hợp này cho phép các nhóm chuyển đổi mượt mà giữa các tác vụ suy luận và quản lý tài nguyên cơ sở hạ tầng. Dịch vụ mới của Crusoe hiện đã có sẵn cho các nhà phát triển AI, những người có thể duyệt qua thư viện các mô hình hàng đầu và bắt đầu dự án của họ thông qua Crusoe Intelligence Foundry.

Chia sẻ bài viết này:

Tin tức mới nhất
Các tính năng AI mới của Omnissa nâng cao hiệu quả công việc kỹ thuật số

Các tính năng AI mới của Omnissa nâng cao hiệu quả công việc kỹ thuật số

0:00 20/11/25

Omnissa (Trụ sở chính: 010-016-0190) đã giới thiệu các khả năng AI mới cho nền tảng làm việc kỹ thuật số của mình thông qua trợ lý AI "Omni" và "dịch vụ đại lý AI Omnissa"

ORENDA WORLD Phát triển giáo dục kỹ sư cho kỷ nguyên AI

ORENDA WORLD Phát triển giáo dục kỹ sư cho kỷ nguyên AI

0:00 20/11/25

ORENDA WORLD (Minato-ku, Tokyo) đã có buổi thuyết trình trước khoảng 100 sinh viên đến từ Trường Cao đẳng Công nghệ Quốc gia Fukushima vào ngày 11 tháng 11 năm 2025.

Hội thảo AI ORENDA WORLD thành công

Hội thảo AI ORENDA WORLD thành công

0:00 20/11/25

ORENDA WORLD (Minato-ku, Tokyo) đã tổ chức "Hội thảo nội bộ về AI cải tiến doanh nghiệp" tại Holt Hall Oita để trang bị các kỹ năng ứng dụng cho Generative AI,

Đầu tư vào Hệ thống giám sát AI Plug and Play của Nhật Bản

Đầu tư vào Hệ thống giám sát AI Plug and Play của Nhật Bản

0:00 20/11/25

Plug and Play Japan (Shibuya-ku, Tokyo) đã công bố khoản đầu tư vào "Hệ thống Giám sát AI Mage" do AI Mage (Shibuya-ku, Tokyo) phát triển.

Copyright © 2024 Generatived - All right Reserved.

Chia sẻ bài viết này:

Chia sẻ bài viết này:

Generatived AI Logo

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

  • Facebook
  • X

Hãy theo dõi chúng tôi

Ngôn ngữ

Tin tức mới nhất
Các tính năng AI mới của Omnissa nâng cao hiệu quả công việc kỹ thuật số

Các tính năng AI mới của Omnissa nâng cao hiệu quả công việc kỹ thuật số

0:00 20/11/25

Omnissa (Trụ sở chính: 010-016-0190) đã giới thiệu các khả năng AI mới cho nền tảng làm việc kỹ thuật số của mình thông qua trợ lý AI "Omni" và "dịch vụ đại lý AI Omnissa"

ORENDA WORLD Phát triển giáo dục kỹ sư cho kỷ nguyên AI

ORENDA WORLD Phát triển giáo dục kỹ sư cho kỷ nguyên AI

0:00 20/11/25

ORENDA WORLD (Minato-ku, Tokyo) đã có buổi thuyết trình trước khoảng 100 sinh viên đến từ Trường Cao đẳng Công nghệ Quốc gia Fukushima vào ngày 11 tháng 11 năm 2025.

Hội thảo AI ORENDA WORLD thành công

Hội thảo AI ORENDA WORLD thành công

0:00 20/11/25

ORENDA WORLD (Minato-ku, Tokyo) đã tổ chức "Hội thảo nội bộ về AI cải tiến doanh nghiệp" tại Holt Hall Oita để trang bị các kỹ năng ứng dụng cho Generative AI,

Đầu tư vào Hệ thống giám sát AI Plug and Play của Nhật Bản

Đầu tư vào Hệ thống giám sát AI Plug and Play của Nhật Bản

0:00 20/11/25

Plug and Play Japan (Shibuya-ku, Tokyo) đã công bố khoản đầu tư vào "Hệ thống Giám sát AI Mage" do AI Mage (Shibuya-ku, Tokyo) phát triển.

bottom of page