top of page

Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

logo.png

Crusoe công bố giải pháp suy luận được quản lý dành cho các nhà phát triển AI

Generatived

0:00 24/11/25

SAN FRANCISCO, ngày 20 tháng 11 năm 2025 – Crusoe đã công bố dịch vụ mới nhất của mình, Crusoe Managed Inference, được thiết kế để nâng cao khả năng suy luận mô hình AI với tốc độ và khả năng mở rộng vượt trội. Hiện đã có sẵn trên Crusoe Cloud, dịch vụ này mang lại latency cực thấp và tốc độ xử lý mã thông báo đầu tiên (TTFT) ấn tượng, đáp ứng nhu cầu của các nhà phát triển AI đang xử lý các tác vụ phức tạp như tạo văn bản dài và tác nhân AI. Crusoe Managed Inference cho phép triển khai nhanh chóng và tự động mở rộng quy mô các mô hình sẵn sàng cho sản xuất, giúp đơn giản hóa quy trình phát triển.

Dịch vụ này được hỗ trợ bởi công cụ suy luận độc quyền của Crusoe, tích hợp công nghệ MemoryAlloy. Công nghệ bộ nhớ đệm KV toàn cụm này cho phép GPU truy cập tức thời vào bộ nhớ đệm tiền tố từ cả nút cục bộ và nút từ xa, tránh việc điền trước dư thừa. MemoryAlloy của Crusoe là một nền tảng bộ nhớ gốc cụm, đảm bảo tính liên tục của phiên và ngữ cảnh, đồng thời cho phép mở rộng liền mạch trên các cụm. Sự đổi mới này mang đến cho các nhà phát triển AI một phương pháp suy luận hiệu quả và tiết kiệm chi phí hơn.

Erwan Menard, Phó Chủ tịch Cấp cao phụ trách Sản phẩm tại Crusoe, đã nêu bật những thách thức mà các nhà phát triển phải đối mặt trong việc cân bằng tốc độ suy luận, thông lượng và chi phí cơ sở hạ tầng. Crusoe Managed Inference giải quyết những thách thức này bằng cách loại bỏ sự phức tạp của ngăn xếp suy luận, cho phép các nhà phát triển tập trung vào việc phát triển các ứng dụng AI tiên tiến mà không phải chịu gánh nặng quản lý cơ sở hạ tầng. Công nghệ MemoryAlloy của dịch vụ đảm bảo TTFT và thông lượng vượt trội, cải thiện đáng kể việc triển khai các ứng dụng AI quy mô lớn.

Crusoe Managed Inference là một phần của Crusoe Intelligence Foundry, một trung tâm toàn diện giúp đẩy nhanh quá trình phát triển mô hình đến sản xuất của các nhà phát triển AI. Foundry cung cấp quyền truy cập vào các mô hình nguồn mở hàng đầu, các điểm cuối được quản lý với tối ưu hóa MemoryAlloy, cùng các công cụ giám sát và cho phép lưu lượng được cung cấp ở quy mô lớn. Môi trường tích hợp này cho phép các nhóm chuyển đổi mượt mà giữa các tác vụ suy luận và quản lý tài nguyên cơ sở hạ tầng. Dịch vụ mới của Crusoe hiện đã có sẵn cho các nhà phát triển AI, những người có thể duyệt qua thư viện các mô hình hàng đầu và bắt đầu dự án của họ thông qua Crusoe Intelligence Foundry.

Chia sẻ bài viết này:

Tin tức mới nhất
Hợp tác Hexabase/InfiniCloud đ�ảm bảo hoạt động an toàn cho AI

Hợp tác Hexabase/InfiniCloud đảm bảo hoạt động an toàn cho AI

0:00 24/11/25

Hexabase (Quận Chiyoda, Tokyo) và InfiniCloud (Thành phố Shizuoka, Tỉnh Shizuoka) đã công bố quan hệ đối tác nhằm giải quyết vấn đề nan giải về sử dụng và bảo mật AI mà các công ty đang gặp phải.

ShiftPlus giới thiệu GPT-4.1 cho AI của chính quyền địa phương

ShiftPlus giới thiệu GPT-4.1 cho AI của chính quyền địa phương

0:00 24/11/25

ShiftPlus (Nishi-ku, Osaka) đã triển khai GPT-4.1-mini trong hệ thống "Municipal AI zevo" (Zevo Trí tuệ Nhân tạo Đô thị)

Ra mắt chức năng tạo hình ảnh AI SoftCreate

Ra mắt chức năng tạo hình ảnh AI SoftCreate

0:00 24/11/25

SoftCreate (Shibuya-ku, Tokyo) đã công bố việc bổ sung chức năng tạo hình ảnh vào Safe AI Gateway, một dịch vụ AI dành cho doanh nghiệp và tổ chức.

日立ソリューションズAI文書管理効率化

日立ソリューションズAI文書管理効率化

0:00 24/11/25

Hitachi Solutions (Shinagawa-ku, Tokyo) đã giới thiệu Generative AI) vào hệ thống quản lý tài liệu Katsubun Contents Lifecycle Manager và sẽ cung cấp một tùy chọn mới

Copyright © 2024 Generatived - All right Reserved.

Chia sẻ bài viết này:

Chia sẻ bài viết này:

Generatived AI Logo

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

  • Facebook
  • X

Hãy theo dõi chúng tôi

Ngôn ngữ

Tin tức mới nhất
Hợp tác Hexabase/InfiniCloud đảm bảo hoạt động an toàn cho AI

Hợp tác Hexabase/InfiniCloud đảm bảo hoạt động an toàn cho AI

0:00 24/11/25

Hexabase (Quận Chiyoda, Tokyo) và InfiniCloud (Thành phố Shizuoka, Tỉnh Shizuoka) đã công bố quan hệ đối tác nhằm giải quyết vấn đề nan giải về sử dụng và bảo mật AI mà các công ty đang gặp phải.

ShiftPlus giới thiệu GPT-4.1 cho AI của chính quyền địa phương

ShiftPlus giới thiệu GPT-4.1 cho AI của chính quyền địa phương

0:00 24/11/25

ShiftPlus (Nishi-ku, Osaka) đã triển khai GPT-4.1-mini trong hệ thống "Municipal AI zevo" (Zevo Trí tuệ Nhân tạo Đô thị)

Ra mắt chức năng tạo hình ảnh AI SoftCreate

Ra mắt chức năng tạo hình ảnh AI SoftCreate

0:00 24/11/25

SoftCreate (Shibuya-ku, Tokyo) đã công bố việc bổ sung chức năng tạo hình ảnh vào Safe AI Gateway, một dịch vụ AI dành cho doanh nghiệp và tổ chức.

日立ソリューションズAI文書管理効率化

日立ソリューションズAI文書管理効率化

0:00 24/11/25

Hitachi Solutions (Shinagawa-ku, Tokyo) đã giới thiệu Generative AI) vào hệ thống quản lý tài liệu Katsubun Contents Lifecycle Manager và sẽ cung cấp một tùy chọn mới

bottom of page