top of page

Generatived(Beta)|生成AIの最新ニュースとトレンドを提供

logo.png

Crusoe、AI開発者向けのマネージド推論を発表

Generatived

25/11/24 0:00

サンフランシスコ、2025年11月20日 – Crusoeは、AIモデル推論を卓越したスピードとスケーラビリティで強化することを目的とした最新サービス「Crusoe Managed Inference」を発表しました。Crusoe Cloudで一般提供が開始されたこのサービスは、超低レーテンシーと驚異的なTTFT(Time-to-First-Token)速度を実現し、長文テキスト生成やAIエージェントといった複雑なタスクに取り組むAI開発者のニーズに応えます。Crusoe Managed Inferenceは、本番環境対応モデルの迅速な導入と自動スケーリングを可能にし、開発プロセスを効率化します。

このサービスは、MemoryAlloyテクノロジーを組み込んだCrusoe独自の推論エンジンを搭載しています。このクラスター全体のKVキャッシュテクノロジーにより、GPUはローカルノードとリモートノードの両方からプレフィックスキャッシュに瞬時にアクセスでき、冗長なプリフィルを回避できます。CrusoeのMemoryAlloyは、永続的なセッションとコンテキストの継続性を確保し、クラスター間のシームレスなスケーリングを可能にするクラスターネイティブのメモリファブリックです。このイノベーションは、AI開発者に、より効率的で費用対効果の高い推論アプローチを提供します。

Crusoeの製品担当SVPであるErwan Menard氏は、開発者が推論速度、スループット、インフラコストのバランスを取る上で直面する課題について強調しました。Crusoe Managed Inferenceは、推論スタックの複雑さを排除することでこれらの課題に対処し、開発者がインフラ管理の負担なしに高度なAIアプリケーションの開発に集中できるようにします。このサービスのMemoryAlloyテクノロジーは、比類のないTTFTとスループットを保証し、大規模AIアプリケーションのデリバリーを大幅に向上させます。

Crusoe Managed Inferenceは、AI開発者のモデル開発から本番環境へのプロセスを加速する包括的なハブであるCrusoe Intelligence Foundryの一部です。このファウンドリーは、主要なオープンソースモデルへのアクセス、MemoryAlloy最適化を備えたマネージドエンドポイント、大規模展開におけるプロビジョニングされたスループットの監視と有効化のためのツールを提供します。この統合環境により、チームは推論タスクとインフラストラクチャリソース管理の間をスムーズに移行できます。Crusoeの新しいサービスはAI開発者向けに提供開始され、Crusoe Intelligence Foundryを通じてトップモデルのライブラリを閲覧し、プロジェクトを開始できます。

この記事を共有:

最新のニュース
アンドドット東大生協AI特別講義実施

アンドドット東大生協AI特別講義実施

25/11/20 0:00

アンドドット(東京都渋谷区)は、東京大学生協(東京都文京区)と共催で、東京大学の学生に向けた生成AIに関する特別講義を実施した。

AIデータ量子テクノロジー支援プラットフォーム

AIデータ量子テクノロジー支援プラットフォーム

25/11/20 0:00

AIデータ(東京都港区)は、日本政府のデジタル・科学技術戦略に基づき、「量子テクノロジー」分野に特化したAI基盤「AI Quantum on IDX」の提供を開始すると発表した。

売れるネット広告社AI動画制作効率化

売れるネット広告社AI動画制作効率化

25/11/20 0:00

売れるネット広告社グループ(福岡市)は、連結子会社を通じて動画制作における生成AIの活用を開始した。

Devolutions、AI強化型セキュアリモートデスクトップマネージャーを発表

Devolutions、AI強化型セキュアリモートデスクトップマネージャーを発表

25/11/20 0:00

Devolutionsは、リモートデスクトップマネージャー(RDM)プラットフォーム内のAIアシスタントの機能を強化するために設計された、セキュアな自動化レイヤーである、新しいモデルコンテキストプロトコル(MCP)サーバーを発表しました。

Copyright © 2024 Generatived - All right Reserved.

この記事を共有:

この記事を共有:

Generatived AI Logo

Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。

  • Facebook
  • X

フォローをお願いします

言語

最新のニュース
アンドドット東大生協AI特別講義実施

アンドドット東大生協AI特別講義実施

25/11/20 0:00

アンドドット(東京都渋谷区)は、東京大学生協(東京都文京区)と共催で、東京大学の学生に向けた生成AIに関する特別講義を実施した。

AIデータ量子テクノロジー支援プラットフォーム

AIデータ量子テクノロジー支援プラットフォーム

25/11/20 0:00

AIデータ(東京都港区)は、日本政府のデジタル・科学技術戦略に基づき、「量子テクノロジー」分野に特化したAI基盤「AI Quantum on IDX」の提供を開始すると発表した。

売れるネット広告社AI動画制作効率化

売れるネット広告社AI動画制作効率化

25/11/20 0:00

売れるネット広告社グループ(福岡市)は、連結子会社を通じて動画制作における生成AIの活用を開始した。

Devolutions、AI強化型セキュアリモートデスクトップマネージャーを発表

Devolutions、AI強化型セキュアリモートデスクトップマネージャーを発表

25/11/20 0:00

Devolutionsは、リモートデスクトップマネージャー(RDM)プラットフォーム内のAIアシスタントの機能を強化するために設計された、セキュアな自動化レイヤーである、新しいモデルコンテキストプロトコル(MCP)サーバーを発表しました。

bottom of page