EdgeCortix(東京都中央区)は、エネルギー効率に優れたAI処理を行う次世代エッジAIアクセラレータ「SAKURA-II」を発表した。このプラットフォームは、同社の第2世代Dynamic Neural Acceleratorアーキテクチャを採用し、生成系AIタスクに特化している。柔軟性と省電力設計により、エッジ環境下での複雑なAIタスクを効率的に処理可能だ。

SAKURA-IIは、製造業やインダストリー4.0、セキュリティ分野など幅広い用途に適用できる。DNA-IIエンジンを搭載し、複数のディープニューラルネットワークモデルを低遅延で実行する。8ビット整数演算では最大60TOPS、16ビット浮動小数点演算では30TFLOPSの性能を誇り、混合精度にも対応している。

同社のMERAソフトウェアは、異なるコンパイラプラットフォームや高度な量子化、モデルキャリブレーション機能を備えている。PyTorchやTensorFlow Lite、ONNXなどの主要な開発フレームワークに対応し、AI推論の合理化とデータサイエンティストの作業時間短縮に貢献する。Hugging Face Optimumとの連携も可能だ。

サキャシンガ・ダスグプタCEOは、「SAKURA-IIは、エッジでの生成系AIソリューションにとって重要な技術」と述べ、同製品の高性能とコスト効率を強調した。SAKURA-IIは、M.2モジュールとPCIeカードの形態で提供され、予約受付を開始し、2024年後半の納品を予定している。

出典:プレスリリース