Generatived(Beta)|生成AIの最新ニュースとトレンドを提供
.webp)
Kinara、「Ara-2 Edge AI Processor」を発表
Generatived
23/12/13 10:01
Kinara™, Inc.は、エッジサーバーとラップトップを強化するために設計された新しいチップである Ara-2 Edge AI processorを導入した。このプロセッサーは、ビデオ分析やトランスフォーマーアーキテクチャーに基づくものを含むさまざまなAIモデルなどのアプリケーションを効率的に処理できるように調整されている。Ara-2は、前モデルに比べて大幅なパフォーマンスの飛躍を誇り、Ara-1の5 ~ 8倍のパワーを提供する。この進歩は、オンチップメモリーとオフチップ帯域幅のバランスをとり、大規模なモデルを最小限のレーテンシーで実行できるようにする機能によるものだ。
同社の最新の製品は、大規模言語モデル(LLM)と生成AIに対する需要の高まりに対応している。これらは従来、データセンターのGPUに依存しており、高いレーテンシーとコスト、さらにはプライバシーの懸念を引き起こしていた。KinaraのAra-2は、数十億のパラメータを持つ複雑なAIモデルをエッジデバイス上で直接実行できるようにすることで、これらの問題を軽減することを目指している。プロセッサーのコンピューティング エンジンと付属のソフトウェア開発キット(SDK)は、FP32の直接サポートに加え、正確な量子化と動的に調整するホストランタイムをサポートするように設計されており、高価なGPUの実行可能な代替手段となるという。
昨年10月の戦略的な動きとして、Kinaraは、システムアーキテクチャーを簡素化し、より協力的でオープンなAIエコシステムを促進するという共通の目標を掲げ、Ampereが主導するAI Platform Allianceに参加した。このパートナーシップにより、従来のGPUセットアップと比較して、優れたパフォーマンスと、電力効率とコスト効率の向上が期待される。Ampereのリーダーシップは、AIソリューションの提供を変革するコラボレーションの可能性について熱意を表明しているという。
セキュリティーもAra-2の重要な機能であり、セキュアブート、暗号化メモリー アクセス、安全なホストインターフェイスが含まれており、エンタープライズAI導入の厳しい要件に応える。Kinaraはさらに、モデルコンパイラ、計算ユニット スケジューラー、および複数のチップを備えたシステム用のロードバランサーを含む堅牢なSDKでプロセッサーをサポートする。SDKは、Kinaraの統合量子化機能や、PyTorchやTFLiteの事前量子化モデルとの互換性など、柔軟な量子化オプションも提供し、開発者向けの包括的なツールキットを保証するとのことだ。
最新のニュース
TOUCH TO GO次世代AI販促デバイス発売
26/2/18 0:00
TOUCH TO GO(東京都港区)は、AIを活用した次世代AI販促デバイス「TTG-HELLO」を2026年3月20日に発売する。
Copyright © 2024 Generatived - All right Reserved.
ニュース
Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。
最新のニュース
TOUCH TO GO次世代AI販促デバイス発売
26/2/18 0:00
TOUCH TO GO(東京都港区)は、AIを活用した次世代AI販促デバイス「TTG-HELLO」を2026年3月20日に発売する。



%20(1).webp)


