NVIDIAは、状態空間アーキテクチャーを特徴とする洗練された言語モデルであるMamba-Chatモデルを導入した。この設計により、入力長が増加するにつれて計算上の課題に直面することが多い従来のトランスベースのモデルと比較して、より長いシーケンスをより効率的に処理できる。一方、Mamba-Chatのアーキテクチャーはシーケンスの長さに比例して拡張し、選択的フォーカスメカニズムを備えているため、大規模で複雑なデータセットを効果的に管理する機能が強化されている。

Mamba-Chatモデルは、サイバーセキュリティーを含むさまざまなアプリケーション向けに微調整されており、専門知識領域への適応性と可能性を示している。28億のパラメーター数を備えたこのモデルは、さまざまなタスクに優れており、チャットボットの対話からゲノミクスや時系列分析などの分野での複雑なデータ分析に至るまで、さまざまなアプリケーションに適している。

NVIDIAは、ブラウザーから直接Mamba-Chatにアクセスできるようにし、NGCカタログを介してモデルを操作するための簡単なインターフェイスをユーザーに提供する。個人はMamba-Chatプレーグラウンドにプロンプ​​トを入力し、完全に高速化されたスタック上で生成されるモデルの応答を観察できる。モデルをアプリケーションに統合したい場合は、NGCカタログにサインインしてNVIDIAクラウドクレジットにアクセスした後、APIも利用できる。

NVIDIA AI Enterpriseは、AIチームの生産性を向上させ、AIインフラストラクチャーのコストを削減し、概念実証から運用までシームレスに進行できるようにすることを目的としている。同社は、AIモデルが運用可能なビジネスツールに移行するにつれて、セキュリティー、信頼性、企業サポートの重要性を強調している。ユーザーは、NGCカタログのユーザーインターフェイスまたはAPIを通じてMamba-Chatを探索し、その機能を直接体験することをお勧めします。

ソース:NVIDIA Developer Blog