DataRobot は、AI における大規模言語モデル (LLM) の管理強化を目指して、シンガポール政府機関の取り組みと連携することを発表しました。シンガポール アジア テック x サミットで発表された「Project Moonshot」イニシアチブとの統合により、AI プロフェッショナルは導入リスクを評価および軽減するための新しいツールを利用できるようになります。これらのツールには、ベンチマークとレッドチーム演習のための共通フレームワークが含まれており、現在 DataRobot の最新製品リリースの一部となっています。

DataRobot の最高顧客責任者である Jay Schuren 氏は、Project Moonshot のテスト ツールキットを自社のプラットフォームに組み込むことに熱意を示しました。この統合は、LLM 評価をよりアクセスしやすくし、生成 AI の責任ある使用を促進することを目的としています。更新されたプラットフォームでは、ユーザーが LLM の動作と応答を変更できるガード モデルをアクティブ化できるため、AI アプリケーションへの信頼を構築できます。

Project Moonshot は、既存のCI/CDパイプラインに統合できる自動評価ツール、カスタマイズされた評価のためのベンチマーク リポジトリ、脱獄やカスタマイズされた攻撃を含む AI レッドチーム演習用の包括的なツールという 3 つの主要な機能を導入しています。AI Verify Foundation の運営委員会委員長である Ong Chen Hui 博士は、ユーザー フレンドリーなプラットフォームでレッドチーム演習とベンチマークを組み合わせた最初のオープン ソース ツールの 1 つとして Project Moonshot の重要性を強調し、生成 AI の安全性に向けた世界的なオープン ソースの取り組みに貢献していると述べました。

EDBI の CEO である Paul Ng 氏は、東南アジアにおける DataRobot の成長を支援し、同社のシンガポールでの拡大と、IMDA とのパートナーシップなどを通じて現地のイノベーションを促進する役割を称賛しました。Project Moonshot は、自信を持って生成 AI テクノロジーを導入するために必要なツールを現地の企業に提供します。DataRobot の AI Verify Foundation への参加と IMDA による認定は、AI ガバナンスとテスト フレームワークの推進に対する同社の取り組みを反映しています。

出典:プレスリリース