ServiceNowは、Hugging FaceおよびNVIDIAと協力して、コード生成用に設計されたオープンアクセスの大規模言語モデル(LLM)の新しいスイートであるStarCoder2の発売を発表した。これらのモデルは、パフォーマンス、透明性、コスト効率の向上が高く評価されている。BigCodeコミュニティーによって開発されたStarCoder2は、広範な619プログラミング言語でトレーニングされており、さらに改良して、さまざまな特殊なタスク用のエンタープライズアプリケーションに統合できる。

StarCoder2ファミリには3つの異なるモデルサイズが含まれており、それぞれが異なる機能と効率を提供する。ServiceNowは30億のパラメータモデルを提供し、Hugging FaceとNVIDIAはそれぞれ70億と150億のパラメータモデルを開発した。これらのモデルは、開発者の生産性を向上させ、イノベーションを促進することを目的として、コードの補完、要約、検索を容易にするために構築されている。

BigCodeプロジェクトの共同リーダーであるServiceNowのHarm de Vries氏とHugging FaceのLeandro von Werra氏は、オープンな科学コラボレーションと責任あるAI実践の促進におけるStarCoder2の重要性を強調した。彼らは、開発者の生産性を向上させ、AIを活用したコード生成ツールへの公平なアクセスを提供するというモデルの役割を強調した。NVIDIAのJonathan Cohen氏も、さまざまな業界にわたるコードLLMの潜在的な影響について言及し、これらのモデルの安全かつ倫理的な開発に言及した。

StarCoder2は、以前のものよりも大幅に大きい、The Stack v2として知られる新しい拡張的なコードデータセットによって支えられている。このデータセットと革新的なトレーニング手法により、モデルは幅広いプログラミング言語とコンテキストを理解できるようになる。これらのモデルは特定のビジネス データを使用して微調整することができ、組織は既に基本的なStarCoderモデルを活用してオーダーメイドの機能を作成している。ServiceNowのNow LLMとHugging FaceのStarChatアシスタントは、これらのモデルに基づいて構築されたアプリケーションの例です。

StarCoder2の機能の探索に興味のある開発者や組織は、BigCodeプロジェクトのGitHubページからモデルとサポートコードにアクセスできる。さらに、モデルはHugging Faceからダウンロードでき、NVIDIAの150億パラメータモデルは、NVIDIA AI Foundationモデルを通じて直接実験に利用できる。StarCoder2の詳細については、BigCodeプロジェクト専用のHugging Face ウェブサイトをご覧ください。

出典:プレスリリース