NABLAS(東京都文京区本郷)は、ChatGPTやGPT-4などの生成AIによる文章を特定する「当検出モデル」を開発したと発表。このモデルは、AIが作成した日本語のテキストを高い精度で識別できるという。フェイクニュースやフィッシングメールの検出、学術的な論文の信頼性確保、教育分野での利用が見込まれる。

同社によると、AIによる文章生成技術の進化に伴い、人間とAIの文章の区別が難しくなっている。これに対応するため、同社はこれまでのフェイク検出技術を活用し、新たな検出モデルを開発した。このモデルは、350文字以上の文章であれば、人間の文章が混在していてもAI生成部分を特定可能だ。

「当検出モデル」は、GPTシリーズによって生成された文章を対象に、文章をセグメントに分けて生成可能性のスコアを算出し、ラベル付けを行う。検出精度は88%と、他のツール「GPTZero」の71%を上回る結果を示している。検出条件は、300文字以上のテキストを使用し、オープンソースのデータセットで検証された。

NABLASは、今後も技術開発を進め、GPT以外の文章生成AIにも対応する予定だ。幅広い分野での活用が期待される中、同社はフェイク検出技術の向上と新たな生成手法への対応を進めていくとしている。AI生成文章検出モデルに関する問い合わせは、同社のウェブサイトから受け付けている。

出典:プレスリリース