JAMA networkによる最近の研究で、研究者は、公衆衛生の質問に対して正確で根拠に基づいた回答を提供するAIアシスタントであるChatGPTの有効性を評価した。この研究は、ユーザーを適切なリソースに紹介しながら、様々な健康上の懸念を認識し対処するChatGPTの能力を評価することを目的としており、公衆衛生コミュニケーションを変革するAIアシスタントの可能性を浮き彫りにする結果が得られたという。

方法論と結果

この研究では、ChatGPTに依存症、対人暴力、メンタルヘルス、身体的健康に関連する23の質問が投げかけられた。その回答を、質問に対する回答の有無、回答の根拠、関連リソースの提供の有無に基づいて評価した結果、ChatGPTは23の質問全てを認識して回答することに成功し、91%の回答がエビデンスベースであると判定された。しかし、特定のリソースを紹介する回答は22%にとどまった。

他のAIアシスタントとの比較

過去のAIアシスタントのベンチマーク評価との比較では、ChatGPTは例外的に高いパフォーマンスを示したという。依存症関連の質問を認識し、紹介を行うという点で、ChatGPTはAmazon Alexa、Apple Siri、Google Assistant、MicrosoftのCortana、SamsungのBixbyといった人気のAIアシスタントを大きく上回ることが想定される。

意味合いと今後の方向性

ChatGPTのエビデンスに基づく回答能力は評価できるが、本研究では、AIアシスタントがユーザーを適切なリソースに誘導することも重要であることを強調している。効果的なリソースを普及させ、AI対応に組み込むためのガイドラインを確立するためには、公衆衛生機関とAI企業の協力が不可欠であり、このようなパートナーシップはAIアシスタントが実用的な情報を提供し、公衆衛生の取り組みに貢献することを担保するものと考えられる。

制限と考慮事項

質問のサンプルが限られていること、ChatGPTの回答が時間経過とともに変化する可能性があることなど、調査には限界もある。本調査で使用された標準的な言語は、一般の人々がどのように助けを求めるかを完全に反映していない可能性があり、フォローアップの質問も含まれていない。また、ChatGPTの確率論的な回答は現在も改良が続けられており、その性能はユーザーによって異なる可能性もある。

この研究は、ChatGPTのようなAIアシスタントが、一般市民に正確で根拠に基づいた情報を提供する可能性を示している。さらなる改良とAI企業と公衆衛生機関の協力により、これらのツールは、個人が自分の健康と幸福について十分な情報を得た上で意思決定できるようにする上で重要な役割を果たすだろう。