HSS研究者らが米国整形外科医学会年次総会で発表した最近の研究では、AIチャットボット、具体的にはChatGPTバージョン3.5が、頸椎手術に関連する医学的質問に答える際に期待できるレベルの精度を示していることが明らかになった。この研究では、チャットボットにこのテーマに関する9つの重要な質問を入力し、2人の独立した頸椎外科専門家によって正確さと明瞭さが評価された。

質問設計プロセスには参加していない専門家がチャットボットの回答を評価し、平均スコアは10点中8.1だった。回答の正確性は5点中3.9、適切性は3点中2.2と評価された。しかし、ChatGPTの回答には深みが欠けており、患者固有の要因や手術の複雑さに影響を与える外科医の専門知識などの重要な詳細が抜け落ちている場合があると彼らは指摘した。

指摘された欠点にもかかわらず、チャットボットの応答は学術論文よりもアクセスしやすく、高校3年生に適した読みやすさのレベルであると考えられた。専門家らはまた、ユーザーが専門の医療相談を受けるようチャットボットが一貫したアドバイスを行っていることを強調し、提供される情報に一層の注意を払った。

HSS研究チームは、患者の情報探索行動におけるAIの使用をさらに深く掘り下げる予定だ。彼らの目標は、AIが提供する情報の質を向上させ、利用可能な中で最も信頼できる正確な医療アドバイスをユーザーに確実に提供することだ。

出典:プレスリリース