AI 의사는 의료 서비스를 더 좋고 더 배려하게 만들 것입니다.
누구도 챗봇으로부터 섬세한 느낌을 기대하지 않습니다. 물론, 일부 꾸며낸 사실과 약간의 무작위적인 인종차별이 포함된 평범한 글쓰기입니다. 나는 AI의 단점에 대해 직접 썼습니다.
그러나 우리가 알고 있듯이 이러한 거대하고 새로운 챗봇은 프롬프트와 질문에 대해 사람처럼 들리는 응답을 생성할 수도 있습니다. 그리고 최근의 직접 테스트에서 이 기능은 모든 활동 중에서 가장 본질적으로 인간이 해야 할 활동 중 하나인 의사 역할에서 봇에게 놀라운 우월성을 부여했습니다.
테스트를 수행하기 위해 샌디에이고에 있는 캘리포니아 대학의 연구원 팀이 등록되고 검증된 의료 전문가가 사람들의 의학적 질문에 답변하는 Reddit 포럼인 r/AskDocs에 잠복했습니다. 연구원들은 어리석게 들리는 질문("이쑤시개를 삼켰더니 친구가 내가 죽을 거라고 했어요")부터 무서운 질문("정상 초음파 검사를 받고 하루 만에 유산을 했다고요?")까지 포럼에서 약 200개의 대표적인 질문을 선택했습니다. 그런 다음 ChatGPT 봇의 가상 공간에 질문을 입력하고 별도의 의료 전문가 그룹이 AI와 MD의 답변에 대한 블라인드 평가를 수행하도록 했습니다.
결과는 충격적이었습니다. 우선, ChatGPT는 유용성 면에서 인간 의사보다 훨씬 앞서 나갔습니다. 거의 변함없이 챗봇의 답변은 불쌍한 인간의 답변보다 3~4배 더 신뢰할 수 있는 것으로 평가되었습니다. 더욱이, 봇은 다른 상황에서 흔히 볼 수 있는 것을 꾸며내려는 괴로운 경향을 전혀 보여주지 않았습니다.
하지만 가장 눈에 띄는 부분은 다음과 같습니다. 챗봇의 답변은 평균적으로 인간의 답변보다 7배 더 공감적이라는 평가를 받았습니다. 일곱 번! 그들은 귀하가 의사에게 원하는 것, 즉 치료와 정서적 연결을 제공했습니다. 마치 무감정한 안드로이드 미스터 데이터가 크러셔 박사의 편안한 침대 옆 태도를 설득력 있게 모방하는 방법을 알아낸 것 같습니다.
이제 공감을 표현하기 위해 인간 의사를 때리는 기준이 낮다는 것은 인정합니다. 그럼에도 불구하고 봇이 스타일과 내용 모두에서 의학적 문제를 처리할 수 있는 명백한 시설은 이러한 일에 대한 실제적이고 실제적인 사용을 예고합니다. 나는 대규모 언어 모델로 구동되는 AI 봇이 저널리즘에 혁명을 일으키거나 심지어 인터넷 검색을 더 좋게 만들 것이라는 데 회의적입니다. 나는 소프트웨어 코딩과 스프레드시트 분석을 가속화할 것이라는 생각에 열려 있다고 생각합니다. 하지만 이제는 약간의 수정을 통해 챗봇이 사람들이 의료 서비스 제공자 및 무너진 의료 산업 단지와 상호 작용하는 방식을 근본적으로 개선할 수 있다고 생각합니다.
공감 실험의 요점은 ChatGPT가 의사나 간호사를 대체할 수 있다는 것을 보여주는 것이 아니었습니다. 챗봇이 돌봄 제공에 역할을 할 수 있다는 것을 보여주기 위한 것이었습니다. 우리의 영리 의료 시스템은 충분한 의사와 간호사를 고용하지 않으며, 고용한 사람들이 조립 라인 스타일로 점점 더 많은 환자를 치료할 것으로 기대합니다. 부자가 되는 사람들 외에는 누구도 그것을 좋아하지 않습니다.
새 논문의 주 저자이자 UC 샌디에고 컴퓨터 전염병학자인 존 에이어스(John Ayers)는 "사람들은 의료 서비스와 단절되어 절망적입니다."라고 말했습니다. 그래서 그들은 r/AskDocs와 같은 포럼에서 답변을 찾고 있습니다. "현재 환자들은 이렇게 하고 있습니다. 의사들은 이에 동의하지 않았습니다."
그러한 메시지에 답해야 한다는 압박감이 더욱 강해졌습니다. 코로나19 팬데믹으로 인해 의사와 환자 사이의 원격 온라인 접촉이 가속화되었으며, 팬데믹이 발생한 첫 해에도 의사들은 이메일 받은 편지함을 처리하는 데 매일 거의 한 시간을 소비한 것으로 나타났습니다. 다른 전자 의료 기록 기술을 다루는 것을 추가하면 일부 의사는 매일 이러한 앞뒤로 시간의 절반을 바치게 됩니다. 보험은 종종 메시지에 응답하는 데 소요된 시간에 대해 비용을 청구하므로 대면 상호 작용을 넘어 잠재적인 수익원이 됩니다.
이전 연구에서는 환자와 의사가 이러한 메시징 시스템을 사용하는 것을 좋아하는지 물었습니다. Ayers는 시스템이 실제로 작동하는지 살펴보았습니다. "우리는 실제 메시지를 사용했습니다"라고 그는 말합니다. "아무도 전에는 그런 일을 한 적이 없습니다." 상호 작용의 품질을 기반으로 한 결과는 확실했습니다. Ayers는 "ChatGPT가 압도적인 승리를 거두었습니다."라고 말했습니다. "이 물건은 아마도 황금 시간대에 준비되었을 것입니다."