가톨릭대(총장 원종철) 연구팀이 검색엔진 쿼리를 활용한 코로나19 확진자 예측 AI 기술을 개발, 최고 국제 학술지에 논문을 게제하며 연구의 우수성을 입증했다.
인공지능학과 학부생이 주 연구자로 참여한 연구팀이 단어 임베딩 기반 쿼리(Query, 데이터베이스나 데이터 리포지토리 시스템에서 데이터나 정보를 요청하는 것) 확장 기술을 활용해, 실시간 대중의 관심사 변화를 반영하는 검색엔진 쿼리를 자동으로 발견, 이를 기반으로 코로나19 확진자 수를 효과적으로 예측하는 AI 기술을 개발했다.
이번 연구는 인공지능학과 정동화·김강민 교수팀과 의정부성모병원 임광일 교수팀의 협업으로 진행돼, 가톨릭대 인공지능학과 안성호 학사과정생과 의정부성모병원 임광일 교수가 공동 제1 저자로 활약했다. 연구 결과는 첨단 헬스케어 분야의 최고 국제 학술지인 ‘JMIR(Journal of Medical Internet Research, IF 7.4, JCR 랭킹 상위 2.4%)’에 게재되며, 연구의 우수성을 인정받았다.
기존 연구의 검색엔진 쿼리 데이터 활용에서 쿼리 선택을 전문가 지식에 의존하는 방식을 한계라 보고, 언론 기사가 대중의 주요 관심사를 대변한다는 점을 고려했다. 코로나19 관련 언론 기사 텍스트 데이터를 활용해 검색엔진 쿼리를 선택하는 단어 임베딩 기반 쿼리 확장 방법론을 개발했다. 이후 언론 기사에서 검색엔진 쿼리를 4개월 단위로 자동 추출하고, 이를 활용해 1~14일 후 확진자 수를 사전에 예측하는 AI 기술 개발에 성공했다.
연구 결과, 이번에 개발된 AI 기술이 기존 전문가 지식 기반의 쿼리를 활용한 방법론보다 코로나19 확진자 수 예측 정확도가 뛰어났으며, 특히 9~11일 후 확진자 수 예측 적중률이 높았다. 메르스와 같은 과거 전염병 사례에도 적용해 보았을 때, 확진자 수와 높은 상관관계를 보이는 쿼리들을 발견했다.
안성호 가톨릭대 인공지능학과 4학년 학생은 “해당 기술을 통해 전문가 개입 없이도 대중의 관심 변화를 실시간으로 반영할 수 있어, 이전보다 더 신속하고 간편하게 감염병 확진자 수를 예측할 수 있다”며 “미래 전염병 예측 및 의료 AI 분야에서 유용한 도구가 될 것”이라고 말했다.
정동화 가톨릭대 인공지능학과 교수는 “인공지능학과 1기 입학생인 안성호 학생이 학술연구장학생 주제를 확장해 습득한 이론과 방법론을 실제 연구에 적용하고 최상위 국제 학술지에 논문을 게재하는데 성공했다”며 “이번 연구는 학부생 신분으로도 높은 수준의 연구를 수행할 수 있음을 보여주는 좋은 사례다”고 말했다.
이번 연구는 한국연구재단의 개인연구사업-생애 첫 연구 및 과학기술정보통신부 정보통신기획평가원(IITP)의 학·석사 연계 ICT핵심인재 양성사업의 연구비와 우수신진연구사업의 연구비를 지원받아 진행됐다.