엔씨소프트(대표이사 김택진)가 음성 AI 학회 ‘인터스피치’에 4년 연속 논문을 게재하며 음성 AI 기술 세계 정상급을 알렸다.
올해로 24주년을 맞은 인터스피치는 음성 AI 분야 세계 최대 규모 학회 중 하나다. 전 세계 자연어 처리, 음성인식 인공지능 전문가와 언어 및 음성학자들이 참여하고 있다. 인터스피치가 진행하는 ‘인터스피치(INTERSPEECH) 2023’ 행사는 오는 8월 20일(현지 시각)부터 나흘 간 아일랜드 더블린에서 열린다. ‘전인류적 포용’을 주제로 성별, 언어, 억양에 관계없이 누구에게나 가치 있고 유용한 음성기술에 대한 연구 내용이 발표될 예정이다.
엔씨소프트 AI 센터 산하 ‘스피치 에이아이 랩(Speech AI Lab)’ 조직은 그동안 세계적인 권위를 가진 AI 학회에 관련 연구 결과들을 공유해왔다. 인터스피치에도 4년 연속 논문을 게재하고 있고 올해 3편의 논문이 채택됐다. 올해 게재된 논문의 주제는 사용자 정의 호출어 인식 기술, 기존 감정인식 기술을 대폭 개선한 새로운 멀티모달 감정인식 기술 개발, 서버 통신 없이 웹브라우저에서 구동 가능한 고속/경량의 호출어 인식 모델 제안이다. 사람과 AI 사이에서 자연스러운 상호작용을 이뤄내기 위한 기반 기술에 대한 내용을 담고 있다.
엔씨소프트는 앞으로도 음성 기술과 모든 소리를 아우를 수 있는 청각 지능 연구를 진행하고 이를 통해 진정한 디지털 휴먼 완성에 기여하겠는 포부를 밝혔다.