기사 메일전송

미디어젠, '한글 및 한국어 정보처리·한국코퍼스언어학회'서 대형언어모델 논문 발표

  • 기사등록 2024-10-14 16:32:31
기사수정
[더밸류뉴스=이명학 기자]

미디어젠(대표이사 송민규)이 한글 및 한국어 정보처리·한국코퍼스언어학회 공동 학술대회에서 대형언어모델(LLM) 관련 논문 2건을 발표했다.


미디어젠은 지난 11일부터 이틀간 열린 ‘한글 및 한국어 정보처리∙한국코퍼스언어학회 공동 학술대회(HCLT∙KACL)’에 참가했다고 14일 밝혔다. HCLT∙KACL는 지난 1989년 10월 처음 개최된 후 매년 한글날 전후 열린다. 올해 행사 주관은 네이버가, 주최는 한국정보과학회가 맡아 진행된다.


미디어젠, \ 한글 및 한국어 정보처리·한국코퍼스언어학회\ 서 대형언어모델 논문 발표최정윤 미디어젠 인공지능(AI) 연구소 연구원이 지난 11일부터 이틀간 열린 '한글 및 한국어 정보처리·한국코퍼스언어학회 공동 학술대회(HCLT·KACL)'에서 발표를 진행하고 있다. [사진=미디어젠]

미디어젠은 한국전자통신연구원(ETRI) 창업기업인 '딥모달'과 공동 연구한 대형언어모델(LLM) 관련 논문 2건을 발표했다. 논문은 △생성 확률 기반 신뢰도 측정(불공정 약관 심사) △고품질 문서 생성을 위한 파인튜닝 및 디코딩 방법 연구에 대한 주제다. 


첫번째 연구는 과기정통부와 정보통신산업진흥원이 주관하고, 공정거래위원회에서 추진하는 '부처협업기반 AI확산사업(AI융합 약관심사 플랫폼 구축)'에 적용될 AI모델이 실무에 적용 가능한지에 대한 선행연구 성격이다. LLM을 활용해 새로운 방식으로 문서의 신뢰도를 측정하고, 약관 심사 플랫폼에서 심사 대상 문서를 자동으로 판별하는 시스템에 대해 연구했다. 연구에는 기공개된 공정위 약관심사 데이터를 활용했다.


회사 측은 기존 방식보다 투명한 신뢰도 계산을 통해 법률 등 민감한 분야에서의 약관 검토에 활용도가 높다고 설명했다. 또 적은 양의 도메인 데이터로도 높은 신뢰도의 분류가 가능해 견고한 약관 심사 시스템을 구축할 수 있다고 덧붙였다. 


이어 ‘파인튜닝 및 디코딩 방법 연구’에 대한 발표를 통해 의료 영상 판독문 작성 시 진단 및 소견을 자동으로 생성하는 방법을 제시했다. 특히 대용량 데이터를 확보하기 어려운 의료 분야 상황을 고려해 적은 데이터로도 고품질 문서를 생성하는 최적의 방법을 탐색하고 평가했다.


myung092251@thevaluenews.co.kr

[저작권 ⓒ 더밸류뉴스. 무단 전재 및 재배포 금지]

'더밸류뉴스' 구독하기

개인정보 수집 및 이용

뉴스레터 발송을 위한 최소한의 개인정보를 수집하고 이용합니다. 수집된 정보는 발송 외 다른 목적으로 이용되지 않으며, 서비스가 종료되거나 구독을 해지할 경우 즉시 파기됩니다.

광고성 정보 수신

제휴 콘텐츠, 프로모션, 이벤트 정보 등의 광고성 정보를 수신합니다.
관련기사
TAG
0
기사수정
  • 기사등록 2024-10-14 16:32:31
기자프로필
프로필이미지
나도 한마디
※ 로그인 후 의견을 등록하시면, 자신의 의견을 관리하실 수 있습니다. 0/1000
삼성SDS
버핏연구소 텔레그램
기획·시리즈더보기
4차산업혁명더보기
제약·바이오더보기
모바일 버전 바로가기