한국어 범용 언어 모델에 해당하는 글 1

SK텔레콤-국립국어원, AI 한국어 모델 개발한다

IT|2021. 4. 12. 00:01
728x90
반응형

SKT 데이비스 에릭 하트먼 Language Superintelligence Labs장(좌) 국립국어원 정희원 어문연구실장(우) / 사진=SK텔레콤 제공

 

SK텔레콤(대표이사 박정호)가 국립국어원(원장 소강춘)과 업무 협약을 체결하고 국립국어원의 언어 정보를 활용해 한국어에 최적화된 인공지능 언어모델을 개발한다.

 

차세대 인공지능 한국어 모델은 사람의 능력 수준으려 팡가받는 GPT-3와 유사한 성능을 발휘하는 모델을 개발하는 것이 목표다.

 

한국어 범용 언어 모델(General-Purpose Languege Model, GLM)은 언어 관련 문제 풀이, 글짓기, 번역 및 문장에 따라 간단한 코딩을 수행하는 GPT-3의 기능을 한국어로도 구현하도록 개발될 예정이다.

 

GLM은 일상 감성 대화, 고객센터 대화 뿐 아니라 시사, 문학, 역사, 게임 등 다양한 영역에서 언어 활동에 적용이 가능하고, 이를 기반으로 새로운 산업 분야에 추가 활용될 것으로 보인다.

 

SKTGLM1500억 개의 매개변수를 가진 거대 언어 모델로 개발할 방침이다.

 

현재 최신 언에 모델은 GPT-31750억 개의 매개 변수를 보유 중이며, 이전 버전인 GPT-2보다 100배 이상 높은 정확도와 활용도를 보유하고 있어 GLM이 한국어 AI 모델에 대한 평가를 갱신할 것으로 보인다.

 

SKT2021년 연말까지 GLM을 개발해 내부 서비스를 통해 모델 성능을 검증하고 상용화를 진행할 예정이다.

 

한국어 언어 모델 성능 평가 방법 개발 및 한국어 데이터 품질 평가 연구도 추진한다.

 

SKT 데이비스 에릭 하트먼 Language Superintelligence Labs장은 “SKT는 한국어에 최적화된 인공지능 언어 모델을 선제적으로 개발해 한국어의 정보화에 이바지하고 있다이번 국립국어원과의 협력을 계기로 한국어의 과학화, 세계화에도 이바지할 계획이라고 밝혔다.

 

국립국어원 정희원 어문연구실장은 앞으로도 인공지능 개발에 필요한 언어 정보자원을 지속해서 발굴해 관련 산업계와 학계에서 유용하게 활용될 수 있도록 시스템을 구축해 나가겠다고 말했다.

 

2018년부터 인공지능 언어 모델을 개발해온 SK텔레콤은 2019KoBERT를 개발해 챗봇 등에 활용하는 중이다.

 

20204월에는 KoGPT-2를 개발해 챗봇 대화를 더 발전시켰고 202010월에는 뉴스와 문서를 고품질 요약문으로 만들어내는 텍스트 처리 능력이 뛰어난 KoBART를 개발했다.

 

국립국어원은 ‘2021년 국어 정보처리 시스템 경진대회를 개최해 SKTAI 언어 모델을 활용해 AI의 언어소통 능력을 겨루는 행사를 개최하기로 했다.

반응형

댓글()