서울--(뉴스와이어)--인공지능(AI) 언어 데이터 기업 플리토(대표 이정수, 코스닥 300080)가 국립국어원이 주관하는 ‘한국어-외국어 병렬 말뭉치 구축 사업’ 수행기업으로 4년 연속 선정되었다고 21일 밝혔다.
‘한국어-외국어 병렬 말뭉치 구축’은 문화체육관광부 산하 국립국어원이 언어문화산업을 활성화하기 위해 2021년부터 인공지능(AI) 기술을 활용하여 언어 데이터 환경을 구축하는 사업이다. 올해 사업은 경희대학교산학협력단이 주 수행하고 플리토가 참여하는 형태로 진행될 예정이다. 규모는 약 46억원으로, 플리토는 그중 20억9000만원 규모에 해당하는 병렬 말뭉치 구축을 맡게 된다.
플리토는 오랜 기간에 걸친 프로젝트 경험, 자체 플랫폼을 활용한 데이터 구축 능력, 그리고 전문 번역가 및 언어 전문가를 보유한 점을 토대로 안정적인 말뭉치 구축 능력을 인정받아 4년 연속 참여 기업으로 선정되었다.
플리토가 수행하는 말뭉치 구축 언어는 총 9개이며, 해당 언어는 베트남어, 인도네시아어, 태국어, 인도 힌디어, 캄보디아 크메르어, 필리핀 타갈로그어, 러시아어, 우즈베크어, 영어다. 언어별로 약 140만 어절로 총 1260만 어절을 구축할 계획이다. 올해 사업에서도 지난해와 마찬가지로 기존 언어 외에 영어 데이터를 추가 구축하여 한국어-영어 병렬 말뭉치 데이터의 활용도를 극대화할 예정이다.
이번 사업을 통해 구축된 언어 데이터는 번역 소프트웨어 및 자연어처리 기술 등 정부의 문화산업 확산을 위한 인공지능 기술 개발에 적극적으로 활용될 것으로 전망된다. 아울러 아시아 권역에서 저자원언어로 분류되는 언어 데이터가 풍부하게 구축되면서 언어적인 불균형을 해소하고 국가 간 문화 교류를 효과적으로 촉진할 것으로 기대된다.
이정수 플리토 대표는 “언어 데이터 구축 경험과 전문성을 인정받아 4년 연속으로 정부 말뭉치 사업에 참여할 수 있어 영광”이라며 “정부 육성 AI 분야에서 필요로 하는 양질의 언어 데이터를 지속적으로 공급하여 우리나라 AI 산업이 글로벌 우위에 설 수 있도록 선도적인 역할을 수행하겠다”고 밝혔다.