글로벌 인공지능(AI) 전장 속에서 언어 데이터 전문 기업 ‘플리토’가 숨은 승부사로 주목받고 있다. 글로벌 빅테크들이 앞다퉈 플리토의 데이터 생태계에 러브콜을 보내고 있다.
플리토는 전 세계 1400만명 이상의 플랫폼 사용자와 AI 기술을 결합한 ‘하이브리드 데이터 엔진’을 무기로 글로벌 AI 데이터 시장을 정조준하고 있다. 챗GPT 이후 거대언어모델(LLM) 기술력이 상향 평준화되면서 AI의 성능을 결정짓는 ‘고품질 데이터’가 중요해졌다. 데이터의 품질이 떨어질 경우, 사실이 아니거나 존재하지 않는 정보를 진실인 것처럼 꾸며내는 ‘환각’ 현상이 빈번해질 위험이 있기 때문이다.
플리토의 데이터 인프라는 AI 업계의 오랜 골칫거리인 환각 현상을 감소시킬 해법으로 꼽히고 있다. 플리토는 ‘인간 피드백 기반 강화 학습’을 채택했다. 방대한 사용자가 직접 참여해 언어의 미묘한 뉘앙스와 논리적 맥락을 검증하는 방식이다. ‘기계의 언어’가 아닌 ‘살아있는 진짜 인간의 언어’를 AI에 주입해 신뢰도와 정확도를 극대화하는 데이터 인프라를 구축한 셈이다.
기업 맞춤형 AI 인프라로도 영역을 넓히고 있다. PDF나 보고서 등 기업 내부의 방대한 비정형 데이터를 고품질 학습 데이터로 가공해 주는 ‘도메인 특화’ 데이터셋이 대표적이다. 보안과 데이터 통제가 생명인 기업에게 필수적인 인프라로 주목받고 있다.
독보적인 데이터 정제 역량은 기업 간 거래(B2B) 통번역 솔루션 시장에서 진가를 발휘하고 있다. 플리토의 실시간 AI 통번역 솔루션 ‘라이브 트랜스레이션’은 화자의 음성을 인식해 다국어 자막으로 띄워주는 서비스다. 구글, 메타, 아마존웹서비스(AWS) 등 글로벌 빅테크 기업들의 대형 국제 컨퍼런스에 속속 도입되며 까다로운 기술 검증을 마쳤다.
플리토의 초개인화 AI 번역 서비스 ‘챗 트랜스레이션’도 주목받고 있다. 기업의 전문 용어나 개인의 표현 습관까지 학습해 번역하는 것이 골자다. 일상과 비즈니스 영역의 언어 장벽을 허무는 역할을 하고 있다.
플리토는 텍스트를 넘어 음성, 이미지, 영상 등 모든 형태의 정보를 아우르는 멀티모달 데이터로 진화 중이다. AI가 가상공간을 넘어 현실 세계에서 자율적으로 움직이는 ‘에이전틱 AI’와 ‘피지컬 AI’ 시대로 접어들면서, 상황과 맥락을 깊이 이해하는 데이터의 수요가 폭발하고 있기 때문이다.
글로벌 시장 공략도 본격화하고 있다. 음성 인터페이스와 AI 비서 수요가 급증하는 북미 시장에서는 대규모 다국어 음성 데이터 공급을 확대하고 있다. 막대한 오일머니를 바탕으로 국가 차원의 디지털 전환을 서두르는 중동 지역에서는 정부 및 연구기관의 AI 학습 데이터 구축 사업을 잇달아 수주하고 있다. 일본에서는 애니메이션과 게임 콘텐츠의 현지화 작업에 AI 번역을 접목하고 있으며, 동남아에서는 현지 대학들과 연계해 소수 언어 데이터 생태계를 선점하고 있다.
이정수 플리토 대표는 “AI 경쟁의 본질은 모델이 아니라 데이터를 얼마나 깊이 이해하고 활용하느냐에 있다”며 “언어는 인간의 지식과 맥락이 가장 밀집된 데이터로, AI 시대에서 그 가치가 더욱 커질 것”이라고 말했다. 이어 “플리토는 전 세계 언어 데이터를 연결하는 글로벌 지능형 데이터 인프라 기업으로 성장해 나갈 것”이라고 밝혔다.













































