딥엘은 15일 한국에서 처음으로 고객 행사 ‘딥엘 커넥트(DeepL Connect)’를 개최하고, 이를 기념해 기자간담회를 열었다. 이번 행사에서는 인간 통역사 없이 딥엘의 음성 번역 기술만으로 진행된 점이 눈길을 끌었다.
곤살로 가이올라스 딥엘 최고제품책임자(CPO)의 영어 발표는 AI가 실시간으로 인식해 한국어로 번역한 뒤, 다시 음성으로 변환돼 리시버를 통해 전달됐다. 이어폰으로 들리는 AI 음성은 다소 딱딱한 말투를 보였고 간헐적인 끊김도 있었지만, 통역 품질은 무난한 수준이었다. 특히 말을 인식한 뒤 곧바로 음성으로 변환하는 ‘음성-음성(voice-to-voice)’ 방식의 번역은 아직 일반화되지 않은 기술이라는 점에서, AI 동시통역의 가능성을 가늠해볼 수 있는 자리였다.
가이올라스 CPO는 이런 음성 간 번역 기술이 통번역 시장을 축소가 아닌 확장으로 이끌 것이라고 전망했다. 그가 근거로 든 것은 ‘제번스 패러독스(Jevons Paradox)’다. 기술이 접근성을 높이면 수요가 줄기는커녕 오히려 증가한다는 역설이다. 번역이 쉬워지면 번역이 필요 없어지는 것이 아니라, 이전에는 엄두도 못 냈던 상황에서까지 번역 수요가 발생한다는 의미다.
딥엘이 B2B 영역에 집중하는 이유도 여기에 있다. 16일 공식 출시한 음성 간 번역 기술 ‘딥엘 보이스 투 보이스(Voice-to-Voice)’은 API 기반으로 비대면 회의, 대면 대화, 고객 응대 등에 활용할 수 있다. 기존 통역사를 대체하는 것이 아니라, 비용 문제로 통역 지원이 불가능했던 현장 곳곳에 AI 통역을 배치하겠다는 구상이다.
딥엘에 따르면 이와 관련된 실제 수요도 증가하고 있다. 구체적인 한국 고객사는 공개하지 않았지만, 이미 글로벌 대형 기업을 고객으로 확보하고 있는 만큼 한국에서도 주요 기업 고객을 확대해 나갈 것으로 보인다. 가이올라스 CPO는 “한국은 비교적 최근에 진출한 시장으로, 아직 오랜 기간 활동해온 것은 아니지만 중요한 파트너십과 주요 고객사를 통해 의미 있는 성장을 확인하고 있다”고 설명했다.
특히 딥엘에 관심이 보이는 업계로는 현재 콜센터·BPO(비즈니스 프로세스 아웃소싱) 기업, 법률·전문 서비스 기업, 제조·물류 기업 등이 있다. 제조 현장의 안전 교육, 물류 기사와의 소통, 글로벌 엔지니어링 팀과 생산 조직 간 실시간 협업 등이 대표적인 활용 사례로 꼽힌다. 이날 간담회에서 시연된 데모 역시 이러한 실제 업무 환경을 반영했다. 외국인 노동자와 한국인 관리자가 안전 수칙을 논의하는 상황이나, 해외 고객센터 직원이 한국 고객의 문의를 처리하는 장면 등이 구현됐다.
딥엘이 텍스트를 넘어 음성 번역까지 확장한 배경에는 비즈니스 현장에서 음성 소통의 비중이 압도적이라는 판단이 깔려 있다. 궁극적으로 딥엘은 보이스 투 보이스같은 실시간 음성 번역 기술을 통해 영어 중심 회의에서 발언을 꺼리던 구성원이 보다 자유롭게 의견을 낼 수 있고, 비영어권 참석자와의 소통 이후 상호 이해를 확인하는 시간을 줄이며, 대규모 인력에 대한 통번역 지원 비용 부담도 낮출 수 있을 것으로 기대하고 있다.
딥엘이 생각하는 음성 번역의 미래
현재 번역 업계 전반의 기술이 텍스트 중심으로 발전해 온 반면, 음성 기반 번역은 상대적으로 제한적으로 구현돼 온 영역이다. 이는 음성 번역이 기술적으로 훨씬 복잡하고 구현 난도가 높기 때문이다.
가이올라스 CPO는 음성 간 번역 기술에 대해 “음성 인식(전사), 번역, 그리고 맥락에 맞는 표현 변환이 동시에 이루어지는 복합적인 과정”이라고 설명했다. 특히 언어 쌍에 따라 처리 속도 차이가 발생하는데, 아시아 언어의 경우 의미와 문맥을 충분히 파악한 뒤 번역이 이뤄져야 하기 때문에 상대적으로 시간이 더 소요된다고 덧붙였다.
딥엘은 이러한 지연(latency)을 줄이는 데 기술 개발 역량을 집중하고 있다. 가이올라스 CPO는 “지연 시간이 충분히 개선되면 평균적인 인간 통역사보다 더 빠르고 효율적인 수준에 도달할 수 있을 것”이라며 “화자의 억양과 의미, 맥락까지 유지해 전달하는 것이 현재 로드맵에 포함돼 있다”고 밝혔다.
이와 함께 단기적으로는 ‘음성 복제(voice cloning)’ 기능도 출시할 계획이다. 해당 기술은 기존의 합성 음성이 아니라 실제 화자의 목소리를 반영해 번역 내용을 전달하는 방식으로, 보다 자연스러운 통역 경험을 제공하는 것을 목표로 하고 있다.
딥엘은 범용 AI 대비 번역 분야에서의 기술 경쟁력에 대해서도 자신감을 드러냈다. 일단 딥엘은 지원 언어를 기존 36개에서 약 140개 수준으로 확대했으며, 이를 위해 모델 아키텍처를 재설계했다. 기존의 언어 쌍별 일대일(one-to-one) 구조에서 벗어나, 다국어 집합 번역(multilingual aggregation)에 보다 적합한 모델을 구축하고 있다는 것이다.
학습 데이터 역시 차별화 요소로 강조했다. 딥엘은 수천 명의 프리랜서 전문가를 계약 기반으로 고용해 데이터를 자체 구축하고 있으며, 저작권 이슈가 있는 공개 데이터에 의존하지 않는 방식을 유지하고 있다고 밝혔다.
가이올라스 CPO는 “범용 대형언어모델(LLM)을 번역에 활용해 본 고객들은 일관성, 정확도, 브랜드 톤 유지, 문서·텍스트·음성 등 다양한 매체 간 통합 측면에서 한계를 경험하고 있다”며 “통번역 전문 연구기관 슬레이터는, 고품질 번역이 요구되는 미션 크리티컬 환경에서는 딥엘의 역량이 (타 기술보다) 수년 앞서 있다고 평가했다”고 강조했다.
끝으로 가이올라스는 인간 통역사의 미래에 대해서는 비교적 낙관적인 입장을 내놨다. 그는 인간 통역사가 여전히 높은 가치를 지니고 있지만, 모든 상황에 투입되거나 대규모로 확장하기는 현실적으로 어렵다고 설명했다. 이에 따라 고위험(high-stakes) 상황이나 민감한 커뮤니케이션, 개인적인 맥락에서는 인간 통역사의 역할이 계속해서 중요하게 유지될 것이라고 전망했다.
다만 AI 기반 실시간 통역 기술은 지금까지 비용이나 인력 문제로 대응하지 못했던 영역을 보완하며, 기존에 통역이 제공되지 못했던 대부분의 영역에서 새로운 수요를 만들어낼 수 있을 것으로 내다봤다. 기존 통역사를 대체하기보다는 시장 자체를 확장하는 역할을 한다는 설명이다.
가이올라스 CPO는 “AI 기반한 동시 통역 기술은 인간 통역사를 대체하는 것이 아니라, 오히려 시장을 확장하는 방향으로 작용할 것”이라며 “말을 하면 곧바로 다른 언어로 자연스럽게 전달되는, 전체 과정을 한 번에 처리하는 번역 방식 즉, 종단 간(end-to-end) 번역과 통역의 중요성에 대한 인식을 높이고, 결과적으로 숙련된 전문가들에게 더 많은 기회를 제공하게 될 것”이라고 분석했다.
jihyun.lee@foundryco.com