뉴스

“AI 음성 인터페이스 시대 올 것” 9조 원 가치 일레븐랩스 CEO의 비전

21일 한국 시장 공식 진출… “말이야말로 소통의 근본적인 방법”

음성 AI 유니콘 일레븐랩스(ElevenLabs)가 21일 기자간담회를 열고 한국 시장 진출을 공식 선언했다. 사진은 발표 중인 마티 스타니셰프스키(Mati Staniszewski) CEO(자료=일레븐랩스)

21일 서울 JW메리어트호텔. 마티 스타니셰프스키(Mati Staniszewski) 일레븐랩스(ElevenLabs) CEO가 입을 열기 전, 스피커에서 유창한 한국어가 흘러나왔다. “안녕하세요, 마티 스타니셰프스키입니다.” 본인의 목소리를 AI로 복제한 음성이었다. 억양은 자연스러웠고, 기계음 특유의 이질감은 느껴지지 않았다.

영국 런던에 본사를 둔 기업가치 66억 달러(약 9조 원)의 글로벌 음성 AI 유니콘 일레븐랩스가 한국 시장에 공식 진출했다. 일레븐랩스는 EST, 크래프톤, 네이버를 비롯해 포춘 500대 기업 중 75%를 활성 고객사로 둔 AI 오디오 연구 및 개발 전문기업이다.

스타니셰프스키 공동창업자 겸 CEO는 21일 열린 기자간담회에서 “누구나 자기 목소리로 소통할 수 있는 세상을 꿈꾼다”며 “일레븐랩스가 ‘AI 음성 인터페이스의 시대’를 앞당길 것”이라고 밝혔다.

일레븐랩스는 창업가들의 어릴 적 기억에서 탄생했다. 폴란드 출신인 스타니셰프스키 CEO는 고교 시절 절친한 친구이자 현 공동창업자인 피오트르 답코프스키(Piotr Dąbkowski)와 함께 할리우드 영화를 보다 좌절한 경험을 소개했다.

“폴란드에서는 성우 한 명이 남자, 여자, 아이 목소리까지 1인 다역 더빙을 합니다. 그 경험이 너무나 ‘끔찍(Terrible)’했어요. 우리가 소비하는 음성 콘텐츠의 질이 얼마나 낮은지 뼈저리게 느꼈죠.”

이 ‘불편함’이 곧 비즈니스 기회가 됐다. 그들은 오디오 산업 전반이 AI를 통해 비약적으로 발전할 수 있다고 판단했다. 그렇게 탄생한 일레븐랩스의 음성 AI 기술은 벤치마크 테스트에서 경쟁사를 압도하며 5000만명 이상의 월간 활성 사용자를 보유한 거대 플랫폼으로 성장했다.

일레븐랩스가 한국 시장에 주목한 건 AI 수용도가 높기 때문이다. 산업통상자원부와 한국은행에 따르면, 2025년 기준 국내 대기업의 AI 도입률은 65.1%이며, 근로자의 63.5%가 AI를 일상적으로 활용한다. 글로벌 평균의 2배가 넘는 수치다. 여기에 2026년 AI 분야에 대규모 예산(10조1000억 원)이 편성된 점도 고려됐다. 홍상원 일레븐랩스 한국 지사장은 한국 음성 AI 시장 규모를 “보수적으로 잡아도 3400억 원 수준”으로 추산했다.

이날 공개된 일레븐랩스의 핵심 서비스는 세 가지다. 누구나 접근 가능한 API 레이어를 통해 제공하는 API 파운데이션과 AI 기반의 통합 협업형 크리에이티브 플랫폼인 크리에이티브 플랫폼, 핵심 연구를 실시간 자연스러운 음성, 깊이 있는 추론, 그리고 동적인 상호작용으로 구현해 AI 에이전트를 구동하는 에이전트 플랫폼이다.

일레븐랩스의 AI 에이전트 플랫폼 효과(사진=디지털 인사이트)

특히 B2B(기업 간 거래) 시장을 겨냥한 AI 에이전트 플랫폼이 강조됐다. 7000개 이상의 보이스와 32개 언어를 지원하는 AI 에이전트 플랫폼은 CRM, 고객지원, 결제, 전화 시스템 등 고객 대응 업무를 통합하는 서비스다. 짧은 지연 시간을 구현해 0.5초 미만의 반응 속도로 대화가 가능하다는 게 특징이다.

“고객이 말을 끊고 들어와도 자연스럽게 대응합니다. 마치 사람과 대화하는 것 같죠. 이를 통해 기업은 단순 반복 문의의 70%를 AI에 맡기고, 상담원은 복잡하고 감정적인 소통이 필요한 업무에 집중할 수 있습니다. 이처럼 에이전트 플랫폼은 텍스트 중심으로 설계된 다양한 AI 워크플로우를 혁신해 고객 전환율 향상과 매출에 기여합니다.”

회사에 따르면, 한 글로벌 디지털 은행은 일레븐랩스의 AI 에이전트 플랫폼을 도입해 고객 문의 시간을 평균 85% 단축, 신용카드 문의의 50% 를 자동화했다. 국내에서는 크래프톤, 이스트소프트 등이 일레븐랩스의 기술을 도입해 서비스 고도화에 나섰다.

스타니셰프스키 CEO는 음성 AI가 더 다양한 산업 분야에 활용될 수 있다고 강조했다. “‘말(Speech)’이야말로 인간 소통의 근본적인 방법”이라는 이유에서다.

“터치나 타이핑 같은 기존의 텍스트 중심 UI의 한계는 분명합니다. 우리는 원래 말을 주고 받으며 소통하는 것에 익숙하기 때문입니다. 웨어러블에서부터 자동차에 이르기까지 모든 디바이스가 우리가 무엇을 말하는지 정확히 이해할 수 있다면 제품의 사용자 경험이 완전히 달라질 것입니다. 이것이 일레븐랩스가 그리는 AI 음성 시장의 미래입니다.”

국내의 경우 현재는 K-콘텐츠로 대표되는 영화와 드라마, 게임, 크리에이티브 산업에서 관심을 보이고 있으며, 내년부터 고객 상담 시장으로 영역을 넓힌다는 계획이다. 이를 위해 지난해부터 네이버와 LG유플러스 등 국내 기업 및 전문가와 함께 한국어 음성 기술 고도화에 집중했다. 또 현재 일레븐랩스 마켓플레이스에 1만 개 이상의 보이스가 등록돼 있는데 곧 한국 유명인의 목소리도 만나볼 수 있을 전망이다.

한편, 일레븐랩스는 딥페이크 악용, 저작권 침해, 출처 불명, 불공정 이용 등의 문제를 방지하기 위해 Consent(동의), Control(통제), Compensation(보상) 등 3C 프레임워크를 구축했다. 동의는 시작부터 철저한 검증 단계, 통제는 완벽한 추적과 차단 시스템, 그리고 보상은 공정한 수익 창출 생태계 구축을 의미한다.

  • 에디터장준영 (zzangit@ditoday.com)

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다

성장하는 실무자를 위한
단 하나의 뉴스레터

뉴스레터 구독하기
하루동안 안보기