‘연기’하는 AI… 일레븐랩스, 오디오 콘텐츠 혁신 가속화
스푼랩스와 협업… 오디오 소설 ‘팟노블’ 기술 기반

인공지능(AI) 오디오 연구·개발 전문 스타트업 일레븐랩스(ElevenLabs)는 글로벌 오디오 플랫폼 기업 스푼랩스(SpoonLabs)와 전략적 협업을 통해 AI 기반 오디오 콘텐츠 제작 혁신을 가속화하고 있다고 6일 밝혔다.
앞서, 스푼랩스는 일레븐랩스의 고도화된 AI 음성 기술을 전격 도입해 신규 오디오 소설 서비스 ‘팟노블(PodNovel)’을 출시했다. 이를 통해 고품질 콘텐츠의 대량 생산 체계를 구축하게 됐다.
이번 협력은 스푼랩스가 기존 라이브 오디오 중심 사업에서 스토리 기반 오디오 콘텐츠 영역으로 확장하며 제작 프로세스를 전면 재설계하는 과정에서 이뤄졌다. 기존 성우 녹음 방식은 콘텐츠 한 편 제작에 4~7개월이 소요되는 등 긴 제작 기간과 높은 비용 구조, 확장성 제약이라는 한계가 있었다. 일정 수준 이상의 음성 품질을 지속적으로 유지하는 데에도 어려움이 따랐다.
스푼랩스는 일레븐랩스의 AI 음성 솔루션을 도입함으로써 이러한 문제를 성공적으로 해결했다. 일레븐랩스의 AI 기반 제작 방식으로 전환한 결과, 콘텐츠 제작 기간이 수 시간 내로 대폭 단축됐다. 한국·일본·대만 시장을 동시에 겨냥한 다국어 콘텐츠 제작까지도 가능해졌다.
특히, 사람 수준의 자연스러운 음성을 구현해 품질 경쟁력까지 확보했다. 이 같은 변화는 단순 비용 절감이나 효율 개선을 넘어, 콘텐츠 생산 구조 자체를 ‘AI 기반 제작 체계’로 전환한 구조적 혁신으로 평가받고 있다.
스푼랩스는 해당 기술 도입 전 국내외 다수의 TTS(Text-to-Speech) 솔루션을 대상으로 실제 제작 환경에 가까운 조건에서 테스트를 진행했다. 오디오 콘텐츠 특성상 문장 부호에 따른 억양 변화와 기쁨, 슬픔, 분노 등 문맥 기반 감정 표현력이 핵심 평가 기준이었다. 일레븐랩스는 단순히 텍스트를 읽는 수준을 넘어 문맥을 파악해 ‘연기’에 가까운 발화를 구현해내며 가장 높은 점수를 받았다.
또 음성 복제(Voice Cloning)와 배경음악 생성(AI Music), 효과음 생성(Sound Effects) 등 오디오 제작에 필요한 모든 요소를 단일 플랫폼에서 제공한다는 점이 결정적 선택 요인이 왰다.
‘팟노블’은 지난 1월 한국 30종, 일본 26종, 대만 19종의 콘텐츠를 론칭한 이후 사용자들로부터 “AI인 줄 인지하지 못할 정도로 몰입감이 높다”는 긍정적 반응을 얻고 있다. 스푼랩스는 일레븐랩스의 기술적 역량을 바탕으로 이달부터 매주 국가별 3종 이상의 신규 콘텐츠를 출시해 단기적으로 100종 이상의 콘텐츠 라인업을 확보할 계획이다.
김현 스푼랩스 팟노블 콘텐츠팀 팀장은 “오디오 콘텐츠의 핵심은 결국 ‘재미’이며, 이를 위해서는 음성 품질이 반드시 뒷받침돼야 한다”며 “일레븐랩스는 단순한 TTS를 넘어, 문맥과 감정을 이해하는 ‘연기’ 수준의 기술을 제공했다”고 밝혔다.
이어 “AI 기반 제작을 통해 콘텐츠 생산 속도와 확장성이 획기적으로 개선됐으며, 이는 단순한 효율 향상이 아닌 제작 방식 자체의 전환이라고 볼 수 있다”고 덧붙였다.
홍상원 일레븐랩스코리아 지사장은 “글로벌 오디오 플랫폼 시장을 선도하는 스푼랩스와의 협업을 통해 일레븐랩스의 음성AI를 기반으로 오디오 콘텐츠 제작 방식을 근본적으로 개선할 수 있어 매우 뜻깊었다”며 “향후 다양한 미디어 회사와의 협업을 통해 업무 프로세스를 혁신하고 나아가 새로운 제작 표준을 설정하는 데 이바지하겠다”고 말했다.
뉴스콘텐츠는 저작권법 제7조 규정된 단서조항을 제외한 저작물로서 저작권법의 보호대상입니다. 본 기사를 개인블로그 및 홈페이지, 카페 등에 게재(링크)를 원하시는 분은 반드시 기사의 출처(로고)를 붙여주시기 바랍니다. 영리를 목적으로 하지 않더라도 출처 없이 본 기사를 재편집해 올린 해당 미디어에 대해서는 합법적인 절차(지적재산권법)에 따라 그 책임을 묻게 되며, 이에 따른 불이익은 책임지지 않습니다.
- 에디터최석영 (csyeong720@ditoday.com)

