김 신혜님의 아티클 더 보기

마케팅

음성인식, 재밌는 콘텐츠가 될 수 있다

HCI KOREA 2018 학술대회

경계에 있는 우리들

HCI KOREA 2018

 

사람과 기술의 경계가 모호해지며 나타나는 다양한 현상들에 우리는 여전히 익숙하지 않다. HCI는 그 경계가 아직은 불편하게 놓여 있는 곳을 수면 위로 끌어올려 함께 이야기 나누며 고민하고 풀어보는 자리이다. 이번 SPOTLIGHT에서는 사람이 기술에 혹은 기술이 사람에게 녹아들기 위해 노력하는 다양한 사례들을 살펴봤다.


지난 1월 31일~2월 2일, 하이원리조트 컨벤션센터에서 3일간 진행된 HCI KOREA 2018 학술대회. ‘Trans-Humanity 경계의 확장’이라는 주제로 막을 올린 이번 HCI KOREA는 사람과 기계의 경계가 모호해지며 나타나는 영향을 다각적으로 다루는 자리였다. 인간과 컴퓨터의 상호작용을 연구하는 HCI(Human-Computer Interaction). HCI KOREA(이하, HCI)는 그 이론과 응용방법을 함께 모여 연구하는 모임이다. 행사에서 공유하는 주제들은 현업 종사자조차도 낯선 이야기로 가득하지만 현재 기술발전의 위치를 알아보고 논의해보는 것만으로도 모두에게 유용한 자리다. 그만큼 기술발전에 인간이 대처해야 할 자세는 무엇일지 고민하고 연구하는 이들로 가득한 HCI 현장. 경계에 서있는 그들은 과연 이번 HCI에서는 어떤 고민을 나눴을지 살펴보자.

글. 디아이매거진 편집국 di@websmedia.co.kr
일부 기사는 기자가 각색해 작성한 것으로 실제 발표 내용과 다를 수 있습니다.

음성인식

재밌는 콘텐츠가 될 수 있다

영화 ‘HER’을 한 번쯤 봤다면 알 것이다. 주인공과 인공지능 ‘사만다’의 대화에 어떠한 어색함도 없었다는 것을. 말 그대로, ‘대화’를 나눈다. 사람과 기기 사이에서 오고가는 사랑이 끝내는 자연스러워질 정도로 말이다. 아직은 영화 속 이야기이지만 카카오 UX Lab은 ‘자연스러운 대화 흐름’을 VUX 구현에서 가장 중점적으로 고려했다. 이 과정에서 음성인식을 재밌는 요소로 활용한 사례를 살펴보자.

 

한국소비자원이 국내 음성인식 스피커 사용자를 대상으로 인공지능 스피커 사용에 대한 불편을 조사한 결과에 따르면 ‘일상사용 환경에서 음성인식 미흡’(56.7%), ‘기기와 이용자 간의 자연스러운 연결형 대화가 곤란’(45.7%), ‘외부소음을 음성명령으로 인식해 작동오류가 발생’(37.0%) 등으로 나타났다.

이에 카카오 UX Lab 역시 가장 자연스러운 인터랙션이 가능한 VUX 구현에 중점을 뒀다. 예컨대, 사람의 대화구조(상대의 말이 끝나고 난 이후 대답하기), 인터페이스가 부재한 상황에서도 내 음성이 인식되고 있음을 시각적으로 드러내기, 명확한 피드백, 빠른 실행 등으로 자연스러운 대화 흐름을 만들고자 했다. 이 과정에서 음성인식 오류를 또다른 재미요소로 활용해볼 수 있지 않을까 하는 재밌는 실험을 하게 된다.

사실 음성인식 서비스를 재미요소로 활용하는 사례는 심심찮게 찾아볼 수 있다. ‘시리와 놀기’를 검색하면 나오는 수많은 포스트들이 그중 하나다. 카카오 UX Lab은 오류 역시 이처럼 재밌는 콘텐츠로 활용할 수 있을 것이라 봤다. 바로, 자막을 통한 시각화로 말이다.

응, 없던 걸로 하자

자막과 함께 소비되는 동영상 콘텐츠

예능을 보면 별거없는 장면에 ‘자막’으로 숨을 불어넣기도 한다. ‘약 빨았다’는 표현이 들려올 정도로 예능에서 자막은 감초 역할을 톡톡히 해내고 있다. 일반인들이 제작하는 동영상 콘텐츠나 사진에서도 자막은 감성을 더하거나 재미요소로 사용된다. 인스타그램의 해시태그 열풍도 이러한 현상 중에 하나가 아닐까 싶다. 단순히 사진 속 위치나 제품설명을 넘어 자신의 느낌이나 기분을 재밌게 표현하기도 한다.

자막으로 불어넣는 새벽감성

 

#청소를 안하면 #새로운 우주가 보인다 #궁서체 #자막으로 #재미요소 상승

동영상 콘텐츠에서 자막의 중요성은 페이스북 이용자의 과반수 이상인 약 85%가 소리 없이 음소거 상태로 동영상을 재생한다는 결과에서도 볼 수 있다. 영상의 분위기로 흐름을 예측하기도 하지만 자막과 이미지가 시청자의 이목을 잡을 수 있는 핵심 요소가 되어가고 있는 것으로 보여진다.

음성인식의 오류를 자막의 재미요소로

https://youtu.be/924Pjm9OuLA

말을 잘못 인식하는 게 어떻게 재미요소로 받아들여질 수 있는 건지 조금 이해가 어렵다면 말소리 자체를 문자로 옮기거나 외계어를 사용해 재밌는 마케팅을 선보인 ‘티몬 몬소리’를 참고하면 된다. ‘어흐발꼬랅꽊껴(신발 사이즈 미스인 상황)’, ‘옭시뚜까테또까아놝흐(똑같은 옷 입은 사람을 마주친 상황), ‘모델퓟보코옱콜랐는데망햁(모델이 다 한 상황)’, ‘살뛔는쉬운데환불할텐어렶(환불이 하늘의 별따기인 상황)’ 같은 카피로 소비일상을 재밌게 표현했다.

음성인식이 자막으로 옮겨지는 과정은 현재 서비스되고 있는 카카오 치즈를 통해 선보였다. 카카오 치즈의 마이크 버튼을 누르면 이용자 얼굴에 라이언 음성글라스 스티커가 적용된다. 이 상태에서 음성인식을 진행하면 자신만의 텍스트가 담긴 스티커가 완성된다.

보이지 않는 음성을 어떻게 시각화할 것인가의 과정에서 전개된 다양한 생각과 아이디어를 살펴볼 수 있는 세션이었다.

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다