김 다윤님의 아티클 더 보기
제품 목소리 Her, Him or…
AI 목소리와 소비자 경험
제품 목소리 Her, Him or…
요즘 목소리로 명령을 하여 원하는 서비스나 기능을 조작할 수 있는 스마트가전이나 장비들이 눈에 많이 띈다. 물론 그 전에도 음성으로 안내되고 피드백되는 제품들은 꾸준히 출시되어 왔지만 일방향 콘텐츠 유형이었다. 어쨌든 이러한 제품도 포함해서 말을 통해서 뭔가를 이용할 수 있다는 것은 정말 편하다. 그리고 AI라는 이름으로 사람이 아닌 인공물과 주거니 받거니 하면서, 이용자가 실제 필요한 정보로 유도되어지는 방식으로 진화되었다. 즉, 인공물과 지속 가능한 대화가 가능해진 것이고, 인간은 이러한 방법을 익히 일상에서 해 왔기 때문에 자연스럽게 새로운 제품들을 사용할 수 있게 되는 것이다. 하지만 익히 일상에서 해 오던 습관을 이용하여, 사용자 인터페이스를 편하게 만든 만큼, 수반되는 UX 설계자의 또 다른 고민이 필요해 보인다.”
말이란 상대방을 향한 지향성을 가진다. 즉 말할 대상이 물리적으로든 상상으로든 있어야 한다는 것이다. 여기서 ‘있어야 한다’는 의미는 논리적으로 그렇다는 것이 아니라, 인간이 말할 때 자동으로 지향하는 심리적 현상인 것이다.
더군다나 말을 시킨 그것이 다시 말로서 대답한다면 그 대상은 이미 이용자의 머리 속에 자신과 공존하고 있는, 자신과 대화가 가능한 어떤 존재감을 만들어 내게 된다.
이렇게 목소리에 따라 예상하는 대답을 하는 상대는 목소리에 의해 충분히 상상하고 내 대화의 상대로 삼게 되는데, 그것은 비단 아이, 여성, 남성 외 동물, 로봇이나 기계로도 상정할 수 있다. 중요한 것은 그 상대가 나와 인간사회의 방식으로 상호작용할 수 있다는 전제로의 아키타입의 사회적 대상(social being)인 것이다.
사실 나와 (광의의) 커뮤니케이션을 하는 대상을 만들어 내는 데 목소리뿐만 아니라 다른 단서(cue), 가령 형상, 움직임, 촉각(따뜻함) 등 다양하다. 다음은 영화에서 이러한 대상을 자연스럽게 만들어내는 장면들이다.
무인도에 고립된 한 인간이 얼굴처럼 보여지는 무의미한 얼룩을 대화 상대로 삼는다(영화 ‘캐스트어웨이’). 얼굴의 단서인 눈, 코 등의 위치가 대략 비슷해 보이니 얼굴로의 의미부여가 가능한 것이다. 그리고 그렇게 물리적인 대상을 정하고 바라보는 방향을 정하니 한결 대화하기가 편해 졌다. 비록 대답은 없을지라도 말이다.
오피스비서의 역할을 해준다는 소프트웨어는 내가 무엇을 해야 하는지, 어떤 일정이 있는지에 대해 목소리로 때론 메시지로 알려준다(영화 ‘Her’). 물론 물어보는 것에도 어색하지 않게 인간처럼 대답한다. 대화를 할 때마다, 메시지를 받을 때 마다 그녀에 대해 이것저것 생각한다. 컴퓨터에서, 모바일에서 그녀는 늘 나와 대화한다. 그리고 대화를 하지 않아도, 즉 그녀가 일을 하지 않아도, 그녀의 존재는 점점 더 구체화 되고 확실해 진다. 그 남자의 머리 속에서…
결과적으로 어떤 단서(cue)로든 의인화된 방법에 의해 인간과 상호작용을 하는 순간, 그 대상은 인간에 의해 구체적인 캐릭터가 부여된다는 것은 피할 수 없는 인간 마음의 작동 방식이다. 그리고 그 캐릭터는 사회문화적으로 일반화된 스테레오타입(stereotype)을 연이어 작동시켜 준다.
목소리와 함께 오는 피할 수 없는 경험
목소리라는 단서(cue)로부터 저절로 형성된 아키타입의 상호작용이 가능한 존재(social being)는, 그 ‘존재’다움으로 익히 알고 있는 속성이나 성격, 가령 아이인 경우는 지능이 성인에 비해 낮고, 주어진 업무나 기능에 충분한 지식을 줄 수 없을 것 같은 느낌, 여성인 경우 컴퓨터 수리 등에 익숙하지 않고 가사관련 정보에 능숙할 것 같고, 감성적이고 섬세한 임무수행을 잘 할 것 같은 느낌 등이다(기존 UX 연구내용 참조함). 이렇게 사회문화적으로 형성된 선입견이나 편견은 ‘일반적으로’ 라는 사회문화적 그룹에 대한 차이와 현상(사회적 이슈로서 차별에 관한 이슈는 본 글에서는 벗어나므로 생략)이라고 할 수 있다. 따라서 앞의 예시처럼 여성이 요리를 안내하는 경우, 음식 전문가로서의 신뢰감이 상승하거나, 아이나 지능이 낮을 것 같은 상대가 고도의 전문정보를 알려줄 경우 만족스럽지 않거나 하는 등의 서비스 경험치가 쌓이게 되는 것이다.
출처. Biocca & Harms, 2002
이용자 개인적 처지(개인화)에 적절한 AI 아키타입 존재도 전략적으로 고려의 가치는 있다. 40대의 한 여성이 스마트TV에서 AI가 추천하는 영화를 확인한다. AI의 목소리는 남성이다. ‘흠… 나의 감성에 맞는 영화추천이 될까 의문이다.’ AI의 목소리가 40대 여성이다. ‘왠지 나의 취향에 맞는 영화 몇 편은 있을 것 같아…’ 기대 하면서 추천 리스트에 주목한다. 다행히도 최근 출시되는 제품 대부분은 이와 같이 역할과 정보 내용에 걸맞는 사회적 지위의 목소리를 잘 적용하고 있는 것 같다.
제품의 목소리는 스스로의 사회적인 정체성에 최선을 다한다.
애플은 최근 AI 스피커 ‘홈팟’을 출시했다. 이 제품을 경험한 미국의 CNN머니는 ‘홈팟’이 ‘시리’보다 못하다는 평을 내렸다. 그들은 AI 음성 대화 기능은 한계가 있다고 지적하면서도, 어쨌든 기존 아이폰에 있는 음성인식 비서인 ‘시리’가 천재처럼 보인다고 평가한 것이다. AI라는 말과 인간의 목소리를 통해 인간만큼의 지능 수준을 기대하게 해 놓고, 그에 부합되지 않은 수준을 보여줬기 때문인 것 같다.
전문가처럼 느껴지는 목소리로 혹은 AI라는 명목으로 서비스에 대한 기대감을 올리는 것은 위험할 수 있다. 물론, 궁극적인 지향점으로는 맞을지 모르겠지만, 실제는 목소리는 인간이지만 제공하는 서비스가 그에 준하지 않는다면 이처럼 어색한 것은 없는 것이다. 아마도 서비스 이용을 거듭할수록 실망(나쁜 경험)만 쌓이거나 목소리 옵션을 꺼버릴 수 있다.
마무리
말(목소리) 주고받기를 통해 인간의 오랜 메시지 교환 방법인 대화를 최신 기술서비스를 이용하는데 적용한 것은 사용 편의성을 향상시킬 수 있을 것이다. 하지만 목소리로 인해 형성되는 어떤 기대감, 어떤 선입견으로 인해, 서비스 본연의 의도가 훼손될 수 있다. 그래도 어쨌거나 서비스에 대한 전체 경험에 목소리 인터페이스의 역할이나 영향 정도에 따라 달라질 수 있으므로 실증적인 UX 리서치가 필요하다.