메타데이터 ‘의미있게’ 분석하자!
만두로 알아보는 메타데이터
메타데이터는 빅데이터 마케팅의 최소 단위다. 메타데이터를 만두 속이라고 한다면 분석가능한 데이터셋은 만두라고 할 수 있겠다. 메타데이터를 만드는 건 만두 속을 잘 다진 뒤 예쁘게 만두를 빚는 과정인 셈이다. 데이터 기반 마케팅 의사결정을 위해 메타데이터를 더 촘촘하게 이해해보자!
글. 이슬아 마케터
정리. 정병연 에디터
Intro. 엄마와 함께 만드는 황해도 손만두.
코로나로 답답한 마음이지만 이번 추석에도 가족들과 둘러앉아 황해도식 손만두를 만드는 거실 풍경에는 변함이 없었다. 황해도 출신인 외할아버지 덕에 외가 식구들은 모두 만두를 즐겨 먹었다.
맛깔스러운 만두를 만들려면 엄청나게 많은 ‘속’이 필요하다. 두부, 김치, 당근, 부추와 당면, 고기 등등 재료가 많으면 많을수록 식감과 맛이 더욱 풍성해진다. 이것들을 만두피로 정성스럽게 빚은 뒤 찌거나 구우면 먹음직스러운 음식이 된다.
만두를 빚으면서도 마케터로서 필자는 ‘메타데이터를 의미 있게 분석하는 법’을 고민하기 바빴다. 본격적인 요리를 하기 전에 다양한 재료를 넣고 정성을 들여 손질해야 한다는 점에서 만두 속을 만드는 과정이 데이터 분석을 위한 메타 데이터를 만드는 과정과 비슷하게 보였기 때문이다.
메타데이터는 ‘만두 속’이다
메타데이터를 활용한 데이터 분석기법을 얘기하기 전에 메타데이터의 뜻부터 알아보자. 메타데이터는 ‘데이터를 위한 데이터’로서 만두 속에 비유할 수 있다. 즉 ‘요리로서의 만두’를 만드는 데 만두 속이 필요한 것처럼 ‘상품성을 갖춘 유의미한 수준의 데이터’를 만들려면 메타 데이터가 있어야 한다는 말이다.
다른 말로는 ‘데이터 분석을 하는 데 쓰는 데이터 요소’라고 정의할 수 있다. 이때 ‘데이터 요소’에는 기술적인 영역의 데이터 인프라 및 설계구조까지 포함된다. 메타데이터는 그것이 설계되는 구조에 종속되기 때문이다. 메타데이터셋이 다르면 각각의 데이터베이스는 저마다 다른 단위를 갖게 되는 것이다.
메타데이터의 설계: 만두소를 만들어보자!
의미있는 분석 앞에는 반드시 그에 맞는 데이터 베이스를 구축 · 설계하는 과정이 있어야 한다. 필자는 이를 만두 속 준비 과정으로 비유한다. 맛있는 ‘데이터 속’을 만드는 레시피를 공유한다.
1. 데이터 분석에 필요한 메타 데이터를 잘게 다진다
메타데이터는 ‘데이터 항목’과 그에 따른 ‘데이터 값’이다. 데이터 분석 목표를 고려해 항목들을 최대한 깊이 있게 쪼개야(Break-down) 한다. 유튜브에 올린 동영상 시청에 대한 분석을 예로 들어보자. 어떤 항목들이 필요할까?
영상 조회를 분석하기 위한 메타 데이터(예시)
– 영상 조회 수
– 영상 클릭 조회 수
– 25% 영상 조회 수
– 50% 영상 조회 수
– 75% 영상 조회 수
– 완전 영상 조회 수
메타데이터가 누락돼도 추후에 추가할 수는 있다. 하지만 최초로 설계할 때분석 목적과 관련이 있으며 그중에서도 필수적인 항목 위주로 최대한 자세히 준비하는 게 당연히 좋다.
다음으로 항목별 데이터 값이 동일한지 검증하는 단계를 거친다. 예를 들어 클릭부터 재생되는 영상이 있는가 하면, 사용자 경험(UX)에 따라 자동으로 재생되는 영상도 있다. 각각의 중요 데이터 항목은 ‘영상 조회 수’로 같다. 그러나 소비자가 직접 영상을 클릭해서 재생한 경우는 자동 재생된 경우보다 더 발전된 형태의 소비자 참여라고 할 수 있다. 이런 경우에는 메타데이터를 분리해 ‘영상 조회 수’와 ‘영상 클릭 조회 수로’ 항목을 구별해야 한다. 이것이 바로 메타 데이터를 같은 기준, 같은 값, 더 나아가 같은 구조(Hierchy)로 조정하는 과정이다.
여기서 더 나아가 사분위수(Quartile · 25%)로 재생 데이터를 평가하기도 한다. 특정 구간에서 갑자기 재생 수치가 떨어질 경우 해당 영역에서 영상에 대한 흥미가 떨어진 이유를 분석할 수 있는 것이다. 이는 다음 콘텐츠를 연출하는 데 중요한 참고가 될 수 있다.
메타데이터(만두 속)를 쪼개는 과정에서, 각각의 데이터 항목들이 의미 있는 데이터 분석(만두)에 어떻게 기여할 수 있는지 예측하는 과정이 필요하다는 사실을 잊지 말자.
2. 다진 데이터를 통합적으로 연결하기
메타데이터를 아무리 잘개 쪼개더라도 다른 데이터와 연결해 더 큰 가치를 만들 수 없다면 무용지물이다. 쪼개진 메타데이터가 각각 데이터 분석 목표와 연결될 수 있게 통합적인 설계를 해야 한다. 웹사이트 내 트래픽을 분석하려는 목적을 갖고 다음과 같이 메타데이터를 구분하는 트랙킹 코드를 준비했다고 가정해보자.
웹사이트 사용자 이용현황 분석을 위한 트랙킹 코드에 포함된 메타데이터(예시)
Code 1 : 202011 / SNS / Entertainment / Reach / Video_30s
Code 2 : 202011 / Facebook / Entertainment / Websiteclick / Video_30s
Code 3 : 202011 / YouTube / 2035-Female / Pre-roll / Video_30s
첫 번째 메타데이터 항목을 SNS라고 구분한 것과 달리 두 번째 메타 데이터 항목은 Facebook으로 구분했다. 이 경우 두 메타데이터의 단위가 다르기 때문에 효과적인 분석이 어렵다. 항목을 수정해 데이터 값을 동일한 기준으로 축적하고 분석할 수 있는 구조를 만들어야 한다. 예컨대 SNS를 Instagram으로 고치면 30초 영상에 대한 매체별 반응 분석 구조가 형성되는 것이다.
두 번째와 세 번째 트랙킹 코드를 비교해보자. 집행 매체 카테고리가 각각 SNS와 비디오로 다르지만 페이스북과 유튜브라는 같은 단위의 마케팅 채널에서 해당 영상 소재가 어떤 반응을 이끌어냈는 비교분석이 가능하다.
3. 메타데이터를 활용한 데이터 분석
이제 메타 데이터를 활용해 본격적으로 데이터를 분석해보자. 지금까지 만두 속을 맛있게 만들었다면 만두피를 갖고 이 모양 저 모양으로 빚는 과정에 해당한다. 만두 속을 얼마나 다양하게(Items), 얼마나 많이(volume) 넣느냐에 따라 만두 모양도 달라진다. 만두는 맛있게 먹을 때 비로소 가치 있다. 그처럼 메타 데이터는 의미 있는 정보를 제공할 수 있을 때 비로소 가치를 갖는다.
1. 목표에 따라 필요한 메타 데이터가 다르다
항상 같은 메타데이터만 쓰는 경우는 없다. 그것은 분석이 필요한 이유가 제대로 정의되지 않은 분석을 위한 분석, 죽은 분석이다. 형식적이고 반복적인 데이터 분석은 경계해야 한다.
메타데이터 항목은 목표에 따라 달라진다. 큰 범위에서 같은 목표를 갖더라도, 마케팅이 집행되는 매체별로 목표와 메타데이터 항목이 달라지기도 한다. 필자는 이것을 데이터 다이내믹스(Data Dynamics)라고 정의한다. 분석 목표에 따라 적당한 메타데이터를 선택하기 위해 메타데이터를 사전에 촘촘하게 쪼개는 작업이 필요한 것이다.
2. 무엇을 묶고, 무엇을 펼쳐볼 것인가.
메타데이터 분석은 한마디로 ‘무엇을 어디까지 묶어서 기준으로 삼고, 어떤 값들을 펼쳐볼 것인가’라는 고민에서 출발한다. 무엇을 묶느냐에 따라 데이터 각도가 달라지고, 그에 따른 인사이트는 마치 스펙트럼처럼 펼쳐진다. 이처럼 다양한 데이터 스펙트럼을 경험하면서 희열을 느꼈다면 그때가 바로 빅데이터 분석의 매력에 빠지는 첫 단계다.
메타데이터 분석은 결과를 받아보는 광고주나 클라이언트 등 의사결정권자에게 가치 있는 내용을 전달해 구체적인 행동에 영향을 줘야 한다. 데이터 분석을 하다 보면 데이터를 정리하고 요약하는 수준에서 끝나는 경우가 생각보다 많다. 모든 메타데이터 분석은 ‘데이터 가치 전달’을 목적으로 이뤄진다는 사실을 명심하자.
3. 더 높은 성과를 목표로 행동하게 만드는 데이터 분석
데이터를 수집하고 설계하며 분석하는 일은 궁극적으로 마케터에게 유의미한 인사이트를 제공하기 위한 것이라는 사실을 잊어서는 안 된다. 메타 데이터를 정리하고 구조화하는 과정에서 너무 힘을 뺀 나머지 이후 데이터 분석이나 인사이트 도출까지 나아가지 못하는 경우가 있다. 데이터베이스가 세팅됐다면 데이터 분석 역량을 키우고 다양한 인사이트를 뽑아내는 단계로 넘어가야 한다.
여기서 중요한 것이 마케팅이나 비즈니스 관점에서 의사결정을 하도록 돕는 데이터로 전환하는 작업이다. 마케팅 지출 대비 매출을 계산하는 ROAS(Revenue out of Ad Spending)와 같은 개념이다. 설령 직접적인 구매금액이 데이터로 들어오진 않더라도, 구매 가능성이 높은 메타데이터 항목을 구매 단위로 환산시켜 마케팅이나 비즈니스 가치로 바꿀 수 있다.
예를 들어 이메일 구독하기 버튼을 클릭해 이메일을 구독한 수치를 메타데이터로 잡을 수 있다. 이후 이메일 열람을 거쳐 구매까지 이어지는 확률을 적용해 구매 가능성을 예측해볼 수도 있고, 구매(가능성) 금액을 산정해볼 수도 있다. 실제로 구매금액과 매칭되지 않더라도 구매 추이를 데이터와 비교하는 과정에서 유사성을 발견할 수도 있다.
자동차 같은 고관여 제품은 이러한 구매 전환 가능성을 촘촘하게 트랙킹하기도 한다. 신차 관련 영상을 통해 홈페이지로 유입되고 관련 카탈로그를 다운로드하거나 가격표 버튼을 클릭하는 소비자는 구매 가능성이 높기 때문이다. 이때 해당 메타데이터는 마케팅 영역에서 세일즈 영역으로 넘어가 추가적인 액션을 만들어야 한다. 시승 정보를 제공하든지 고객응대 담당자 정보를 함께 제공해 구매 전환 가능성을 높여가는 대응이 필요하다. 이처럼 데이터 분석에서 그치지 않고 의사 결정 단게에서도 분석 결과를 적극적으로 활용할 수 있는 역량까지 갖춰야 한다.
Outro. 메타데이터를 뛰어넘자
메타 데이터 얘기를 하는데 갑자기 만두가 나와서 당황스럽진 않았는지 모르겠다. 메타 데이터 분석 과정은 필요한 ‘만두 속’을 준비해서 잘게 잘라 ‘만두’를 만들어내는 것과 비슷하다는 얘기가 와 닿았길 바란다.
마지막으로 얘기하고 싶은 것이 있다. 데이터를 지나치게 들여다 보는 나머지 그 안에 갇히기도 한다. 하지만 데이터에서 볼 수 없는 것도 있다. 아이러니하게도 큰 변화를 만들어내는 힘은 데이터 밖에 있다. 외부에서 새로운 동력이 주입돼야 새로운 데이터가 만들어지고, 새로운 분석과 가치가 계속해서 재생산되는 것이다.
데이터가 인간을 지배할 것 같은 세상에서도 인간의 창조력은 여전히 빛난다. 필자는 그것이 가장 가치 있는 메타데이터를 만드는 근원이라고 믿는다.