비즈스프링님의 다른 아티클 더 보기

마케팅

[HOW TO 마케팅] 데이터 분석 결과, 의심해본 적 있나요?

데이터의 ‘평균’이라는 위험

실전 마케팅이 궁금하다고요? ? <디지털 인사이트>가 마케팅 기업이 발행하는 자체 콘텐츠 가운데 실무에 활용하기 좋은 글만 추려 읽기 좋게 정리했습니다. 원문을 참고하면 더 자세한 내용을 알 수 있어요.


기업은 비즈니스 전략을 세우기 위해 데이터 분석을 진행합니다. 특히 최적의 인사이트를 도출하기 위해 관련된 데이터를 수집하고 분석합니다. 그런데 수집된 데이터를 분석한 결과를 여러분은 얼마나 신뢰하고 계신가요?

데이터 분석의 결과는 자칫 잘못하면 비즈니스 전략에 마이너스 적인 요소가 될 수 있기에, 신중하게 판단해야 합니다. 이번 콘텐츠에서는 데이터가 가지고 있는 위험한 요소에 대해 알아보겠습니다.

‘평균’이라는 데이터 위험 요소

여러분은 분석을 할 때 ‘평균’을 어떻게 해석하고 있나요?

쇼핑몰을 운영한다고 가정해보겠습니다. 쇼핑몰에서 평균 상품을 보는 조회수가 10이라고 가정한다면, 대부분의 고객이 대략적으로 8~12개 정도의 상품을 본다고 생각할 수 있습니다. 그런데 사실 대부분 고객은 3~4개의 상품만 보고 소수 고객이 많은 상품을 조회한다면 이 상황을 어떻게 분석하겠습니까?

답은 정해져 있지 않지만, 대부분 이런 문제를 마주치면 가장 먼저 데이터를 시각화 합니다. 그 후 전체 분포를 파악하고 범위 내에서 데이터를 해석하죠. 여기서 조금 더 자세한 예시를 하나 더 들어보겠습니다.

암을 전문적으로 치료하는 병원이 두 곳이 있다고 가정하겠습니다.

병원환자수생존자수생존율
A병원50029058%
B병원50032064%
[표 1]암 병원 생존율 표

만약 [표 1]에서 유능한 병원을 선택하라고 한다면 어느 병원을 선택하겠습니까? 당연히 생존율이 높은 B병원을 선택 하겠죠?

그런데 여기서 [표 1]을 암 진행정도에 따라 다시 나눠본다면 어떨까요? 아래와 같이 암 진행 정도에 따라 다시 한 번 세분화 해보겠습니다.

<초기 · 중기 암>환자수생존자수생존율
A병원1009090%
B병원30024080%
[표 1-2]초기·중기 암
<말기 암>환자수생존자수생존율
A병원40020050%
B병원2008040%
[표 1-3]말기 암

현재 시점에서 다시 선택한다면 두 병원 중 어느 병원을 선택하시겠습니까?

이처럼 부분에서 성립하던 성질이 부분을 합한 전체에서는 성립하지 않는 것을 바로 ‘심슨의 역설 (Simpson’s Paradox)’라고 말합니다. 데이터 분석에서 항상 나오는 ‘세그먼트’ 개념을 설명할 때 반드시 등장하는 예시입니다.

이번엔 좀 더 실무적인 측면에서 설명하겠습니다.

[차트 1]분기별 DAU 와 매출액

위 그래프를 보시면 1분기에서 DAU와 매출액 모두 점점 줄어들고 있습니다.

이 그래프만 본다면 해당 기업은 많은 생각을 하게 될 것입니다. 이렇게 전체 평균 데이터만 놓고 본다면 생각이 많아 지겠지만 만약 이 데이터를 세분화 한다면 어떨까요?

[차트 2] 분기별 회원/비회원 DAU와 매출액

[차트 2]를 보면 [차트 1]의 분기별 데이터와 다르게 회원가입 고객은 조금씩 증가하고 있습니다. 매출액도 2분기에는 약간 주춤했지만 3분기부터 조금씩 올라가고 있습니다.

그런데 분기별 비회원가입 고객 DAU와 매출액을 보면 3~4 분기에 큰 폭으로 떨어져 있음을 발견할 수 있습니다. 해당 사이트에서 제공하는 서비스에 지속적으로 도움을 주고 커뮤니케이션이 가능한 정회원 고객의 동향에는 큰 이슈가 없습니다.

이는 회원가입을 하지 않은 고객이 1,2 분기에 갑자기 올라가 평균 데이터에 영향을 줬기 때문입니다. 체리피커*인 비회원가입 고객이 1,2 분기에 특정 상품 또는 특정 이벤트를 참여하기 위해 잠깐 유입한 것은 아닌지 마케팅팀과 함께 확인해봐야 할 것입니다.

체리피커: 케이크에서 하나밖에 없는 체리만 골라 먹는 사람으로 다양한 혜택이 제공되는 서비스 사이에서 혜택만 누리고 사라지는 것을 뜻함

기업에서는 단순 평균 데이터만 살펴보고 비즈니스 전략을 세우거나, 위기라고 판단하기 쉽습니다. 그러나 데이터를 좀 더 세분화 하여 전체 평균 데이터가 아닌 세부 데이터를 보고 올바른 의사결정을 해야합니다.

심슨의 역설을 피하려면 그룹별로 데이터를 세분화 해보고 세분화된 데이터를 함께 비교하여 분석하는 것이 핵심입니다.

만약, 세분화 하는 부분에서 어려움을 느낀다면 솔루션을 이용하는 방법을 추천드립니다. 특히, 솔루션을 통해 세분화된 세그먼트별로 수집되는 데이터를 확인할 수 있으며 잠재고객을 차트 형태로 한눈에 볼 수 있습니다.

데이터를 1차원으로만 분석하기 보다는 2차원, 3차원 등 몇차례 세분화 과정을 거쳐서 인사이트를 도출하는 것을 권장합니다.

  • 에디터이민호 (treewords@ditoday.com)
HOW TO 마케팅

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다

비즈스프링님의 다른 아티클 더 보기

성장하는 실무자를 위한
단 하나의 뉴스레터

뉴스레터 구독하기
하루동안 안보기