티스토리 뷰

180122




“데이터에서 인간의 욕망을 어떻게 읽어야 하는가”에 대한 해답을 찾아가는 책

편견이나 선입관 없이, 데이터가 말해주는 것만을 먼저 파악한 다음 해석을 시도해야 한다.

인간의 욕망을 이해하는 것만큼이나 ‘데이터의 특성과 정의’를 이해하는 것이 중요한데, 이 점을 강조하지 않았다. 유일하게 아쉬운 점.




‘여기에 당신의 욕망이 보인다’라는 2012년 발행된 책의 연장선이자 변주에 가까운 책이다. 세상을 움직이는 것은 인간의 욕망이고, 인간의 욕망을 읽을 수 있는 선행지표나 현행지표로 데이터의 유용함을 주장하는 다음소프트 송길영 부사장님의 책 중 하나다. 이분을 통해 ‘행복의 기원’이라는 책을 알게 된 후, ‘사람의 욕구와 욕망’, 나아가 인간의 본성은 무엇이고 어떻게 발현되는지 책에서 언급될 때마다 정리하고 있다.




‘일상’과 ‘일탈’이라는 이분법은 인간의 행동을 설명하는 유용한 도구 중 하나였다. 같은 사람이라 해도, 일상이냐 일탈이냐에 따라 행동패턴과 소비패턴이 확연히 달라지기 때문이다. 보통 일상이라는 범주에서는, 사람들의 소비에 ‘경제성’이 최우선이다. 더 낮은 가격을 찾아 헤매는 사람들의 보편적인 범주다. 반면 일탈의 범주에서는 경제성보다 중요한 가치를 느끼면 소비자가 알아서 구매한다. 최우선 가치에서 경제성이 밀려난다. 판매자 입장에서 소비자의 일탈은 부가가치가 훨씬 높은 영역이다.
  
하지만 일탈과 일상의 핵심은 ‘변동성’이다. 대다수에게 일탈이었던 것이 일상이 되기도 하고, 일상이었던 것이 사람들의 인식 변화로 일탈이 되기도 한다. 일탈에서 일상으로 넘어온 대표 사례로 저자는 ‘아메리카노’를 꼽는다. 지금이야 아메리카노를 물처럼 살 수 있고 마실 수 있지만, 한때는 스타벅스에서 커피를 마시는 행동이 일탈이었던 시기가 있었다. 허영심 있는 사람이 젠체하러 가는 곳이 스타벅스라는 인식이 있었다. 이제는 아무도 그런 생각을 하지 않는다.
  
반대로, 일상에서 일탈의 영역으로 넘어간 아이템으로는 속옷이 있다. 남들 보여주는 용도로 입는 게 아니지만, 예전에 비해 화려한 속옷을 찾는 사람들이 늘어났다. 예전에는 값비싸고 화려한 속옷이 사람들의 이목을 끌지 못했지만, 이제는 값싸다는 이유만으로 사람들이 속옷을 사지 않는다. 강남역 사거리에 속옷 가게가 자리잡은 이유가 무엇이겠는가.




즉, 일상이냐 일탈이냐에 따라 사람들의 행동패턴과 소비패턴이 달라진다. 그 기저에는 다양한 형태의 욕망이 자리하고 있다. 같은 일탈이라 해도 소비자가 채우고자 하는 욕망은 다를 수 있다.
  
이 흐름을 이해하려면 어떻게 해야 할까. 저자는 ‘상상하지 말고 관찰하라’고 말한다. 자신의 경험에서 비롯된 모든 고정관념을 내려놓은 채, 사람의 행동을 관찰하고 생각을 읽어야 한다. 같은 행동이라 해도 시간에 따라, 장소에 따라 기저에 있는 욕망은 달라지며, 그 욕망이 모이는 지점에서부터 사업이 시작된다.
  
책의 예시는 커피를 마시는 직장인의 모습이었다. 아침에 마시는 커피와 점심시간에 마시는 커피, 오후 3~4시쯤 마시는 커피에 담긴 인간의 욕망을 해석했다. 간단히 요약하면, 아침에 마시는 커피는 뇌를 깨우고 당을 공급하기 위한 목적이기 때문에 보통 설탕이 들어간 믹스커피다. 점심시간에 식사를 마치고 밖에서 이야기하며 마시는 커피는 목에 건 사원증과 함께 지위재가 된다. ‘그래도 나는 번듯하게 살고 있다’는 메시지의 전달이다. 따라서 적당히 비싼 듯한 테이크아웃 커피를 주로 마신다. 오후 3~4시의 커피는 ‘이야기’의 매개다. 커피를 앞에 두고, 후미진 카페에 모여 비슷한 처지의 직장동료끼리 고초를 토로하는 해우소다. 따라서 같은 직장인을 상대로 하는 카페라 해도, 직장인의 목적에 따라 카페의 이용 행태가 다르게 된다.
  
관찰을 통해 위와 같은 행동을 파악하고 해석할 수 있다. 이러한 행동이, 흔적이 시시각각 남겨지는 곳이 바로 SNS이고 데이터다. 단, 자신의 경험을 바탕으로 결과를 상정한 채 데이터를 보거나 선입견을 갖고 데이터를 해석하면 위험하다. 데이터가 비추는 세상은 내 예상과 다르게 나타나는 경우가 많기 때문이다.
  
이를테면, ‘엄마’와 ‘영아’라는 키워드에서 자연스럽게 생각할 수 있는 단어는 모성애다. 그래서 ‘아이를 돌보는 행복한 엄마’를 상정하고 광고 기획을 할 수 있다. 그러나 SNS에서 언급되는 ‘엄마’와 ‘영아’의 공통단어 중 80%는 ‘괴로움’이라고 한다. 영아를 키우는 3년간은 엄마에게 괴로움의 시간이다. 모든 엄마에게 육아는 처음이라 서투르다. 아이도 하나에서 둘 정도만 낳기 때문에, 잘 키우고자 하는 욕심은 크다. 하지만 일반화된 육아 정보는 적용하기 어렵고, 부지런히 일해서 짬을 내야만 자기 시간이 있다.
따라서 젊은 엄마를 타겟으로 광고할 거라면, 모성애라는 관념에서 출발한 ‘행복한 엄마’로 접근하면 안 된다. ‘힘드시죠? 도와드릴께요’ 식의 접근이어야 한다.
  
  
이외에도 ‘수입맥주를 둘러싼 소비자의 시각 변화’라던지, ‘갱년기’라는 단어를 SNS를 통해 다르게 인식하고 접근해 성공한 제약업의 사례 등이 등장한다. 핵심은 ‘상정하거나 상상하지 말고, 인간(소비자)을 관찰한 다음 해석해야 한다’였다. 해석에는 고정관념이나 경험에 따른 선입견 대신 맥락이 필요하다. 팔고 싶은 물건과 그 물건을 사용하는 사람, 그 사람을 바라보는 주변 사람들까지 넓게 바라볼 수 있는 시각이 필요하다.




온라인 커머스 업체에서 데이터를 다루는 인턴 일을 하며 느낀 몇 가지를 첨언할 수 있을 것 같다. 저자는 데이터를 공개하고 모두가 데이터에 접근할 수 있도록 세상이 변하는 방향이 바람직하다고 주장한다. 아울러 접근성이 올라갈수록 더 많은 사람이 데이터를 활용할 수 있을 것이라고 예측한다.
  
하지만 인턴을 하면서 느낀 가장 큰 현실은, 데이터를 모두가 접근할 수 있게 공개하는 것과 데이터를 사람들이 활용하는 것은 완전히 다른 문제라는 것이었다. 데이터를 수집하고 분석, 활용해야 하는 온라인 커머스에서도 데이터를 읽을 수 있는 능력을 가진 사람은 많지 않았다. 아무리 데이터에 접근이 쉬워진다 해도, 데이터를 어떻게 이해해야 하는지 아는 ‘데이터 리터러시’ 능력이 없다면 소용없다. 
  
단적으로, 온라인 웹이나 앱에서 사용자의 행동을 추적하는 구글 애널리틱스의 기본 단위인 세션, User, Screen View(Page view)의 차이를 명확히 이해하고 있는 사람이 그리 많지 않다. 웹페이지에 얼마나 많은 ‘사람’이 들어왔는지는 세션, User, Screen View 중 무엇을 봐야 할까? 없다. 불가능하다. User는 웹페이지에 접근한 디바이스를 기준으로 단위를 세며, 한 명의 User가 여러 시간을 두고 접속할 경우 Session도 그때마다 카운트된다. 한 페이지의 노출 횟수를 단순합계하는 것이 Page view다. 하나의 세션에서도 Page View는 수없이 많이 일어날 수 있다. 구글 애널리틱스로 사용자 데이터를 보고자 할 때, 사용자를 구분하는 기본 단위를 제대로 모르면 데이터의 의미를 올바르게 읽어낼 수가 없다.
  
데이터를 읽을 때 ‘가설’을 상정하고 보는 경우도 많다. 데이터가 가설과 정반대의 모습을 보여준다면 다행이지만, 데이터의 결과가 ‘가설’을 뒷받침하는 듯한 모습을 보일 때 문제가 발생한다. 데이터가 어떤 정의를 바탕으로 수집되었는지 잘 모를 경우 해석에 오류가 발생할 수 있기 때문이다. 진짜로 상관관계가 있다고 봐야 하는지, 단순히 데이터의 분포가 그렇게 보일 뿐인지 알 수 없기 때문이다. 소위 ‘유사 상관관계’와 같은 문제가 있다. 
  
예를 들어 키와 소비의 상관관계를 조사했더니, 조사한 표본에서 키가 클수록 소비가 높다는 식의 관계가 나타났다고 하자. 주어진 데이터는 그렇게 보일 수 있어도, 실제로는 아무 관계가 없다는 걸 우리는 상식으로 알고 있다.
  

이 경우는 우리가 ‘키’와 ‘소비’의 의미가 무엇인지 알고 있기 때문에, 키와 소비가 사실상 관련이 없다는 사실을 안다. 하지만 만약 ‘키’와 ‘소비’라는 항목을 제대로 모르는 상태에서 키와 소비가 선형관계를 그린 그래프를 보았다면? ‘키와 소비는 관계가 있을 것이다’는 가설을 뒷받침하는 근거로 쓰일 수 있게 된다. 데이터 리터러시가 없는 조직에서 충분히 발생할 수 있는 문제다.




데이터 이면에 있는 인간의 욕망을 읽어내는 것, 좋다. 하지만 인간의 욕망을 데이터로 읽으려면 데이터가 어떻게 정의되었는지, 어떤 식으로 수집되었는지를 제대로 알아야 한다. 그래야 데이터를 잘못 바라보는 오류를 범하지 않을 수 있고, 데이터를 바탕으로 내린 의사결정이 현실을 제대로 반영할 수 있다. 데이터를 만들어내는 인간에 대한 이해 - 인문학 소양도 중요하지만, 데이터는 과연 무엇이고 어떻게 읽어야 하는지 이해하지 못하면 욕망을 잘못 읽어낼 수 있다.
  
데이터를 바탕으로 인간을 어떻게 이해할 수 있을지 분석 원칙과 사례를 제시한 좋은 책이다. 하지만 인간을 이해하는 것만큼이나 데이터의 정의와 특성을 이해하는 것 또한 중요하다.

댓글
댓글쓰기 폼