공부하고 기록하는, 경제학과 출신 개발자의 노트

세줄요약 독서

숫자를 돈으로 바꾸는 데이터 읽기의 기술

inspirit941 2020. 1. 15. 20:42
반응형

200114

‘데이터 사이언티스트’ 현직자의 노하우와 철학을 담은 책

데이터는 수단일 뿐이며, 어떤 ‘목적’을 가지고 데이터를 볼 것인지를 처음부터 끝까지 강조한다.

데이터 사이언티스트가 미래라고, 각광받는 직업이라고 생각하는 사람들이라면 꼭 읽었으면 하는 책.
잠깐이나마 데이터 분석 쪽에서 일해봤던 입장으로 공감이 많이 됐다.

 

 

이 책을 관통하는 단 하나의 주제는 데이터의 목적이다. 데이터 분석가라면 내가 이 데이터를 왜, 어떤 목적으로 분석하려 하는지스스로 명확히 정의한 뒤 시작해야 한다는 내용이 책의 처음부터 끝까지 일관적이다. 대체로 기업은 데이터를 활용해 돈을 버는 것이 목적이고, 돈을 벌기 위해서는 소비자가 언제 돈을 쓰는지 파악해야 하며, 언제 돈을 쓰는지 이해한다는 건 결국 소비자를 이해한다는 큰 틀에 부합한다. 그 후에야 데이터 형식이나 세부적인 KPI 지표 등을 산출하고 평가하려는 세부적인 목적을 다룰 수 있고, 모델링 기법이나 도구는 그 후에야 중요해지는 내용일 뿐이다.

 


 

1장은 소비자를 파악하고 이해하기 위한 조언과 기술을 다룬다. 핵심은 영수증으로, 영수증은 소비자와 기업이 만나는 접점에서 누가, 무엇을, 언제, 어떻게, 어디서매출을 일으켰는지를 담고 있는 최소 단위에 해당한다. 멤버십 데이터로 어떤 고객이샀는지를 들여다보고, ‘어떤 상품의 어떤 특징이 매출에 기여했을지찾아보며, ‘몇 시 몇분 경, 어떤 결제방식을 활용했는지를 토대로 시계열 분석을 시행하거나 프로모션의 실마리를 잡을 수 있다. ‘어디서라는 지리정보는 주변 환경이나 날씨 데이터와 결합해 소비자의 주변 환경을 풍성하게 들여다볼 수 있게 해 준다.

 

누가부분을 분석할 때 저자는 인구통계학적 분류보다는 행동 단위별 분류가 훨씬 중요하고 의미 있다는 메세지를 일관적으로 전한다. 비슷한 연령대에 같은 성별이라고 해도, 기업의 매출에 영향을 미칠 법한 소비성향이나 호불호는 전혀 다를 수 있다. 성별차와 연령차보다 개인차가 더 심한 세상이기 때문에, 비슷한 행동이나 특징을 보이는 소비자별로 분류하는 작업이 훨씬 소비자 이해에 도움이 되기 때문이다.

 

예컨대, “20대 여성이 좋아하는 레스토랑이라는 문장을 보고 모든 20대 여성이 좋아할 만하다라고 액면 그대로 받아들이는 건 위험하다. 윗 문장이 의도하고자 했던 내용은 특정 SNS를 즐겨 하며, 사진이 예쁘게 담길 색감의 메뉴를 선호하는 사람이 찾는 레스토랑에 더 가까울 것이다. 특정 SNS를 즐겨하며, 사진의 색감을 선호하는 사람을 인구통계학적으로 분류하면 20대 여성이 유의미하게 많을 수는 있지만, 특정 성향이나 행동으로 묶일 수 있는 사람을 인구통계학 특징으로 끼워맞추는 시도는 앞으로 설득력이 떨어질 것이다.

 

 


 

2장은 데이터 앞에서 해야 할 질문 10가지라는 이름으로, 데이터 프로젝트를 하려는 기업의 책임자에게 던지는 메세지라고 봐도 무방했다. ‘우리 회사의 데이터 역량은 어느 정도인가, 데이터의 필요성을 구성원 모두가 느끼고 있는가, 내가 이해하는 만큼만 인정하려고 하는가, 많기만 하면 빅데이터인가, 시간 투자 없이 결과만 원하는가등의 소주제를 담고 있는데, ‘데이터나 분석에 무지하고, 배우거나 납득할 생각조차 하지 않는 사람들을 설득하고 있다.

 

데이터분석 하면 좋다니까, 트렌드라니까, 획기적인 결과를 가져올 수 있다고 혹한 윗선에서 데이터 프로젝트 하자는 식의 결론이 나는 걸 예방하기 위한 조치로 읽혔다. 2장의 10가지 질문 중 5가지는 기업에서 왜 데이터 프로젝트를 하고 싶은가, 프로젝트로 얻고자 하는 목적을 명확히 세운 것이 맞는가’, 나머지 5가지는 데이터 프로젝트의 특성을 이해하고 받아들일 준비가 되어 있는가, 현실적으로 프로젝트를 시행할 수 있는 환경인지는 파악하고 있는가를 다양한 관점에서 질문하고 있다.

 

주목할 내용은 데이터 중요성은 기업마다 다르다라는 조언이다. 데이터분석이 각광받고 있고 기업에게 추진력을 부여할 잠재력이 있는 건 사실이지만, 요즘 뜨는 형태의 데이터분석없이도 성공했고 잘 된 기업이 인류사에 훨씬 더 많다. 데이터 분석에 기업매출 자체가 좌우되는 기업과 데이터 분석 없이도 매출에 지장이 없었던 기업은 데이터분석을 보는 관점이나 시각이 다를 수밖에 없다. 데이터 분석 환경도 천차만별이라서, 개인정보 보안이나 이슈 등의 문제로 기업 내부에서 분석에 필요한 데이터를 다룰 수 없는 경우까지도 존재한다.

 

데이터 분석가 / 데이터 사이언티스트라는 직업이 각광받는다는 주장을 살펴들어야 하는 이유가 여기 있다. ‘미국 연봉 1, 향후 10년 가장 섹시한 직업 1위 데이터 사이언티스트같은 소리 말고, 한국에서 취업할 생각이라면 데이터 분석이 기업의 매출을 좌우할 만큼 핵심이었으며 앞으로도 그럴 가능성이 높은 기업이 한국에 많은지부터 봐야 한다. 데이터를 중심으로 생각해본 적 없던 대기업이 갑자기 데이터분석에 전사적 역량을 집중하는 게 쉬운 일은 아니다.

 

게다가 데이터 분석의 가치는 조직 관리자가 얼마나 데이터와 데이터분석을 이해하고 있는지에 따라 달라지는데, 아직까지 대부분의 기업은 데이터분석과 데이터 프로젝트 이해도가 낮은 편이다. 이 책에서 언급하는 수많은 조직관리자의 사례 – ‘피드백 한 번 없다가 프로젝트를 완성한 뒤에 보여주면 내가 생각한 것과 다르다고 일갈하는 유형, 빨리 분석할 수 있냐고 다그치는 유형, 자기가 이해하지 못하면 가치가 없다고 무시하는 유형... – 다 회사에 있을 법한 유형의 사람들이며, 관성을 바꾸지 않는 조직에 이해도 낮은 관리자와 함께 일하는 상황에서는 데이터 분석에서 혁신이나 놀라운 결과를 기대하기 어렵다.


데이터 분야에서는 내가 알고 있으나 말로 표현하기 어려운, 내재화된 지식을 알려주는 책은 거의 없거나, 있어도 해외 서적이어서 접근이 쉽지 않았다. 하지만 이 책은 오랜 기간 현업에서 일하며 습득한, 기술과 기술 사이에 존재하는 진짜 중요한 것들이 글로 잘 정리되어 있었다. 쉽게 배울 수 없는 것들을 모아둔 책이다” – 하용호, 전 카카오데이터팀 이사 

 

책의 추천사가 이렇게까지 정확히 내용을 요약한 경우는 흔치 않은 일인데, 책 내용과 추천사까지 어디 하나 버릴 것 없을 만큼 맞는 내용만 쓰였다. 데이터 분석 관련 직군으로 막 입사했는데 사수가 마땅히 없는 경우이거나, 데이터분석 쪽 취업에 관심 있는 학부생이라면 꼭 읽어보라고 추천하고 싶다.

 

데이터 읽기의 기술
국내도서
저자 : 차현나
출판 : 청림출판 2019.10.30
상세보기
반응형

'세줄요약 독서' 카테고리의 다른 글

학교에서 알려주지 않는 17가지 실무 개발 기술  (0) 2020.12.03
돈의 속성  (0) 2020.07.11
파이썬 자료구조와 알고리즘  (0) 2020.01.01
내 운명은 고객이 결정한다  (0) 2019.12.11
협력의 진화  (1) 2019.09.03