공부하고 기록하는, 경제학과 출신 개발자의 노트

데이터사이언티스트 6

숫자를 돈으로 바꾸는 데이터 읽기의 기술

200114 ‘데이터 사이언티스트’ 현직자의 노하우와 철학을 담은 책 데이터는 수단일 뿐이며, 어떤 ‘목적’을 가지고 데이터를 볼 것인지를 처음부터 끝까지 강조한다. 데이터 사이언티스트가 미래라고, 각광받는 직업이라고 생각하는 사람들이라면 꼭 읽었으면 하는 책. 잠깐이나마 데이터 분석 쪽에서 일해봤던 입장으로 공감이 많이 됐다. 이 책을 관통하는 단 하나의 주제는 ‘데이터의 목적’이다. 데이터 분석가라면 “내가 이 데이터를 왜, 어떤 목적으로 분석하려 하는지” 스스로 명확히 정의한 뒤 시작해야 한다는 내용이 책의 처음부터 끝까지 일관적이다. 대체로 기업은 ‘데이터를 활용해 돈을 버는 것’이 목적이고, 돈을 벌기 위해서는 소비자가 언제 돈을 쓰는지 파악해야 하며, 언제 돈을 쓰는지 이해한다는 건 결국 “소..

세줄요약 독서 2020.01.15

MS 본사 데이터 과학자가 알려주는 헬로 데이터 과학

데이터 분석을 할 때 생각해야 할 것들,목적이 무엇인지 / 어떤 기준으로 데이터를 수집해야 할지 / 분석은 어떻게 진행해야 하는지 / 필요한 지식에는 어떤 것들이 있는지 이정표를 제시하는 1차 안내서 데이터 사이언티스트에게 필요한 역량이 무엇인지 본인의 사례를 들어 소개하는 책. 소설처럼 쉽게 읽히는 책은 아니지만, 데이터가 무엇이고 어떻게 분석하는지 큰 틀을 보여준다. 171124 책을 읽고 생각이 많아지는 경우가 있고, 반대로 책을 읽고 생각이 수렴하는 경우가 있다. 보통 전자는 삶의 가치관을 돌아보게 하거나 대상을 바라보는 새로운 시각을 접했을 때고, 후자는 책을 통해 필요한 지식을 상당부분 충족했을 때다. 몰랐던 지식이나 정보를 얻었으니, 다음 단계로 나아가기 위해서는 어떤 것들이 필요한지 계획을..

세줄요약 독서 2017.11.28

4차 산업혁명과 데이터의 역할 - (3) 데이터가 ‘원유’가 되려면?

171103 엔코아 공감토크 - ‘4차 산업혁명과 데이터의 역할’ by 이화식 엔코아 대표이사 (3) 원유는 ‘오랜 시간, 다양한 종류의 유기물, 미생물, 무기물 등이 혼합되고 융합되는 과정을 거쳐 만들어졌다. 이 특징 때문에 원유는 정제하고 가공할 경우 다양한 산업분야에서 사용될 수 있었다. 데이터도 마찬가지다. 다양한 종류의 데이터가 융합될 때 비로소 거의 모든 산업에 영향을 미치는 존재가 될 수 있다. 데이터 융합이 어떤 식으로 되어야 하는 걸까? 그 해답은 사업 분야에 따라 다르다. 제조업과 서비스업이라는 두 개의 축으로 분류하자. 제조업은 ‘Value Chain’을 기준으로 데이터 융합이 이루어져야 하고, 서비스업은 ‘사람’을 중심으로 모든 데이터가 연결되고 융합되어야 한다. 서비스업은 이해가 ..

강연 2017.11.07

4차 산업혁명과 데이터의 역할 - (2) 4차 산업혁명과 빅데이터의 역할

171103 엔코아 공감토크 - ‘4차 산업혁명과 데이터의 역할’ by 이화식 엔코아 대표이사 (2) 이제 데이터를 보는 관점을 기업의 의사결정 차원에서 한 층 높여보자. 3차 산업혁명 이후 금융업이나 서비스업이 주목을 받던 시기가 있었지만, 한 국가의 경쟁력을 판단하는 가장 유의미한 지표는 제조업이었다. 한 국가를 나무에 비유한다면, 나무의 뿌리가 바로 제조업이라고 볼 수 있는 이유다. 제조업이라는 뿌리가 탄탄한 국가 위에, 금융업이나 의료업, 서비스업, 통신업과 같은 열매가 열릴 수 있었다. 한국의 경우, 세계 수준의 경쟁력을 지닌 반도체, 자동차, 철강, 조선업 등이 국가의 강한 체력을 유지할 수 있게 했다. 금융업과 서비스업으로 부를 창출하겠다는 움직임은 금융위기 이후 거의 사라졌다. 미국과 독일..

강연 2017.11.07

4차 산업혁명과 데이터의 역할 - (1) 빅데이터 분석의 돌파구는?

171103 엔코아 공감토크 - ‘4차 산업혁명과 데이터의 역할’ by 이화식 엔코아 대표이사 (1) 4차 산업혁명이란 단어를 보면 요즘은 거부감이 든다. 단어 자체의 문제가 아니라, 단어의 본질이 사라진 채 포장지로만 쓰이는 경우가 너무 많아서다. 유행어처럼 쓰인다고나 할까. 변화의 흐름을 짚어내는 게 아니라, 대충 자신에게 필요한 부분, 유리한 부분만 '4차 산업혁명'이라는 거창한 포장지로 치장하는 모습을 꽤 많이 봐 왔다. 생각했다. 4차 산업혁명이라는 허울을 쓰는 게 아니라, 4차 산업혁명이라는 표현의 의미와 다가올 변화의 핵심을 제대로 짚을 수 있는 강의가 있었으면 좋겠다고. 시중에 책은 이미 많이 나와 있지만, 다양한 산업분야의 변화를 전부 짚어내는 개괄서의 경우 깊이가 너무 없다. 아니면 정..

강연 2017.11.07

데이터 엔지니어 vs 데이터 사이언티스트 vs 데이터 분석가, 차이가 뭘까?

17.09.28 데이터 엔지니어를 꿈꾸는 사람들을 위한 세미나 - 패스트캠퍼스 성수캠퍼스 강연내용을 요약 정리한 글. 데이터분석 분야를 진로로 정한 후, 데이터 분석에 관련된 다양한 세미나를 가보기도 했고 업계 전문가를 만나서 이야기를 들어보기도 했다. 자신의 분야에서 데이터를 다룬다는 사람들에게 ‘진로를 고민하고 있으면 어떻게 해야 하느냐, 무엇을 공부하는 게 좋겠느냐’ 등의 질문을 하고 답변도 얻었다. 이 과정이 계속되고 조언이 누적되면서 생기는 문제점이 두 가지가 있었다. 첫 번째는 ‘업계에 따라 데이터분석 분야에 대한 접근 방식이 다르다’는 것이었다. 금융업, 스타트업, 분석솔루션 서비스 판매업에서 일하는 사람은 각각 데이터를 보고 활용하는 관점이 달랐다. 그래서 누군가는 통계학을, 누군가는 SQ..

강연 2017.10.02