공부하고 기록하는, 경제학과 출신 개발자의 노트

세줄요약 독서

구글에서 배우는 딥러닝

inspirit941 2017. 11. 12. 16:59
반응형

171112



딥러닝과 머신러닝, 인공지능이 어떤 것이고, 어느 수준에 이르러 있으며, 발전의 방향이 어디인지를 짚어주는 훌륭한 요약서

모바일 First에서 AI First로 방향을 전환한 구글이 제공하는 AI 서비스를 소개하고, 구글 엔지니어들과의 인터뷰를 통해 구글이 지향하는 미래 방향을 보여줌

AI와 딥러닝을 사업에 적용하려면 무엇을 확고히 해야 하는지, 해당 분야로 진출하고 싶은 사람들에겐 어떤 능력이 필요한지를 간단히 알려주는 길잡이.



2017년 9월에 발간된 책이다. 구글의 엔지니어들과 인터뷰한 내용을 담고 있다. 즉 구글이 보유하고 있는 기술이 어느 정도까지 상용화됐는지, 구글 엔지니어들이 보고 있는 딥러닝과 머신러닝, 인공지능 기술의 현재와 미래를 친절하게 짚는다.
  
인공지능; 잊을 만하면 뉴스에 언급되고, 구글이나 아마존, 애플이 사활을 걸고 있는 미래 기술이라는 것 정도는 알겠는데 정확히 어떤 기술인지 모르는 사람이 읽기에 적합하다. 구글이 제공하는 서비스가 우리에게 꽤나 익숙하다는 점 - 구글포토나 구글검색, 구글 어시스턴트 등 - 도 이 책의 진입장벽을 낮춘다.
  
머신러닝은 간단히 말해, 학습시킬 데이터를 많이 준비해 컴퓨터에게 입력하면, 컴퓨터가 자동으로 최적의 알고리즘을 찾아내는 것이다. 이전까지 이루어졌던 컴퓨터 학습과의 가장 큰 차이점은, ‘알고리즘’을 인간이 만들어서 컴퓨터에게 입력하는 것이 아니라, 주어진 데이터를 바탕으로 컴퓨터 스스로 알고리즘을 만드는 것이다.
이를테면, y=x라는 함수는 알고리즘이다. 이 알고리즘을 컴퓨터에 입력한 다음 데이터를 집어넣으면, 컴퓨터는 데이터를 반환한다. x=1을 넣으면 y=1(정답)이라는 값을 반환하는 식이다. 반대로, 머신러닝은 (1,1), (2,2), (3,3), (-1,-1) ... (1000, 1000) 과 같은 데이터를 컴퓨터에게 주고 학습을 시키는 식이다. 컴퓨터는 이 데이터를 바탕으로 y=x라는 알고리즘을 유추해낸다. 데이터를 많이 학습시킬수록 알고리즘의 정확도가 높아지는 구조다.
  
딥러닝은 머신러닝에 포함된 개념으로, 인간의 뇌신경망 구조를 본따 복잡한 결정을 할 수 있게 컴퓨터를 학습시킬 수 있는 기술이다. 위의 예시에서 x=1을 입력할 때 y=1이라는 결과를 반환하는 것은 뇌에 비유하면 세포 하나에서 다른 세포 하나로 신호가 이동한 것이다. 딥러닝에서는 뇌의 세포 하나에 대응하는 값을 Node(노드), 학습을 마친 기계가 주어진 데이터로 계산을 마치고 결과를 반환하는 하나의 과정을 Layer(레이어)라고 한다. 이 Layer가 여러 개 나열되면, 데이터를 투입했을 때 좀 더 복잡한 계산을 거친 결과를 반환할 수 있다.
  
이미지 인식기술이 적당한 예시다. 사람의 얼굴을 인식할 수 있게 학습을 마친 기계에 사진 데이터를 투입한다. 딥러닝의 첫 번째 레이어는 이미지 픽셀의 밝기를 구분한다. 밝기 구분을 마치면, 두 번째 레이어는 이미지를 선으로 연결해, 어떤 식으로 사진이 생겼는지 구분한다. 세 번째 레이어는 선과 명암의 조합으로 사람의 눈, 코, 입의 위치를 인식한다. 마지막 레이어를 거치면 비로소 사람의 얼굴을 인식해 결과를 반환할 수 있게 된다.
  
딥러닝의 레이어 수가 많고, 레이어의 노드 수가 많을수록 복잡한 계산이 가능해진다. 알파고의 경우 ‘딥러닝’ + ‘몬테카를로 트리 탐색’이라는 두 개를 큰 축으로, 수백만 개의 노드와 12계층의 신경망으로 이루어져 있었다.
  
기계학습은 지도방식에 따라 두 가지로 나뉜다. y=x 알고리즘처럼 투입할 데이터와 산출할 데이터값(=정답) 두 가지를 모두 기계에게 학습시키는 경우를 지도학습, 산출할 데이터값(정답) 없이 데이터 투입만으로 컴퓨터 스스로 정답을 찾도록 하는 학습이 비지도학습이다. 비지도학습은 강화학습을 포함하는 개념이며, A라는 상태에서 B라는 상태로 바뀔 때, 바뀐 상태가 정답에 근접하는 길인지 그 시점에서는 확인 불가능할 때 보통 사용한다. 많은 양의 데이터를 입력해, 데이터 자체의 구조를 파악하고자 할 때 특히 유용하다.
  
머신러닝과 딥러닝의 가장 큰 특징이라면, 인간이 정답만 제공하고 풀이법을 제공하지 않는다는 데 있다. 컴퓨터 스스로 데이터를 학습하면서 정답을 찾아가기에, 인간이 예상하지 못했던 풀이가 등장할 수 있다. 알파고의 사례가 그렇고, 딥러닝으로 학습한 기계가 음악이나 소설, 미술작품을 만들어냈다는 뉴스가 이를 보여준다. ‘크리에이티브’라는 측면에서 딥러닝이 하나의 방법으로 떠오를 수도 있다는 점이다.
  
머신러닝과 딥러닝, 인공지능과 같은 기술을 활용하고자 할 경우 보통 목적은 세 개로 나눈다. 1. 비용 절감, 2. 부가가치를 높여 새 비즈니스를 창출, 3. 크리에이티브성을 높이는 것. 기업의 경우, 보유하고 있는 이미지나 텍스트 데이터를 활용해 비용을 절감하려 하는 경우(콜센터에 활용하거나, 챗봇을 만들고자 하는 이유)가 많다. 
이 책에서도, 우선은 ‘비용 절감’의 관점에서 도움이 되는지를 확인하고 도입하는 것이 중요하다고 조언한다. 딥러닝이 모든 분야에서 해결책이 될 수 있는 만능키가 아니기 때문이며, 딥러닝의 특성인 ‘전용(轉用)’을 활용한다면 비용 절감에서 ‘부가가치 창출’ 방향으로 전환하기에도 용이하기 때문이다.
  
미래에 필요한 인재상으로는 네 가지를 제시한다. 1. 비즈니스를 앞장서서 이끄는 사람, 2. 딥러닝 기술자나 데이터 과학자, 3. 모델에 내장된 시스템을 만드는 엔지니어, 4. 비즈니스, 엔지니어, 과학자의 가교 역할을 할 수 있는 사람.
특히, 이 책의 구글 엔지니어들은 가교 역할을 할 수 있는 4번 유형의 인재가 많아야 인공지능 기술이 제대로 녹아들 수 있다고 주장한다. 4번 인력이 부족하면, 인공지능 기술을 제대로 사업에 활용하기 어려울 수 있고, 한때의 열풍으로 그칠 가능성이 높다고 판단하기 때문이다. 고급 기술 자체는 구글이나 여타 기업이 API를 공개하기 때문에 진입 장벽이 낮아지는 추세다. 따라서 비즈니스에 제대로 활용하는 청사진을 그릴 수 있는 사람, 인공지능 프로젝트를 관리할 수 있는 인재의 중요성을 주장한다.
  
  

개인적으로는, 머신러닝과 딥러닝, 인공지능의 개념을 쉽고 빠르게 머리에 정립하는 데에는 최고의 책이었다. 인공지능과 빅데이터에 관심이 높은 지금, 뉴스에서 자주 쓰이는 단어의 뜻을 이해하고 기술이 어느 정도까지 발달했는지 빠르게 읽을 수 있었다.

반응형