앞으로 데이터 분석을 시작하려는 사람을 위한 책

데이터 분석에서 가장 중요한 것은 복수의 기술 영역을 연결하는 힘이며 이것은 사람만이 할 수 있는 일이다.

1

데이터 분석을 처음 접하는 초심자에게 유용한 책이다. 특히 ‘미국이 가르쳐 준 데이터 분석’은 경험이 없거나 데이터 분석 업무를 처음 시작하는 사람들에게 무척 추천하고 싶은 챕터이다.

2

기본적인 업무를 진행하고 있다면 ‘2장’의 내용을 중심으로 통계와 분석 기법을 진행해 나가면 좋을 것 같다.

3

‘3장’은 데이터 분석의 프로세스를 설명하고 있다. 팀원과 함께 업무를 진행하고 있다면 팀원들과 토론을 해보면서 읽으면 더 좋을 것 같다.


  1. 데이터 분석의 가장 큰 효과는 ‘의사 결정 프로세스의 최적화’다. 복잡한 수리 모델을 구축하는 것도, 대규모 데이터를 빠르게 처리하는 것도 아니다.

  2. 조금 전문적인 이야기를 하면 통계는 평균과 분산의 과학으로, 평균에서 벗어날수록 데이터의 미분값(변화의 정도)이 다른 측면을 보이기 시작한다는 특징이 있다.

  3. 충분한 지원을 하는 대신 명확한 자기 책임을 부여하면서 자율적으로 목표를 정하고 달성할 것을 촉구한다.

  4. […] 그러므로 리더는 최고의 멤버들을 모아서 명쾌한 비전과 도착점을 제시함은 물론이고 그들이 전체 최적을 실현할 수 있도록 협력하기 용이한 환경을 만들어야 한다.

  5. […] 프로젝트가 성공하려면 경영자는 물론이고 현장 사원들의 동의와 협력이 반드시 필요하다.

  6. 데이터 분석에서 가장 중요한 것은 복수의 기술 영역을 연결하는 힘이며 이것은 사람만이 할 수 있는 일이다. 데이터 분석팀의 리더가 가장 중요한 ‘채용’ 프로세스를 남에게 떠넘겼는데도 성공한 기업은 본 적이 없다.

  7. […] 미국에서 다국적팀을 구성하는 전제 조건은 높은 전문 기술력이다.

  8. 통계적 사고의 기초가 되는 ‘평균’과 ‘분산’, ‘표준 편차’등의 개념을 이해 […] ‘분산’을 이용해 들쭉날쭉한 정도를 계산하려면 기준이 되는 지표, 즉 평균값이 필요하다. […] ‘평균적인 들쭉날쭉함’으로 지표화된 ‘표준 편차’로 새롭게 태어난다.

  9. 변동 계수 - 상대적인 들쭉날쭉함을 보기 위한 지표

  10. 베이지안 확률은 극단적으로 말하면 감이나 경험을 바탕으로 한 확률에 입수한 데이터의 결과를 반영시켜 새로운 확률을 산출하는 분석 수법이다.

  11. […] 그러나 아무리 당사자에게 흥미로운 발견이라고 해도 기업에 투자액을 웃도는 이익을 안겨 주지 못한다면 비즈니스적으로는 손실일 뿐이다.

  12. […] 가령 정확성이 20퍼센트 정도라면 20퍼센트의, 80퍼센트라면 80퍼센트의 정확도로 가설이라든가 예측 모델을 만들 수 있다. 중요한 점은 그 전제를 제시하는 것이다.

Written on February 11, 2016