앞으로 데이터 분석을 시작하려는 사람을 위한 책
데이터 분석에서 가장 중요한 것은 복수의 기술 영역을 연결하는 힘이며 이것은 사람만이 할 수 있는 일이다.
1
데이터 분석을 처음 접하는 초심자에게 유용한 책이다. 특히 ‘미국이 가르쳐 준 데이터 분석’은 경험이 없거나 데이터 분석 업무를 처음 시작하는 사람들에게 무척 추천하고 싶은 챕터이다.
2
기본적인 업무를 진행하고 있다면 ‘2장’의 내용을 중심으로 통계와 분석 기법을 진행해 나가면 좋을 것 같다.
3
‘3장’은 데이터 분석의 프로세스를 설명하고 있다. 팀원과 함께 업무를 진행하고 있다면 팀원들과 토론을 해보면서 읽으면 더 좋을 것 같다.
-
데이터 분석의 가장 큰 효과는 ‘의사 결정 프로세스의 최적화’다. 복잡한 수리 모델을 구축하는 것도, 대규모 데이터를 빠르게 처리하는 것도 아니다.
-
조금 전문적인 이야기를 하면 통계는 평균과 분산의 과학으로, 평균에서 벗어날수록 데이터의 미분값(변화의 정도)이 다른 측면을 보이기 시작한다는 특징이 있다.
-
충분한 지원을 하는 대신 명확한 자기 책임을 부여하면서 자율적으로 목표를 정하고 달성할 것을 촉구한다.
-
[…] 그러므로 리더는 최고의 멤버들을 모아서 명쾌한 비전과 도착점을 제시함은 물론이고 그들이 전체 최적을 실현할 수 있도록 협력하기 용이한 환경을 만들어야 한다.
-
[…] 프로젝트가 성공하려면 경영자는 물론이고 현장 사원들의 동의와 협력이 반드시 필요하다.
-
데이터 분석에서 가장 중요한 것은 복수의 기술 영역을 연결하는 힘이며 이것은 사람만이 할 수 있는 일이다. 데이터 분석팀의 리더가 가장 중요한 ‘채용’ 프로세스를 남에게 떠넘겼는데도 성공한 기업은 본 적이 없다.
-
[…] 미국에서 다국적팀을 구성하는 전제 조건은 높은 전문 기술력이다.
-
통계적 사고의 기초가 되는 ‘평균’과 ‘분산’, ‘표준 편차’등의 개념을 이해 […] ‘분산’을 이용해 들쭉날쭉한 정도를 계산하려면 기준이 되는 지표, 즉 평균값이 필요하다. […] ‘평균적인 들쭉날쭉함’으로 지표화된 ‘표준 편차’로 새롭게 태어난다.
-
변동 계수 - 상대적인 들쭉날쭉함을 보기 위한 지표
-
베이지안 확률은 극단적으로 말하면 감이나 경험을 바탕으로 한 확률에 입수한 데이터의 결과를 반영시켜 새로운 확률을 산출하는 분석 수법이다.
-
[…] 그러나 아무리 당사자에게 흥미로운 발견이라고 해도 기업에 투자액을 웃도는 이익을 안겨 주지 못한다면 비즈니스적으로는 손실일 뿐이다.
-
[…] 가령 정확성이 20퍼센트 정도라면 20퍼센트의, 80퍼센트라면 80퍼센트의 정확도로 가설이라든가 예측 모델을 만들 수 있다. 중요한 점은 그 전제를 제시하는 것이다.