헬로 데이터 과학
하지만 데이터를 막상 받아든 분석가는 백지 상태에서 데이터를 보기 위해 노력해야 한다.
1
엑셀을 잘 활용해야 겠다는 작은 다짐, 문제는 기술과 도구가 아니라는 점에서 다시 시잭해야 겠다는 희망, 작은 문제가 큰 문제를 해결할 수 있다는 믿음.
모집단의 특성 및 모집단에서 표본이 추출되는 과정에 대한 ㄱ자ㅓㅇ이 필요하다. 이를 안다면 반대로 표본에서 모집단의 특성을 유츄해낼 수 있을 것이기 때문이다.
-
“보조장치 없는 인간의 지적 능력은 미약하기 짝이 없다. 종이와 펜, 컴퓨터와 같은 인지보조장치의 사용으로 인각의 기억과 사고력은 극적으로 향상된다” - 도널드 로먼 […] 데이터 과학에 있어서도 도구의 중요성은 예외가 아니다.
-
그래서 현업에서 R이나 파이썬과 같은 도구를 일상적으로 사용하는 필자도 분석 작업의 중간 중간에 샘플 데이터를 엑셀로 불러 검정하는 습관이 있다. 즉, 프로그래밍을 아는 사람들에게도 엑셀은 쓸모가 있는 도구다.
-
[…] 엑셀로 데이터를 공유하면 누구나 그 중간 과정을 검토하고 문제점을 발견하거나 개선하는 일에 참여할 수 있다. 즉, 데이터 처리 및 분석 과정의 투명성을 극대화할 수 있는 것이다.
-
[…] 실험 설계를 통해 가설의 진위 여부를 판별하는 것이 통계적 추론의 주된 방법이다.
-
이렇게 예측 분석을 통해 현상을 개선할 수 있게 해주는 기법이 기계학습의 주된 사례다.
-
[…] 여기서 정확성은 편향과 분산 관점에서 설명할 수 있다. 편향이 큰 경우는 측정값이 지속적으로 다른 요인의 영향을 받는 것이고, 분산이 큰 경우는 측정값에 무작위의 노이즈가 영향을 주는 경우다.
-
여기에는 데이터가 누구에 의해, 어떤 목적과 방법으로 언제 어디에서 수집되었는지가 포함되면, 이를 메타데이터라고 부른다.
-
“대단한 성취의 이면에는 대부분 사소해 보이는 준비 과정이 필요하다” - 로버트 슐러
-
이철럼 주어진 데이터를 다양한 각도에서 관찰하고 이해하는 과정을 탐색적 데이터 분석(EDA)라고 부른다.
-