헬로 데이터 과학

하지만 데이터를 막상 받아든 분석가는 백지 상태에서 데이터를 보기 위해 노력해야 한다.

1

엑셀을 잘 활용해야 겠다는 작은 다짐, 문제는 기술과 도구가 아니라는 점에서 다시 시잭해야 겠다는 희망, 작은 문제가 큰 문제를 해결할 수 있다는 믿음.

모집단의 특성 및 모집단에서 표본이 추출되는 과정에 대한 ㄱ자ㅓㅇ이 필요하다. 이를 안다면 반대로 표본에서 모집단의 특성을 유츄해낼 수 있을 것이기 때문이다.


  1. “보조장치 없는 인간의 지적 능력은 미약하기 짝이 없다. 종이와 펜, 컴퓨터와 같은 인지보조장치의 사용으로 인각의 기억과 사고력은 극적으로 향상된다” - 도널드 로먼 […] 데이터 과학에 있어서도 도구의 중요성은 예외가 아니다.

  2. 그래서 현업에서 R이나 파이썬과 같은 도구를 일상적으로 사용하는 필자도 분석 작업의 중간 중간에 샘플 데이터를 엑셀로 불러 검정하는 습관이 있다. 즉, 프로그래밍을 아는 사람들에게도 엑셀은 쓸모가 있는 도구다.

  3. […] 엑셀로 데이터를 공유하면 누구나 그 중간 과정을 검토하고 문제점을 발견하거나 개선하는 일에 참여할 수 있다. 즉, 데이터 처리 및 분석 과정의 투명성을 극대화할 수 있는 것이다.

  4. […] 실험 설계를 통해 가설의 진위 여부를 판별하는 것이 통계적 추론의 주된 방법이다.

  5. 이렇게 예측 분석을 통해 현상을 개선할 수 있게 해주는 기법이 기계학습의 주된 사례다.

  6. […] 여기서 정확성은 편향과 분산 관점에서 설명할 수 있다. 편향이 큰 경우는 측정값이 지속적으로 다른 요인의 영향을 받는 것이고, 분산이 큰 경우는 측정값에 무작위의 노이즈가 영향을 주는 경우다.

  7. 여기에는 데이터가 누구에 의해, 어떤 목적과 방법으로 언제 어디에서 수집되었는지가 포함되면, 이를 메타데이터라고 부른다.

  8. “대단한 성취의 이면에는 대부분 사소해 보이는 준비 과정이 필요하다” - 로버트 슐러

  9. 이철럼 주어진 데이터를 다양한 각도에서 관찰하고 이해하는 과정을 탐색적 데이터 분석(EDA)라고 부른다.

Written on May 14, 2016