SQL로 시작하는 데이터 분석

한빛미디어 “나는 리뷰어다” 활동을 위해서 책을 제공받아 작성된 서평입니다.

TL;DR

  • 다양한 데이터 분석 기법을 SQL을 활용해서 학습 가능
    • 초급 개발자/데이터 분석가의 경우 SQL을 사용해서 다양한 분석 방법을 활용하는 방법을 학습할 수 있음
    • SQL 실습 분량이 많기 때문에 SQL 연습이 필요하다면 이 책을 추천함
  • 과정과 결과를 확인할 수 있음
    • 데이터 분석에 활용되는 SQL 기법을 작성하는 과정을 배울 수 있음
    • 최종 결과를 시각화로 제시하기 때문에 SQL에 익숙하지 않은 분들에게 추천
    • Pandas를 사용해서 교재와 같은 구성으로 학습을 같이 진행하고 싶으시면 저의 저장소를 참고하셔서 나름의 개발 환경을 구성해보세요!
  • 초급자에게 난이도가 있음
    • 기본적인 SQL에 대한 설명이나 RDBMS를 설치하는 방법등을 모른다면 책의 난이도가 생각보다 높을 수 있음

책표지

실습이 많음

책 제목에 걸맞게 실습 분량이 상당하다. SQL을 다양한 형태로 활용할 수 있도록 각 챕터마다 데이터를 다양하게 사용하고 있기 때문에 실습할 때 지루하진 않다. 단순한 SQL 구문을 시작해서 복잡한 SQL 문장을 작성하는 형태로 진행한다. SQL에 익숙하지 않다고 하더라도 이 책을 활용해서 공부한다 고급 SQL 구문을 작성해 볼 수 있다.

SQL

단순한 SQL을 연습하는 과정도 필요하지만, 다양한 구조나 방법을 연습하는 방법이 필요하다. 이 책은 다양한 SQL을 연습할 수 있기 때문에 ORM을 주로 활용하는 현업 개발자나 SQL/엑셀을 기반으로 데이터를 분석하는 분들에겐 추천할 수 있는 책이다.

과정과 시각적 결과

이 책은 프로파일링/피벗 등을 사용해서 데이터를 분석하는 방법을 설명하고 있다. ‘쿼리문을 작성하는 순서’, ‘쿼리를 어떻게 구성해야 하는 방법’ 등 SQL을 활용해서 데이터를 다루는 방법과 과정을 설명하고 있다. 문제 해결을 위한 다채로운 기법을 연습할 수 있다.

시각적 표현

SQL 구문의 결과물을 시각화(그래프)로 표현해서 SQL 구문의 결과와 상호 비교해서 알려준다. 단순히 행과 열로 나타내는 데이터를 교재에서 시각적으로 제시하고 있기 때문에 SQL의 표현에 익숙하지 않은 분들에게 좋은 참고가 될 것이다.

파이썬을 활용하고 계시다면 Pandas와 Seaborn을 활용하실 수 있으시면, Jupyterlab을 활용하실 수 있습니다. 관련 자료는 제 저장소를 참고하세요!

Pandas 활용

초급자가 보기엔 쉽지 않음

이 책을 통해서 학습을 진행하다 보니, 데이터 분석을 처음 배우는 학습자 보다는 초급 개발자/현업 분석가에게 적합한 교재다. 기본적인 SQL이나 RDBMS 사용법이 익숙하지 않다면, 이 모든 과정이 쉽지 않을 것으로 예상된다.

데이터베이스 설치 등과 같은 것도 초급자에게 쉽지 않을 듯 하니, 이 책으로 SQL을 학습하고자 한다면 PostgreSQL이나 pgAdmin 사용법을 충분히 학습할 것을 권한다.

Written on August 20, 2022