데싸노트의 실전에서 통하는 머신러닝

골든래빗 출판사로부터 전자책을 제공받아 작성했습니다.

TL;DR

  • 다채로운 예제를 활용한 분석 방법 제공
    • 모델에 따른 다양한 예제를 제공하기 때문에 데이터 전처리 등을 연습할 수 있음
    • 하나의 예제를 활용해서 2~3가지 모델을 적용하는 연습을 통해서 책에서 소개된 내용을 적용해 볼 수 있음
  • 주요 모델을 활용한 일관성 학습 과정을 소개
    • 문제 풀이 과정을 일관성 있게 제공하기 때문에 문제 해결 방식을 학습할 수 있음
    • 모델에 따른 특이점 및 차별점도 충실하게 소개하고 있기 때문에 문제 해결 기법에 따른 특성도 파악할 수 있음

책표지

다양한 예제

이 책은 데이터 분석 및 머신러닝에서 많이 활용되는 10가지 모델을 선정해서 학습하는 책이다. 많은 튜토리얼에서 scikit-learn에 포함된 몇가지 예제를 활용하는 경우가 많지만, 이 책은 예제를 다양하게 제시하고 있다.

책에 소개된 모델은 문제 해결 과정과 특징을 잘 엿볼 수 있는 예제와 함께 학습할 수 있다. 모델 학습과 동시에 제시된 예제의 데이터 구조나 특징도 함께 파악할 수 있다. 데이터 구조나 특징의 경우 머신러닝으로 문제를 해결 할 때 사용 하고자 하는 모델을 선택할 때 도움을 받을 수 있다.

데이터 전처리 부분이 좀 더 충실했으면 좋겠지만, 분량을 생각한다면 해당 책에서 소개하는 전처리 정도만 충실하게 배워두어도 좋을 듯 싶다.

모델 선택과 일관성

머신러닝을 공부하면서 모델에 대해서 설명하는 경우가 많다. 많은 책이 모델의 수학적 원리와 이론에 대해서 많은 지면을 할애하는데 반해서, 이 책은 모델을 활용해서 문제를 해결하는 과정을 잘 설명한다. 개별 모델의 특징과 차이점도 충실하게 설명하지만, 대부분의 문제 해결 방식이나 모델 적용이 큰 틀에서 ‘일관성’있게 제시하고 있다.

이런점은 다른 교재에 비해서 문제 해결 과정을 충실하게 학습 및 연습을 할 수 있기 때문에 이 책의 가장 큰 장점 중 하나라 할 수 있다. 모델에 대한 수학적이고 이론적인 부분은 다른 책이나 코세라 등을 참고해도 좋을 듯 싶다.

만약 해당 교재로 다양한 모델을 적용하고 싶다면, 책에서 제시하는 예제에 2~3가지 모델을 적용해보면 재미있는 공부를 할 수 있다.

이런 구성의 데이터 분석 책을 기대!

이 책으로 공부하면서 느끼는 거지만 역시나 전처리 과정만 잘 넘어가면 모델 적용은 어렵지 않다. 그래서 향후 데이터 전처리 책을 이 책과 유사한 구성으로 출간해주면 너무 좋을 것 같다.

모델의 특성상 난이도가 좀 어렵다고 느껴지는 부분도 있지만, 전반적으로 무난한 난이도라 할 수 있다. 만약 특별히 어렵게 느껴지는 부분이 있다면 해당 부분 건너띄고 읽어도 좋을 듯 싶다.

P.S 전자책 덕분에 예제 코드를 한결 수월하게 작성할 수 있었다. 전자책이 어색하신 분들은 종이책을 구매하셔도 좋을 듯 싶다.

Written on August 20, 2022