한국어 임베딩 - 자연어 처리 모델의 성능을 높이는 핵심 비결 Word2Vec에서 ELMo, BERT까지
1
한국어 임베딩이 필요한게 아니라, 단지 ‘부록’ 때문에 선택한 책이다. 대부분의 텍스트마이닝 어쩌고 저쩌고 하는 교재들의 경우 영어권 텍스트는 별 문제 없지만, CJKV 언어는 뭔가 답 없다 느껴지는 경우가 많았다. 반면 이 책은 부록에서 국어학 기초를 다루고 있다는 점에서 믿음을 가지고 구매했다.
2
그리고 한국어 임베딩은 어쩌자고 그러는지 모르겠지만 JVM을 필요로 한다. 그런데 도커를 사용해서 실습할 수 있도록 잘 구성된 환경을 제공하기 때문에 별다른 어려움 없이 책을 읽을 수 있었다.
3
반면, 실습 환경 구축에 어려움을 겪는다면… 흠…? 일단 도커부터 배우고 이 책에 도전하다. 왜냐하면 한국어 처리 관련된 교재 중에선 이 책이 가장 좋은 것 같다. 그러니 도커를 배우자!
Written on November 25, 2019