빅데이터 베이스볼 - 20년간 실패한 팀은 어떻게 승자가 되었나

[…] 호퍼(Grace Hopper)는 이런 말을 남겼다. “수학을 배워도, 사람들에게 설명할 수 없다면 아무런 소용이 없다”

1

이 책은 야구에서 빅데이터가 어떻게 활용되었고, 어떻게 팀에 적용했는지에 관한 내용을 실화를 바탕으로 소개하고 있다.

빅데이터 베이스볼은 수치화된 데이터를 기반으로 구단을 경영하고 운영하는 내용을 담고 있다. 이와 유사한 주제로 잘 알려진 책으론 머니볼도 있다. 머니볼의 주된 내용은 야구 구단을 경영하고 운영하는 내용임에도 불구하고 뜯어보면 통계를 더 중요하게 다루고 있으며, 경영학 도서로 분류된다. 빅데이터 베이스볼도 마찬가지로 경영학에 관한 내용으로 볼 수 있다. 두 권의 차이를 나타내는 지점은 ‘무엇’을 경영할 것인가에 대한 물음이다.

빅데이터 베이스볼머니볼의 문제 상황은 “객관적인 데이터를 가지고 구단을 어떻게 운영할 것인가?”이다. 이 질문에 대한 답변으로 두 권의 책은 서로 같지만 다른 답변을 제시한다. 머니볼이 거시적인 관점(혹은 전략)을 다루고 있다면, 빅데이터 베이스볼은 미시적인 관점(혹은 전술)을 다루고 있다. (화자의 차이 때문일까?) 따라서 경영적인 측면도 두 관점의 차이를 반영한다.

2

객관적인 데이터를 만드는 방법으로 빅데이터 베이스볼머니볼에서 다루는 세이버매트릭스를 활용한다. 시간이 많이(?) 흐르고, MLB에서 데이터를 수집하는 방식이 엄청나게 좋아져서 야구 데이터의 수가 기하급수적으로 많아졌다. 따라서 그 많은 데이터 혹은 빅데이터를 전문적으로 다루는 방법이 추가되었다. 이런 데이터를 다루는 방법은 책에 자세히 소개되어 있으니 참고해보면 좋을 것 같다.

3

이 책은 나에게 ‘데이터를 수집하고 분석’하는 것 뿐만 아니라 ‘시각적인 표현법’에 대해서도 꼼꼼하게 챙겨야겠다는 확신을 주었다.

4

번역가 이창섭님의 도움으로 좋은 책 소개받고 읽을 수 있게 되어서 너무너무 감사드립니다. ^^/~

폭스는 이렇게 말했다. “시각 자료를 만드는 데 많은 시간을 썼어요. 눈으로 보면 새로운 이론을 받아들이기가 훨씬 쉬워집니다. 선수들이 ‘생각해보면 그리 극단적이진 않네요. 타구가 그쪽으로 날아가니 거기에서 수비하는 게 맞을 거 같아요’라고 인정하게 되는 겁니다.”


  1. 허들은 이렇게 말했다. “선수를 트레이드하거나, FA선수를 영입하고, 죄다 뜯어고치는 것이 능사는 아닙니다. 먼저, 직면한 도전과제를 확인하고 우리가 보유한 선수단의 구성을 유심히 살펴봐야 합니다. 그리고 성적을 끌어올리려면 어디에 변화를 줘야 할지 고민해야 합니다.”

  2. 구단의 임직원과 선수 모두가 협력하고, 협심하고, 대화하고, 서로를 존중해야 한다. 타석에 한 번도 서 본 적이 없는 외부인이 분석한 데이터와 개념을 구식 코치들이 포용해야 한다. 또한 데이터 분석가들도 파이어리츠의 클럽하우스 문화에 더 잘 녹아들어야 한다.

  3. […] “살면서 가장 참담한 일은 어린 딸에게 희귀병이 있다는 말을 의사에게 듣는 것입니다. 그에 비하면 야구는 게임에 불과합니다. 난 이 사실을 몸소 배웠습니다. 이런 철학을 선수들과도 공유하려 노력합니다.”

  4. “내가 때때로 통계 분석에 냉담한 반응을 보이는 이유는 익숙한 분야가 아니기 때문입니다. 난 그런 식으로 교육 받은 사람이 아닙니다. 통계 분석에 대한 깊이 있는 지식이나 이해도 부족하죠. 통계를 깊숙이 이해하려면 많은 변화가 필요했습니다.” 허들이 말했다.

  5. […] 하지만 최근에 새로운 투구추척시스템이 개발되고, 컴퓨터의 정보 처리 능력도 향상되고, BIS처럼 상세한 데이터를 제공하는 업체들이 생긴 덕분에 야구는 새로운 시대를 맞이했고, 매일 접할 수 있는 데이터의 양도 기하급수적으로 증가하고 있다. […] 셀 수 없이 많은 정보가 쏟아져 나오는 상황에서 이 모든 정보를 분류하고, 분석하고, 이해하는 건 결코 쉽지 않았다. 이해하려면 알고리즘을 짤 수 있고, 데이터베이스 프로그래밍에 능숙한 컴퓨터공학 및 수학 분야의 전문가가 필요했다. 데이터 분석에 능한 구단의 프런트오피스 직원은 최대한 날것 그대로의 정보를 손에 넣어서 자신만의 방식으로 선수들의 능력과 가치를 평가하고, 상대팀의 약점을 찾으려 한다.

  6. […] 호퍼(Grace Hopper)는 이런 말을 남겼다. “수학을 배워도, 사람들에게 설명할 수 없다면 아무런 소용이 없다”

  7. 맨땅에서 그런 시스템을 구척하려면 해야 할 일이 한두 가지가 아니었다. 첫 해엔 업무 시간의 90퍼센트를 구단의 데이터베이스인 MITT를 구축하는 데 쏟아부었다. 원하는 데이터의 출처를 파악하고, 해당 데이터를 사용할 권리를 구입하고, 소프트웨어를 개발하고, 이 모든 것을 하나로 묶어 시스템으로 만들어야 했다.

  8. “우리는 기존의 야구 이론에 얽매이지 않고 항상 더 나아지려 노력합니다. 물론 기존 이론이 맞을 때도 있지만 단순히 오래됐다는 이유만으로 여전히 남아 있는 이론도 있습니다. 우리는 새로운 정보에 귀를 기울이고, 거기에 모든 걸 걸기로 했습니다.” 스타크가 말했다.

  9. “[…] 나라는 사람에 대한 신뢰가 쌓일수록 내가 내미는 정보에 대한 신뢰도 높아집니다. 2012년엔 그런 신뢰가 생겼습니다.”

  10. 가치가 숨어 있는 선수를 찾아내서 합당한 돈을 지불하고 영입해야 한다.

  11. “[…] 하지만 무슨 짓을 해도 결론은 똑같았다. 즉, 페어 지역으로 날아간 타구가 안타가 될지 아웃이 될지 결정하는 건 투수의 능력과 날아간 타구가 안타가 될지 아웃이 될지 결정하는 건 투수의 능력과 아무런 상관이 없다는 것이다. 110년의 세월 동안 투수를 평가해 온 방식을 정면으로 반박하는, 논란이 될 발언이라는 건 잘 안다.”

  12. 폭스는 이렇게 말했다. “시각 자료를 만드는 데 많은 시간을 썼어요. 눈으로 보면 새로운 이론을 받아들이기가 훨씬 쉬워집니다. 선수들이 ‘생각해보면 그리 극단적이진 않네요. 타구가 그쪽으로 날아가니 거기에서 수비하는 게 맞을 거 같아요’라고 인정하게 되는 겁니다.”

  13. […] 감독은 CEO처럼 유능한 인재를 자신의 곁에 두고 업무를 위임해야 한다.

  14. “코치들의 전문성이 빛을 발하려면 분석팀과 한 몸이 되어 일해야 합니다. […] 최대한 클럽하우스 주변에 머물려고 노력했습니다. 코치들에게는 내겐 없는 선수나 전략에 대한 광대한 지식이 있고, 내가 겪어 보지 못한 다양한 상황도 경험해봤기 때문이죠.”

  15. 피츠제럴드는 빅데이터를 이렇게 말한다. “통계 분석가의 일이 대부분 수학과 관련된 것은 맞지만, 통계 분석이 단순한 과학이다. 아니면 예술이냐에 대한 논쟁은 여전히 뜨겁습니다. 난 예술적인 면도 존재한다고 생각해요. 그게 없는 통계 분석은 아무 의미가 없죠.”

Written on January 4, 2016