평균의 함정

1

총 47장 중에서 ‘4부 20장’까지는 유익한 통계이론에 대해서 설명하고 있다. 그리고 5부 이후에는 응용 및 경영에 대해서 설명하고 있다.

2

통계학을 제대로 배우지 않아서 생각보다 어렵게 느껴진기 했지만, 최소한 통계학을 공부할 때 중점적으로 공부해야 하는 부분을 알 수 있어서 좋았다.

3

만약 경영에 대한 이해가 높았다면 뒷부분에 설명하고 있는 응용 및 경영의 사례부분에서 더 많은걸 느낄 수 있을꺼라 생각했지만 아쉽게도 배경지식이 부족해서 가벼운 읽은꺼리가 되어서 아쉽다.


“평균”이란 이토록 곤란한 단어다.

[…] 평균은 여러 형태들이 있는데, 그 중에서 우리들이 일상생활에서 자주 접하는 산술평균이 평균(average)으로 자주 인용되고 있다. 산술평균은 먼저 여러 숫자들을 합하고, 이를 샘플 수로 나누어서 얻은 값이다. 그러나 후자의 평균은 산술평균(arithmatic mean), 중앙값(median), 그리고 최빈값(mode) 중 하나를 취하게 된다.

괴델 소환하는 주문을 시전하고 있구나…!

“이 세상에 존재하는 모든 현실은 불확실하고, 만약 확실한 것이 이 세상에 존재한다면, 그것은 현실이 아니다.”라고 아인슈타인이 지적했듯이, 우리들이 마주하는 의사결정문제들 중 확실한 것은 이 세상에 하나도 없다.

인간은 “합리적”이지 않다.

[…] 이러한 교육방법으로 인하여 확률론과 통계학 분야에서 오랫동안 연구해 온 사람들조차도 매일같이 발생하고 있는 불확실성에 직면하게 되면 여지없이 많은 실수를 범하고 있다는 사실이 행동경제학 분야의 연구로 노벨 경제학상을 받은 수상자들의 논문들에서 밝혀지고 있다.

평균은 평균일 뿐이다.

패트릭 리치는 그의 저서 “내게 숫자 하나를 줄 수 없습니까?”에서 사람들이 평균값에 왜 그토록 얽매이는지를 명쾌하게 설명하고 있다. 그의 지적에 의하면 일단 평균값이 계산되면, 사람들은 이 평균값을 거의 절대적으로 신뢰하면서 이를 기록하고 그들의 사업계획에 적용하고 있다고 한다. […] 이러한 사례에서와 같이 직장 상사들은 실제로 부하 직원들로부터 올바른 평균값을 제공받음에도 불구하고, 그들의 예측치가 빗나갈 경우 그들은 부하들로부터 잘못된 예측치를 제공받았다고 믿으면서 부하 직원들을 비난하는 것이 일반적이다. 이러한 경영관행을 우리들에게 잘 알려진 딜버트의 비율 문제(Problem of Dilbertian Proportion)라고 한다.

평균에 집착하는 것이 아니라 ‘분포’가 중요하다.

확률경영의 관리 대상은 숫자가 아니고 불확실성, 즉 확률분포함수이다. 그리고 확률경영에서 사용하고 있는 중앙 데이터베이스는 미래에 발생할 수 있는 불확실한 비즈니스 모수(parameter)들 수천 개를 포하하고 있는 시나리오 라이브러리이다. 이 라이브러리는 대형 중앙 데이터베이스와 달리 워드프로세서로 문서화되고 스프레드시트로 수치화된 확률분포함수를 생성하는 데스크톱 분포 프로세서와 상호간에 필요한 정보를 주고받는다.

이 형님은 어디든 나타나신다.

모델 개발의 다섯 단계 - 도날드 크누스(Donald Knuth), 스탠퍼드 대학교 컴퓨터 과학자 […] 1. 모델의 업무 수행이 무엇인지를 결정하여라., 2. 모델을 어떻게 개발할 것인지를 결정하여라., 3. 모델을 개발하여라., 4. 모델을 수정하고 보완하여라., 5. 당신이 처음 무엇을 정말로 원했는지를 알기 위해 단계 1부터 4까지를 완전히 잊어버리고 새롭게 시작하여라.

애자일 개발 방법론…?!

“대규모 모델을 작동시키기 위해서는 먼저 작동되는 작은 모델부터 시작해야지 작동되지도 않는 대규모 모델로 시작해서는 안 된다.” - 앨런 맨, 스탠퍼드 대학교 에너지 경제학자

질문이 중요하다. - ‘린 스타트업’

“정확한 질문에 대한 대략적인 답(애매모호하긴 해도)이 잘못된 질문에 대한 정확한 답(항상 자세하긴 해도)보다 훨씬 훌륭하다.” - 존 터키, 푸리에 변환 고안자

그렇다고 바보는 지나치게 똑똑한건 아니다.

지나치게 똑똑함은 바보와 같다. - 샘 새비지

모델은 모델이지!

[…] 모델은 사실적인 실체가 아님을 주지할 필요가 있다. 만약 독자 여러분이 모델을 통해서 여러분이 가지고 있는 요점들을 명확하게 이해할 수 있다고 믿는다면, 그것은 큰 오해이다. 그리고 경제적 리스크를 모델링하기 위해 복잡하게 설계된 대부분의 모델들은 이미 오류를 포함하고 있는 다른 모델들을 더 왜곡시키고 있다. 단순한 거짓말보다 더욱 질이 나쁜 거짓말은 복잡한 거짓말이다.

“현대 계산통계학”이라니! 그렇다면 “중세,고대, 근대”는 어디갔나?

증기기관 시대 통계학으로 휼륭한 업적을 달성했던 스탠퍼드 대학교의 통계학 교수인 브래드 애프런은 증기기관 시대의 통계학을 대체한 현대 계산통계학 학파의 선구자이다. 그는 학생들에게 가르치는 현재의 증기기관 시대 통계학은 이미 1950년에 죽은 것이나 마찬가지라고 주장하고 있다.

습관을 가지긴 힘들 것 같아요…

평균의 함정의 강형 문제점을 해결하기 위해서는 독자 여러분이 불확실성을 단 하나의 숫자인 평균값으로만 생각하는 습관을 버리고 확률분포로 생각하는 습관을 갖도로 해야 한다.

Written on August 27, 2015