[통계] 생일 패러독스 – 인지의 함정 그리고 숫자에 대해서

같이 일하는 생일날에 작지만 스탁벅스 쿠폰을 하나씩 보내준다. (보스들에게는 아부 같아서 쿠폰은 빼고 축하의 말만…) 혹시나 빠진 사람이 있어서 40명의 생일을 정리해 보니, 생일이 같은 사람이 생각보다 많았다. 생일이 같은 사람이 2명씩 3개조(?)가 나왔다.

갑자기 궁금해져서 어떤 모임에서 생일이 같을 확률을 찾아 보았다. 40명인 우리 Business Unit에서 생일이 같은 사람이 있을 확률은 무려 89.12%이다. 많은 사람들이 생일이 같은 사람을 만나는 것이 자주 있지 않은 일이라고 생각한다. 직관적으로 365일 중에서 40명이 고르게 분포되면 10.9% (=40/365일)이라고 흔히 생각한다. 하지만, 일일이 생일을 비교해보지 않아서 그렇지 생일이 같은 사람을 만나는 것은 흔하다. 이를 생일 패러독스 라고 부른다는 것을 오늘 알게 되었다.

그럼 확률 계산은 어떻게 할까? 이 확률계산의 가장 큰 골격은 전체확률에서 어떤 집단의 모든 사람들의 생일이 모두 다를 확률을 빼는 것이다. (=1- 모든 사람들의 생일이 다른 확률)

그럼, 3사람이 있다고 생각해보자.

두번째 사람이 첫번째 사람과 생일이 다를 확률은 99.725%(=364/365일)이다. 왜냐하면, 365일 중에 나머지 364일이 생일이 되어야 하기 때문이다.

마찬가지로 세 사람이 생일이 모두 다를 확률은 =99.18%(=364일/365일 * 363일/365일)이다.

이런 식으로 n명이 있는 모임에서 생일이 모두 다를 확률과 한명이라도 최소한 생일이 같은 사람이 있을 확률을 계산하면 다음과 같다. (수학을 그렇게 잘하지 않아 수식보다 직관적인 엑셀로..) 즉 23명만 있어도 나와 같은 생일을 가진 사람이 있을 사람이 있을 확률이 절반을 넘는 다는 것이다.

모임내 사람의 숫자생일이 모두 다를 확률생일이 같은 사람이 있을 확률
1100.00%0.00%
299.73%0.27%
399.18%0.82%
498.36%1.64%
597.29%2.71%
695.95%4.05%
794.38%5.62%
892.57%7.43%
990.54%9.46%
1088.31%11.69%
1185.89%14.11%
1283.30%16.70%
1380.56%19.44%
1477.69%22.31%
1574.71%25.29%
1671.64%28.36%
1768.50%31.50%
1865.31%34.69%
1962.09%37.91%
2058.86%41.14%
2155.63%44.37%
2252.43%47.57%
2349.27%50.73%

세상을 살다보면 이렇게 실제와 인지가 다른 경우가 많다. 중요한 고객 한 두명의 말을 듣고 시장전체를 판단할 수 없고, 담당자 몇 명의 의견이 조직의 의견을 대변할 수 없다. 그렇기 때문에 내가 가능한 숫자를 통해 판단을 하고자 노력하는 이유이다. 또한 반대로, 숫자가 가지는 함정들이 있다. 결국, 좋은 경영자가 되는 것은 숫자와 인지를 통해 주어진 상황에서 가장 합리적인 판단을 하고, 조직을 ‘실행’을 효과적으로 하면서 목적을 향해 나가는 것이 아닐까 하는 생각을 해본다.