매일신문

[김구철의 富의 비밀수학] 세이버메트릭스와 우승 '확률'

로봇
mWiz 이 기사 포인트

수학을 오도하는 언론과 방송
무지한 캐스터와 해설자들
‘확률’을 논하기 위한 전제
‘표본의 크기’와 ‘동일한 조건’

경기대 미디어학부 특임교수
경기대 미디어학부 특임교수

2019년 프로야구 한국시리즈가 4대 0, 두산의 일방적 승리로 끝났다. 시리즈전에는 키움의 우세를 점친 전문가가 많았다. 시즌 득실점도 앞서고, 맞대결 성적도 9승 7패로 앞서고, SK와의 플레이오프에서 3전승하면서 키움의 기세가 올랐다는 게 근거였다. 우승 '확률' 키움 52%, 두산 48%라는 숫자도 나왔다. 두산이 1차전에 이긴 다음에는 숫자가 더 구체적이었다.

먼저 낙관론. "과거 35차례의 한국시리즈에서 1차전 승리팀이 26차례 우승했으니 1차전 승리팀 두산의 우승 '확률'이 74.3%다". 비관론도 있었다. "두산은 9차례 한국시리즈에 진출했지만, 1차전 이긴 해에는 단 한 차례 우승했으니 우승 '확률'은 11.1%다." 같은 팀 두산의 2019년 우승 '확률'은 왜 이렇게 서로 다를까?

간단히 말해 위의 숫자들은 확률이 아니며 기사는 '가짜' 뉴스다. 확률은 '충분한 크기의 표본'과 '동일한 조건'을 기본 전제로 한다. 35차례나 9차례는 확률을 논하기에는 '너무 작은 표본'이다. 다음 35차례든 9차례든 같은 팀이 아니고, 피아 모두 같은 감독이 아니고 같은 선수가 아니니 '조건이 다르다'. 올해도 마찬가지다. '①표본이 작고 ②조건이 다르니' 확률을 논할 수조차 없다.

요즈음 세이버메트릭스라 해서 통계적 기법을 도입해 저렴한 비용으로 좋은 성적을 거둔 사례가 국내에도 소개되고 있다. 시즌 중에는 경기 수가 워낙 많아 몇 년의 자료를 축적해 나름 예측력을 발휘할 수 있다. 그러나 포스트시즌은 다르다. 표본이 극히 적고, 거의 해마다 다른 감독, 다른 선수로 구성된 다른 팀들의 경기가 진행된다. 모두 같아도 타순과 투수 등판 순서에 따라 결과는 달라진다. 무지한 기자와 캐스터, 해설가 때문에 청소년들이 잘못된 확률 개념을 갖게 될까 걱정스럽다. 확률 운운하지 말고 숫자만 재미로 즐겨라. 하나 더, 스포츠는 숫자만으로 예측할 수 없는 신비의 영역이다.

최신 기사

0700
AI 뉴스브리핑
정치 경제 사회 국제
6·3 지방선거 문경시장 선거에서 신현국 무소속 후보와 김학홍 국민의힘 후보 간의 '민생회복지원금' 공약을 둘러싼 논쟁이 격화되고 있으며, ...
브리핑 데이터를 준비중입니다...
대구 서대구고속버스터미널에서 대형 뱀이 발견되어 소동이 일어난 가운데, 뱀은 화물칸에서 여행용 캐리어를 휘감고 있었던 것으로 알려졌다. 충북...
미국과 이란 간의 종전 협상이 진전을 보이지 않는 가운데, 도널드 트럼프 대통령은 협정의 최종 세부사항이 논의 중이며 조만간 발표될 것이라고..
  • 배너
  • 배너
  • 배너
  • 배너
  • 배너
  • 배너
  • 배너
  • 배너
  • 배너
  • 배너
  • 배너
  • 배너
  • 배너
  • 배너
  • 배너
  • 배너
  • 배너
  • 배너
  • 배너
  • 배너
  • 배너
  • 배너

많이 본 뉴스

일간
주간
월간