Max Community

엠엘비보드

자유게시판

맥스블로그

과거게시물

유저게시물

피겨게시물

테니스섹션

엠엘비닷컴

마이너닷컴

스코어보드

연봉페이지

레퍼런스닷컴

팬그래프닷컴

로토월드닷컴

판타지베이스볼


TOTAL ARTICLE : 136, TOTAL PAGE : 1 / 5
[Column] 세이버 메트릭스에 대한 오해
| 2003·04·16 00:04 | HIT : 8,794 | VOTE : 802
필자는 메이저리그에 정통한 인물은 아니지만(겸손이 아니라는 것이 치명적이다 -_-;) 세이버 메트릭스에 대해서는 어느 정도 안다고 생각한다. 나는 간혹 가다 이런 질문을 받는다. "세이버 메트릭스가 뭐요? 그거 어떻게 하는 거요?" 솔직히 이런 이야기를 접할 때 마다 머리 속에 드는 생각은 딱 하나다. "어떻게 하는거 알아서 뭐할려고?" 그러나 이내 온화한 미소를 머금고 되묻는다. "야구가 뭐요?"

필자가 세이버 메트릭스를 처음 접한 것은 3년전의 일이다. 기억하시는 유저들도 있겠지만 당시 하이텔 야구동에서 새로운 시각으로 야구를 보는 방법을 국내에 소개한 사람들이 있었는데 필자 역시 몇몇의 지인들을 통해서 그분들의 글을 보고 깨달음을 얻을수 있었고, 지금은 30여개가 넘는 세이버 메트릭스 웹페이지를 '즐겨찾기' 해두고 있는 통계에 미친놈이 되어버렸다. 대학을 졸업하고 하는 일 없이 백수로 보낸 작년에는 내가 봐도 한심할 정도로 숫자놀음에 심취하면서 폐인생활을 하기도 했다.

최근에는 세이버 이론이 어느 정도 대중화에 성공하면서 국내에도 좋은 글을 쓰시는 분이 많이 늘었다. 한점차 승률과 클러치 능력의 허상, OPS 의 위대함, 도루의 무용함 등… 그러나 못내 안타까운 점은 하이텔 동호회 회원이나 후추 재야 인사들이 소개한 몇가지 공리들을 그대로 답습하고 있을 뿐 단 한발자국도 더 내딛지 못하고 있다는 것이다. (당연히 나도 그중에 한 사람이고…) 더구나 국내 MLB 유저들의 눈높이가 하늘을 찌를 듯 한데, 유독 이쪽만 정체현상을 보이고 있다. 왜? 그것은 아마도 '세이버 메트릭스 = 수학' 이라는 고정관념 때문일 것이다.

세이버 메트릭스를 논하는 글에 빠지지 않고 등장하는 '큰머리' 빌 제임스는 세이버 메트릭스는 야구를 '객관적' 으로 이해할려는 노력이라 정의한 바 있다. (Saber metrics is search for the objective knowledge about Baseball) 세이버 메트리션들이 통계를 주된 평가수단으로 이용하는 이유 역시 통계가 야구경기의 가장 객관적인 기록이기 때문이다. 대중적인 인기를 끌고 있는 세이버 메트리션들은 어떤 통계가 어떤 목적을 위해 쓰일 때 가장 적절한가를 이해하는 사람들이기도 하다. 이는 세이버 메트릭스를 이해하기 위해 많은 수학지식을 필요로 하지 않으며 단지 통계를 잘 사용하는가, 그렇지 않은가에 대한 몇가지 판단력만 있으면 된다는 이야기다. 랍 네이어의 글을 보면 알겠지만 그는 복잡한 수식을 동원한 공식에 대한 이해로 지면을 채우지 않는다. 물론 Win Shares 의 산출공식을 모른다고 네이어의 글을 못 읽는 것도 아니다.  

본질적인 문제는 세이버 이론가들이 야구에 관한 어떤 물음을 던지고, 어떤 데이터를 수집해서 토론하고, 수용하며 최종적으로 유의미한 결론을 이끌어내는지 지켜보는 것이다. 태초에 RC 가 어떻게 만들어 졌을까? 당연히 타자의 능력을 평가하고 측정하는데 타율과 타점이 불완전한 지표임을 깨달은 몇몇 현각자들이 득점을 올리는데는 출루와 전진이 필요하다는 야구의 기본 구조를 이해하고 나서 만들어졌다. 세이버 메트릭스는 타율의 허접함에 대해 의문을 품는데서 출발한다. "왜 이런 허접한 지표인 타율에 배팅 챔피언을 뜻하는 타격왕이란 칭호를 붙여주는 것이냐? 좀 더 새끈한거 없냐?" 그리고 이러한 물음이 결국 새로운 결과물을 낳고 대중의 냉정한 검증을 거쳐 하나의 공리로 자리하게 되는 것이다.

간혹 보면 세이버 메트릭스에 대한 심한 알러지를 앓고 있는 사람들이 있다. 물론 야구를 즐기는 방법에서 개인의 취향은 존중받아야 한다. 그러나 나는 그들이 SABR 의 이론을 무턱대고 부정한 글 중에서 논리적으로 제대로 된 글을 본적이 없다. 통계를 부정하는 많은 사람들이 꺼내드는 딴지는 크게 두가지다. (1) 통계가 가지는 태생적 한계를 지적하거나 (2) 통계로 시즌의 전반적인 고찰은 가능하지만 한게임 한게임의 깊이있는 분석은 불가능하다는 것이다.

첫번째 사례는 통계의 허상을 세이버 메트릭스의 허점으로 규정하면서 발생하는 문제다. 레너드 코페트가 "야구란 무엇인가?" 의 통계편에서 지적한 통계의 허상이 곧 세이버 메트릭스의 헛점을 의미하는 것은 아니다. 오히려 이 책에서 쓰여진 통계의 문제들은 고전적인 어프로치인 타율이나 득점, 타점의 뽀록을 설명하기에 더 적합한 개념들이다. 기존의 통계가 완벽하다면 세이버 메트릭스란 개념과 SABR 이라는 단체가 왜 튀어나왔겠는가?

세이버 메트릭스는 '새로운' 야구통계 분석방법을 일컫는 신조어다. 세이버 메트리션들은 레너드 코페트가 지적하고 있는 통계의 본질을 망각하는 경우 즉 "왜 그런가?" 에 대한 설명을 하는 사람들이며 통계와 관련된 주변요소들(기록의 컨텍스트)에 대한 이해는 세이버 메트릭스의 '제 1계명' 이기도 하다. 결국 타율이나 승률 같은 거짓 우상들이 대중의 숭배를 받으며 통계를 제대로 활용하고 있지 못하고 있는 오늘날의 메인 스트림의 선수에 대한 평가를 바로 잡고 통계가 가지는 태생적 한계를 극복, 보완하기 위해 머리 싸매는 사람들에게 고전적인 통계의 허점을 들이대 통계 무용론을 주장하는 꼴이다.

두번째 사례는 세이버 메트릭스를 한줄의 공식으로 이해하고 있을 때 생기는 오해다. 가령 구원 투수들이 마운드에 오르고 내려올 때 상속받은 주자와 남겨두는 주자를 선수 개인의 ERA 로 평가할 수는 없는 노릇이다. 또한 선발투수의 득점지원과 불펜 지원은 적지않은 논쟁의 대상이 되기도 한다.

1981년 SPORTS Illustrated 4월호에서는 이전까지 불공평한 대우를 받고 있던 중간계투 요원들의 위신을 바로잡기 위해 믿을수 없을만큼 복잡한 일련의 도표들을 게재했다. 그것은 독창적이며 제대로 이해된 작업이었지만 문제는 너무 복잡하고 힘들다는 것이었다. 이 공식을 사용하기 위해서는 '플레이 by 플레이' 분석을 일일이 수행해야 했기에 당시로서는 많은 주목을 끌기 힘들었다. 그러나 인터넷이 대중화 되면서 이런 고민들은 거의 사라졌다. 오늘날 베이스볼 프로스펙터스의 마이클 월버튼에 의해 고안된 피칭 리포트는 '게임 by 게임' 을 훌륭히 반영하면서도 실시간으로 조회가 가능하다. 시대가 변하고 컴퓨터가 끊임없이 업그레이드 되면서 야구게임을 수정구 마냥 반영한 측정수단도 함께 발전하고 진화하고 있는 것이다.

Reliever Evaluation Tools : Adjusted Runs Prevented (http://www.baseballprospectus.com/current/rrereport03.html)
Starter Evaluation Tools : Support - Neutral W/L (http://www.baseballprospectus.com/current/snwlreport03.html)


1972년 미국에서 결성된 Society of American Baseball Research 즉 SABR 은 80년대 출간된 빌 제임스의 Baseball Abstract 시리즈와 Win Shares 등의 세이버 메트릭스 서적과 메이저리그 공식 연감인 Total Baseball 을 주 교재로 삼고 주로 인터넷 상에서 야구를 연구하고 토론한다. 이들의 관심은 야구에 관한 모든 물음이다. 선수의 예측과 평가, 구장과 시대, 감독의 전술, 트레이드, 승률, 클러치 능력, 디펜스와 피칭의 상관관계, 구원투수들의 활용 패턴 그리고 그 밖에 모든 것… 지금 당신의 머리 속을 맴돌고 있는 모든 호기심을 충족하기 위해 필요하다면 시즌이 아니라 '게임 by 게임', '플레이 by 플레이', 심지어는 '피치 by 피치' 까지 게임로그로 추적하고 시뮬레이션으로 돌리는 징그런 인간들이 세이버 메트리션들이다.

자신이 영어가 조금 된다고 생각하시는 분들은 'Baseball Primer (http://www.baseballprimer.com)' 란 사이트에서 10일만 놀아봐라. 이 인간들이 얼마나 위대한 공상을 하면서 야구를 깊게 이해하면서 놀고 있는지 두려움마저 느낄 것이다. 재밌는 것은 그들은 서로를 견제하며 자신들 내부에서 끊임없이 다구리를 친다. 그래야 보다 '객관적' 인 창조물을 얻을 수 있기 때문이다. 사실 필자는 위에 소개한 사이트에 올라오는 글들 중 절반 밖에 이해하지 못한다. 이유는 야구팬들의 관심을 끌기 어려운 복잡한 함수식 때문이 아니다. 메이저리그의 역사와 야구에 대한 전반적인 이해가 부족하기 때문에 양키들의 생각을 따라 갈 수가 없는 것이다. 필자보다 훨씬 메이저리그를 많이 아시는 맥스 엠엘비 유저분들은 부디 야구를 즐기는 또 하나의 방법을 포기하지 말길 바란다.

"야구통계는 경기에 대한 이해를 높일 수 있을 때 가치를 지닌다. 그렇기에 통계는 경기에서 일어나는 이벤트들을 얼마나 잘 평가할 수 있느냐에 따라 심판 받아야 한다. 의미없는 통계는 무시되어야 하며 교체되어야 한다. 결함을 가진 통계는 개선되어야 하며 잘 만들어진 통계는 게임과 플레이어의 토론의 자료로서 중요하게 쓰여야 한다." (Baseball statistics are useful only if they enhance your understanding of the game. Therefore, they should be judged by how well they measure what actually happens in the game. Meaningless statistics should be ignored or replaced; deficient statistics should be improved.  And well-designed statistics should be used as an important part of discussion about the game and its players.) - The Sabermetric Manifesto By David Grabiner 中 -

Written by 최우근
  [Mailbag] 2003년 4월 16일 03·04·16 5773
  [Profile] 토리 헌터 03·04·13 8072
Copyright 1999-2018 Zeroboard / skin by GGAMBO