위키독:DIPS

등장과 정의[원본 편집]

'DIPS'는 'Defense Independent Pitching Statistics (수비 무관 투구 기록)'의 약자로, 보로스 맥크라켄이란 사람이 만든 투수 평가를 위한 세이버메트릭스 기록의 하나다.

그는 페어 지역으로 인플레이 된 공이 아웃이 되고 범타가 되는건 투수의 투구 능력보다 그 이외의 능력의 영향을 훨씬 많이 받는다는 것을 발견한 이후, 투수가 어떻게 통제할 수 없는 부분을 최대한 제외하고, 수비 등의 투수가 통제할 수 없는 요소를 제외하고 투수의 능력을 평가해야 한다는 관점에서 나온 개념이다.

고전적 지표인 승/패와 같은 기록으로 투수의 퍼포먼스를 측정하는 것은 투수가 어찌할 수 없는 부분이 많다는 것은 이미 많은 야구팬들에 의해 직관적으로 이해되었다. 이후, 그래서 투수가 어찌 통제할 수 없는 요소들을 제외하고 투수의 능력을 평가하고자 하는 시도가 이어지게 된다.

이에 따라, 수비와 무관하다 볼 수 있는 기록인, 삼진, 사사구, 홈런만을 통해 투수의 기록을 재구성한 것이다. 또한 수비를 완전히 배제한다는 이 개념을 공유하는 모든 지표들에 대한 통칭이기도 하다.

이러한 DIPS의 Idea를 차용한 지표 중 가장 유명한 것중 하나는 'FIP'이다. 이는 'Fielding Independent Pitching(수비 무관 투구)'의 약자다.

고전적 지표인 승패와 ERA의 한계[원본 편집]

투수의 승패와 평균자책점은 매우 오래 전부터 투수를 평가하는 대표적인 고전적인 지표로 자리매김하고 있다.

하지만 위에서도 언급 했듯이, 이미 많은 야구팬들은 승패라고 하는 기록이 가지고 있는 단점을 직관적으로 이해하고 있었다. 투수의 기량과 상관없는 팀타선의 득점력과 등판시의 팀의 승률등이 커다란 요인으로 작용하기 때문에 ‘얼마나 훌륭한 투수인가?’ 에 대한 충분한 정보를 제공하지 못한다는 단점이 매우 컸다.

그렇지만 평균자책점만은 여전히 강한 영향력을 유지하고 있는데, 평균자책점 역시 큰 문제를 내포하고 있다는 점은 승패와 마찬가지다. 실점의 경우 실점을 많고 적게 하는 것은 투수의 책임이 크긴 하다. 하지만 이걸 투수 혼자만의 책임으로 볼 순 없다. 수비는 투수와 동료 수비수들이 함께 하는 것이기 때문이다. 그렇기에 온전한 투수의 능력을 평가하기 위해선 동료 수비수들의 영향을 배제할 필요가 생긴다.

바로 이를 해결하기 위해 도입된 개념이 자책점이다. 자책점은 수비수들이 평균 이하의 플레이, 즉, 실책을 저질렀을 때 해당 상황을 재구성해 투수에게 타당하다 여겨지는 점수를 부여한다. 언뜻 생각해보면 합리적으로 보이지만 실상은 그렇지 않다. 문제는 바로 그 실책이 기록자의 주관에 의해 결정된다는 것이다. 이건 기록관을 무시하려는 게 아니라 수비수의 수비를 평가하는 일은 매우 어려운 일로, 이것이 이런 식으로 이뤄질 수 있었다면 수많은 사람들이 오랜기간 고민해올 필요가 없었을 것이다. 기록관이 판단하는 것은 그저 수비수가 공을 제대로 포구했는가, 송구와 그에 대한 포구가 제대로 이뤄졌는가 정도에 그친다. 수비 범위가 좁아서 자연스럽게 무수한 안타를 허용하는 것이나, 중견수가 외야를 휘저으며 타자의 안타를 막는 것들은 고려하지 않는다.

그리고 2아웃 이후 실책이 나왔을 경우, 이후 투수가 해당 이닝에 몇 점을 더 내주건 그건 투수의 자책점이 아니게 된다는 점도 지적받는다. 실책이 없었다는 가정 상 해당 이닝은 이미 종료됐으므로 이후에 준 점수는 투수의 책임이 아닌 것으로 계산되는 것이다. 이런 방식은 엄연한 투수의 투구 내용을 표본에서 배제하는 것으로 적절하다고 보기 어렵다. 또한 주자를 남겨놓고 마운드에서 내려갔을 경우, 투수 본인과 상관이 없는 후속 투수의 능력에 의해 자책점이 달라질 수 있다는 점 또한 문제로 지적되고 있다.

이렇듯 투수를 평가하기 위한 기존 지표들의 한계는 명확했고, 이를 극복하기 위한 많은 시도들이 있어왔다. 하지만 그럼에도 불구하고 '투수의 투구'와 '수비수의 수비'를 분리하는 일만큼은 난제에 가까웠는데, 이 둘은 매우 밀접하게 관련돼 있었기 때문이다.

DIPS와 BABIP[원본 편집]

이러한 ‘투수의 투구’와 ‘수비수의 수비’를 분리하는 일은 많은 세이버메트리션들이 공격지표들이 고안되었던 것에 비해 매우지지부진 했었다.

그러나, 2001년 Baseball Prospectus를 통해 발표된 보로스 맥크라켄의 DIPS이론은 투수의 투구와 수비수의 수비를 분리시키는데 하나의 실마리를 제공하게 되었다.

그의 아이디어는 ‘인플레이가 된 타구의 결과는 투수의 책임이 아니다.’로 요약할 수 있을 것이다. 이런 그의 이론은 야구를 이해하는 관점이 급진적이었던 같은 세이버메트리션들에게도 쉽게 받아들여질만한 성질의 것이 아니었다. 그러나 이후 조금씩 조금씩 보완이 되며 FIP와 같은 지표로서 결실을 맺게 된다.

그의 DIPS이론에는 명확한 근거가 있었는데, 맥크라켄의 연구결과에 따르면 삼진,사사구, 홈런등은 매년 투수나름의 고유한 값을 유지하는 경향이 있는 반면에, BABIP은 매년 크게 변동했기 때문이었다. BABIP의 경우 개인의 특성에 따라 달라지기 보다는 오히려 리그전체 평균에 머무르는 경향을 보였고, 팀내의 투수들끼리는 BABIP 기록이 비슷하다는 데서 아이디어를 얻게 되었다.

그렇기 때문에, 맥크라켄은 투수의 BABIP에는 투수 기량 외적 요인, 즉 팀의 수비력과 구장, 그리고 운이 매우 큰 영향을 미친다는 결론에 도달했던 것이다.

왜 이런 결과가 나오는지 정확히 설명할 순 없었지만, 이런 결과가 나온다는 것만은 사실이었다. 처음 이 의견에 반대했던 세이버메트리션들도 시간이 흐를수록 맥크라켄의 주장에 동의하는 입장으로 변해갔다. 빌 제임스 역시 이후 이것을 일찍 깨닫지 못한 자신이 어리석었다며 입장을 철회했다.

== 4.투수는 BABIP에 전혀영향을 줄 수 없는가? ==

투수가 BABIP에 미치는 영향력이 얼마인지에 대한 논쟁에서 절대 빠질 수 없는 사람은 미첼 리히트만이다. 그의 2004년 분석인 ‘What does play-by-play data tell us about DIPS?“에는 투수가 BABIP에 대한 지배력을 어느정도인지에 대한 아이디어를 제시한다. 그의 아이디어의 핵심은 타구를 종류별로 분류를 하는 것이다. 그의 분류법은 아래와 같다.

타구종류 인플레이시 발생비율 안타비율
내야 라인드라이브 0.063 0.593
외야 라인드라이브 0.143 0.812
내야 팝플라이 0.056 0.038
외야 팝플라이 0.016 0.269
외야뜬공 0.248 0.135
땅볼 0.475 0.228

그렇다면 이러한 6가지 분류에 따른 타구를 만들어 내는데 투수의 능력이 작용할 수 있을까? 이에 대한 해답으로 리히트만은 투수들이 허용한 타구들의 연도별 상관관계를 분석해서 상관관계도를 측정했다. 그 결과 땅볼과 외야뜬공에 대한 상관관계도는 상당히 높은 것으로 알려졌다.

2014년 팬그래프의 자료를 인용하면 타구 종류별 타율/ISO/wOBA은 아래와 같다.

타구종류 인플레이타구 타율 ISO(순장타율) wOBA
땅볼 0.239 0.020 0.220
라인드라이브 0.685 0.190 0.684
뜬공 0.207 0.378 0.335

이러한 통계분석을 통해 투수가 땅볼과 뜬공에 높은 수준의 상관관계로 개입할 수 있다는 전제가 참이라면, 땅볼 생성하는 선수가 플라이볼을 많이 허용하는 선수에 비해 기록이나, 경기력면에서 유리할 수 있다. (물론 2017년 작성시점의 한화이글스같은 팀에겐 해당되지 않는 슬픈이야기 일일수도 있다)

이후 지속된 연구를 통해 이러한 타구의 종류 외에도 구장간의 차이의 존재, 팀수비력등 BABIP에 영향을 미칠 수 있는 요소들이 하나둘 규명되었다.

이를 톰탱고와 에릭앨런,어빈휴가 회귀분석을 통해 얻어낸 BABIP의 결정 요인은 운이 44%, 투수가 28%, 수비가 17%, 구장이 11%이라고 알려져 있다.1

BABIP에 주는 요소들[원본 편집]

위의 BABIP 결정요인엔 아쉬운 점이 하나 있다. 바로 타자가 고려되지 않았다는 점인데 이러한 부분을 보완한 최근의 분석이 있다. 바로 Baseball Prospectus의 Russel Carleton의 2013년의 Rethinking Randomness:Pitchers and Their BABIPs 에 실린 분석이다.

1993년부터 2012년까지의 데이터 분석을 통해 얻어낸 타구별 영향력 비중.

타구종류 타자 투수 수비

운 (League Mean이라 표현)

땅볼 47% 29% 13% 11%
플라이볼 39% 26% 21% 13%
라인드라이브 46% 28% 13% 13%

6 평가[원본 편집]

패러다임을 바꾼 위대한 발견으로 평가되고 있다.

이미 DIPS는 세이버메트릭스의 핵심으로 자리잡은 상태다. 이를 통해 야구를 DIPS와 DIPS 외의 영역으로 분리해 분석하는 접근법이 정립됐다고 할 수 있다.

이제 세이버메트릭스에서 단순한 평균자책점은 큰 의미를 갖지 못하며, 또한 투수의 승패가 그랬던 것처럼 야구계 전반에서도 평균자책점에 대한 인식이 점점 예전만은 못해져 가는 중이라고 볼 수도 있다. 선수들 중에서도 맥스 슈어저, 잭 그레인키처럼 해당 지표에 호의적인 선수들이 존재하며, 2010년 무렵부터는 사이 영 상 투표에서 DIPS를 근거로 표를 던지는 기자들이 늘어나기 시작했다. 특히 2014년 AL 사이 영 상 투표에선 코리 클루버가 펠릭스 에르난데스를 제치고 수상할 수 있었던 원동력 중 하나로 작용했다고 볼 수 있다.

== 7 FIP 계산방법 ==

톰 탱고의 FIP

톰 탱고가 간단한 계산으로 'DIPS ERA'를 계산할 수 있는 식을 만들어 소개했는데 이것이 바로 FIP다.

FIP의 식은 아래와 같다. ((-2×삼진 +3×(볼넷 +몸에 맞는 볼) +13×홈런)/이닝) +C

•볼넷에서 고의사구를 제외하기도 하는데 FIP을 취급하는 커뮤니티 중 가장 널리 알려진 팬그래프에서는 IBB를 제외하지 않는다.

•C는 Constant의 머릿글자로, FIP을 ERA 스케일로 맞추기 위한 상수다. 현대 야구[6]에서는 보통 3.00~3.20 정도의 값을 지니며, 이로 인해 리그 ERA와 리그 FIP은 같은 값을 가지게 된다. 참고로 평균자책점이 아닌 9이닝 당 실점을 기준으로 맞춘다면 FIP기반의 9이닝 당 실점이 된다.

◦C값의 계산식:

파일:/api/File/Real/5a0dd1e485f177a47ead5f79

여기서 사용되는 스탯은 모두 리그 전체의 값이다.

•-2, 3, 13이란 각 계수는 '상황별 기대 득점(Run Expectancy)'에 기반해 계산된, 이벤트별 '득점 가치(Run Value)'를 통해 구해진 값이다. C값을 제외한 식이 의미하는 바는 즉, '9이닝당 수비 무관 득점 가치'로 볼 수 있다. -2, 3, 13 각 숫자를 9로 나눠주고, 인플레이 상황의 득점 가치를 더해주면 그것이 삼진, 사사구, 홈런의 득점 가치가 된다.

•또한 'xFIP(Expected Fielding Independent Pitching)'라고 하여 홈런마저도 제외하고 이를 기대 홈런으로 대체한 스탯도 존재한다. 기대 홈런은 선수의 플라이볼에 리그 평균 플라이볼 대비 홈런 비율을 곱함으로써 계산된다.