득점정확도 99.62%, 한국야구공식 OCAR

메이저리그 2010. 2. 2. 12:53 Posted by 쏘왓의 야구블로그


한달여전 본인은 기존의 야구공식에 비해서 실제득점과 오차가 상당히 감소한 야구 공식을 고안하였다. 새로운 공식은 지난 10년간 메이저리그 30개팀의 실제득점대비 99.62%의 정확도를 보였다. 이 공식의 타당성을 검증받기 위해 지난 3주간 야구 전문가와 통계학 전문가의 자문을 구했고, 검증과정에서 공식의 문제점이 발견되지는 않았으며 일리가 있다는 평가를 받았다. 하지만 개인적인 견해로는 공식에 대한 보다 자세한 검증이 필요하다고 생각하고 있다. 그러나 근시일내에 더 이상 큰 진척이 있을 것 같지 않기 때문에, 야구팬들과 다른 야구전문가들의 검증을 받는 것이 더 효과적이라는 판단으로 새로운 공식을 공개하고자 한다.

Out Counts-Factored Actual Runs (OCAR) 공식


노아웃 : (1루타 X 0.424 + 2루타 X 0.628 + 3루타 X 0.863 + 홈런 X 1.0 + 볼넷 X 0.424 + ROE X 0.424 + HBP X 0.424)

1아웃 : 1루타 X 0.271 + 2루타 X 0.410 + 3루타 X 0.655 + 홈런 X 1.0 + 볼넷 X 0.271 + ROE X 0.271 + HBP X 0.271

2아웃 : 1루타 X 0.127 + 2루타 X 0.219 + 3루타 X 0.253 + 홈런 X 1.0 + 볼넷 X 0.127 + ROE X 0.127 + HBP X 0.127


노아웃 득점생산력 + 1아웃 득점생산력 + 2아웃 득점생산력 +도루 X 0.18 - 도실 X 0.32 = Out Counts-Factored Actual Runs (OCAR)


아웃카운트를 고려한 실질적인 득점이라는 뜻의 OCAR 공식은 타자의 실제적인 득점력을 측정하기 위한 목적으로 고안되었으며, 공식의 기본적인 원리는 주자가 없다는 전제하에 한 타자의 득점과 연관된 모든 요소(장타율,출루율,주루)에 아웃카운트별로 득점확률가치를 부여한 방식이다. 장타율요소에는 1루타~ 홈런이, 출루요소에는 볼넷과, 힛바이 피치, ROE가 포함되었다. ROE는 야수의 실책이지만 스피드가 뛰어난 선수들이 더 많은 ROE를 기록한다는 점에서 타자의 능력으로 평가했다. 더불어 ROE가 실제경기에서 힛바이 피치와 거의 비슷하게 발생하기 때문에 전체 득점에서 무시할 수 없는 비중을 차지한다는 점을 고려했다. 주루 요소에는 도루와 도실이 포함되었다.

OCAR 공식은 팀 라인업의 앞뒤 타선 역량과도 관계가 없고 주자상황과도 관계가 없는 해당타자의 순수한 득점능력만을 평가하는 것이 목적이며 팀이나 리그 전체의 득점력을 평가할 때도 적용이 가능하다.


OCAR 공식의 원리


공식에 포함된 각 요소의 아웃카운트별 가치는 미국의 세이버매트리션 톰 탱고의 득점확률을 적용했다.


무사 득점확률

1사 득점확률

2사 득점확률

1루

0.424

0.271

0.127

2루

0.628

0.410

0.219

3루

0.863

0.655

0.253

홈런

1.000

1.000

1.000


비교적 최근인 2000년대의 수년간 메이저리그 자료를 근거로 하여 톰 탱고가 만든 득점확률은 수만 건의 실제 경기자료를 놓고 득점확률을 계산한 것이다. 홈런의 득점확률은 당연히 1이기 때문에 공식에 1의 가치를 부여했다.

상기 표에 나온 득점확률이 시합에서 발생한 타자의 모든 행위를 반영한 수치이지만 실질적으로 득점확률이 적용이 되는 요소는, 루상에 타자가 진루한 상황 즉 출루가 된 요소에만 한정된다는 사실에 근거하여 출루가 된 모든 요소에 아웃카운트별로 득점확률을 곱해주는 방식의 공식이다. 기존의 야구공식은 타점과 선행주자의 추가진루에 대한 영향력이 다르다는 이유로 1루타와 볼넷에 차등가치를 부여하고 있지만, 득점에만 한정할 경우에는 1루타와 볼넷이 똑같은 가치를 가지고 있다는 점에 착안한 공식이다.

득점확률에 의하면 아웃 카운트에 따라서 똑 같은 안타와 볼넷이라도, 득점확률차이가 크게 나고 있다. 무사는 1사와 2사상황의 합친 득점확률정도의 비중이고 1사는 2사 상황보다 2배가량, 득점확률이 높다. RC와 XR등의 기존 야구공식이 아웃 카운트별로 득점확률이 큰 차이가 나는데 아웃카운트별 득점가치에 차등을 두지 않고 모두 한 가지 득점가치로 평가했기 때문에 실제 득점과 일정수준의 오차가 존재할 수밖에 없다고 판단된다.

아래의 표는 2000년부터 2009년까지 메이저리그 30개팀의 10년간의 총 득점, OCAR, RC의 기록이다.



RC

ML 실제득점

득점대비 %

OCAR

ML 실제득점

득점대비 %

2009

23908

22419

93.77%

22932.2

22419

97.76%

2008

23913

22585

94.44%

22920.1

22585

98.53%

2007

24633

23322

94.67%

23293.5

23322

100.12%

2006

25020

23599

94.32%

23465.6

23599

100.56%

2005

23621

22325

94.51%

22634.8

22325

98.63%

2004

24805

23376

94.23%

23420.2

23376

99.81%

2003

24182

22978

95.02%

23008.8

22978

99.86%

2002

23605

22408

94.92%

22781.2

22408

98.36%

2001

24462

23199

94.83%

23216.9

23199

99.92%

2000

26307

24971

94.92%

24374.3

24971

102.44%

10년 평균

244,456

231,182

94.56%

232,047.6

231,182

99.62%

※ 2000~2009년 베이스볼 레퍼런스(http://www.baseball-reference.com/)의 RC 자료

   

지난 10년 기간의 메이저리그 30개 팀의 실제 득점과 RC, 그리고 OCAR  공식의 편차를 비교했을 때, RC는 지난 10년간 실제득점과 5.44% 편차가 나고 OCAR 공식은 10년간 99.62%의 득점정확도를 기록하여 실제 득점과 0.38% 차이가 나고 있다. 실제 득점과의 정확도가 기존의 RC보다 새로운 공식이 매우 높게 나타났다.

선수평가 방식 : 27아웃당 득점력, OCAR / 27

타자의 성적을 OCAR 공식에 의해 평가하면 득점확률 가산치가 가장 높은 무사상황 타석의 비중이 큰 1번 타자는 같은 실력을 가진 다른 타자에 비해서 더 높은 점수를 획득하게 되는 모순이 발생하게 된다. 무사 타석의 비중이 적은 중심타자나 하위 타선의 타자들은 상대적으로 낮은 점수를 획득할 수밖에 없기 때문이다. 또한 이 공식으로 계산된 값이 누적스탯이기 때문에 많은 경기에 출전한 선수들이 더 높은 점수를 얻게 되므로 이에 대한 조정이 필요하다.

모든 타자들을 공정하게 평가하기 위해서 타자의 무사, 1사, 2사상황의 타석수를 지난 10년간 메이저리그 평균으로 조정하고, 상황별 아웃수도 변경된 타석수를 기준으로 재조정한 이후, RC 27과 같은 방식으로 수치화했다.


OCAR / 27로 평가한 메이저리그 주요타자들의 통산 순위


선수

OCAR/27

RC/27

1위

알버트 푸홀스

7.646

9.967

2위

토드 헬튼

7.251

9.452

3위

매니 라미레즈

7.229

9.046

4위

랜스 버크만

7.126

8.703

5위

짐 토미

7.153

8.581

6위

알렉스 로드리게스

7.036

8.393

7위

치퍼 존스

6.859

8.293

8위

라이언 하워드

6.730

8.098

9위

아담 던

6.628

7.431

10위

카를로스 델가도

6.614

7.798

11위

마크 텍세이라

6.539

7.652

12위

맷 홀리데이

6.482

7.892

13위

블라디미르 게레로

6.413

7.703

14위

바비 어브레이유

6.392

7.694

15위

핸리 라미레즈

6.352

7.918

※ 베이스볼 레퍼런스의 2009년 도실 기록이 업 데이트가 되지 않아서 아웃에 대한 조정은 하지 못했으나 수치차이는 거의 없다.


27아웃당 득점능력을 평가한 OCAR / 27에서 메이저리그 현역선수중 1위는 알버트 푸홀스였다. 새로운 공식으로 평가했을 때 푸홀스는 자신만의 능력으로 한 경기에서 7.6득점을 기록할 수 있는 것으로 나타났다. 메이저리그 리드오프중에서는 작년 시즌 3번 타자로 활약한 핸리 라미레즈가 가장 높은 순위에 랭크되었다.

OCAR 공식은 타순에 따라 변동이 심한 스탯인 득점을 보다 객관적으로 분석하는데 적용할 수 있다고 판단이 된다. 중심타자의 역량에 따라 득점 기록이 크게 변동하는 1번타자와 2번타자로 구성된 테이블 세터들의 순수한 득점능력을 유용하게 평가할 수 있으며, 선수들이 기록한 총 득점에서 볼넷이 차지하는 비중과 안타가 차지하는 비중도 분석이 가능해진다. 더불어 야구팬들이 평소 궁금하게 생각하고 있던 중심타자들이 리드오프 위치로 타순이동을 했을 때의 득점 능력 또한 이 공식을 적용해서 가늠 할 수 있을 것으로 예상된다.

OCAR 공식에 대한 평가.

KBO의 윤병웅 기록 실장은 새로운 공식이 RC 등의 기존의 공식에서 한발 더 나아가 아웃카운트별로 득점공헌도를 세부적으로 측정한점은 진일보한 시도이며 OCAR 공식으로 계산한 결과물이 실제적인 득점을 더 정확하게 반영한다는 점에서 기존의 방식보다 더 우수한 방식이라고 평가했고, 성균관대학교 통계학 박사인 박용석씨는 야구 경기에서의 득점확률이 아웃카운트별로 차이가 난다는 것이 사실이며, 수만 건의 과거 경기 자료를 통해 계산된 득점확률을 가산치로 활용하고 있다는 점에서 기존 공식보다 OCAR 공식이 득점능력을 평가하는 데 더 효과적이라고 평가했다. 한국프로야구 공식 기록을 제공하고 있는 스포츠투아이에서는 한국프로야구 경기기록 수십만 건의 아웃카운트별, 주자상황별 득점확률을 분석한 자료를 본인에게 보내주어서 한국선수들도 이 공식으로 평가가 가능하게 되었다. 국내 프로야구팀의 한 전력분석팀은 새로운 공식으로 계산했을 때 실제 득점과 거의 오차가 나지 않는 점에 관심을 보였다.

그러나 본인은 아직 이 공식에 대해서 의구심을 해소하지 못했다. 99.62%라는 놀라운 득점정확도를 보이고 있는 이 공식이 타자들의 순수한 득점능력을 평가할 수 있는 스탯으로써 합리적인 것인지 야구팬들의 검증을 기다리고 있다.

제가 인식하지 못하고 있는 공식의 문제점이나 오류가 존재할 가능성을 찾아내기 위해서 차후 지속적으로 야구전문가와 새로운 공식을 검증할 것이며, 중대한 오류가 발견되면 즉시 공개하겠습니다. 또한 해외에서 이 공식이 과거에 이미 발표가 되었는지도 확인할 수 없었습니다. 혹시라도 이미 고안된 공식이라면 진심으로 사과드립니다.

이 공식에 대해 의문이 있는 야구팬은 쏘왓의 야구블로그 http://twooutsowhat.tistory.com에 의견 남기시면 함께 고민하겠습니다..

사용자 삽입 이미지

사용자 삽입 이미지
,
BLOG main image
쏘왓의 야구블로그
스포츠 서울닷컴에서 야구칼럼을 쓰고 있습니다.
by 쏘왓의 야구블로그

카테고리

전체보기 (1004)
WBC (52)
메이저리그 (124)
한국야구 (5)
일본야구 (4)
MLB 선수들 설문조사 (26)
박찬호. 추신수 (30)
이치로 스즈키 (73)
빌제임스 필딩 바이블 (8)
06~08 포지션별 수비랭킹 (37)
선수별 수비 챠트 (67)
선수별 홈런비거리챠트 (90)
구장 조감도 (29)
스카우팅 리포트(AL) (16)
스카우팅 리포트(NL) (35)
야구동영상 (121)
MLB 야구기록 (54)
김연아 (109)
ssowhat's view (120)

최근에 올라온 글

최근에 달린 댓글

블로그코리아에 블UP하기
믹시

쏘왓의 야구블로그

쏘왓의 야구블로그's Blog is powered by Tistory
Copyright by 쏘왓의 야구블로그. All rights reserved.

쏘왓의 야구블로그's Blog is powered by Tistory. Designed by Qwer999.