득점정확도 99.62%, 한국야구공식 OCAR

메이저리그 2010.02.02 12:53 Posted by 쏘왓의 야구블로그


한달여전 본인은 기존의 야구공식에 비해서 실제득점과 오차가 상당히 감소한 야구 공식을 고안하였다. 새로운 공식은 지난 10년간 메이저리그 30개팀의 실제득점대비 99.62%의 정확도를 보였다. 이 공식의 타당성을 검증받기 위해 지난 3주간 야구 전문가와 통계학 전문가의 자문을 구했고, 검증과정에서 공식의 문제점이 발견되지는 않았으며 일리가 있다는 평가를 받았다. 하지만 개인적인 견해로는 공식에 대한 보다 자세한 검증이 필요하다고 생각하고 있다. 그러나 근시일내에 더 이상 큰 진척이 있을 것 같지 않기 때문에, 야구팬들과 다른 야구전문가들의 검증을 받는 것이 더 효과적이라는 판단으로 새로운 공식을 공개하고자 한다.

Out Counts-Factored Actual Runs (OCAR) 공식


노아웃 : (1루타 X 0.424 + 2루타 X 0.628 + 3루타 X 0.863 + 홈런 X 1.0 + 볼넷 X 0.424 + ROE X 0.424 + HBP X 0.424)

1아웃 : 1루타 X 0.271 + 2루타 X 0.410 + 3루타 X 0.655 + 홈런 X 1.0 + 볼넷 X 0.271 + ROE X 0.271 + HBP X 0.271

2아웃 : 1루타 X 0.127 + 2루타 X 0.219 + 3루타 X 0.253 + 홈런 X 1.0 + 볼넷 X 0.127 + ROE X 0.127 + HBP X 0.127


노아웃 득점생산력 + 1아웃 득점생산력 + 2아웃 득점생산력 +도루 X 0.18 - 도실 X 0.32 = Out Counts-Factored Actual Runs (OCAR)


아웃카운트를 고려한 실질적인 득점이라는 뜻의 OCAR 공식은 타자의 실제적인 득점력을 측정하기 위한 목적으로 고안되었으며, 공식의 기본적인 원리는 주자가 없다는 전제하에 한 타자의 득점과 연관된 모든 요소(장타율,출루율,주루)에 아웃카운트별로 득점확률가치를 부여한 방식이다. 장타율요소에는 1루타~ 홈런이, 출루요소에는 볼넷과, 힛바이 피치, ROE가 포함되었다. ROE는 야수의 실책이지만 스피드가 뛰어난 선수들이 더 많은 ROE를 기록한다는 점에서 타자의 능력으로 평가했다. 더불어 ROE가 실제경기에서 힛바이 피치와 거의 비슷하게 발생하기 때문에 전체 득점에서 무시할 수 없는 비중을 차지한다는 점을 고려했다. 주루 요소에는 도루와 도실이 포함되었다.

OCAR 공식은 팀 라인업의 앞뒤 타선 역량과도 관계가 없고 주자상황과도 관계가 없는 해당타자의 순수한 득점능력만을 평가하는 것이 목적이며 팀이나 리그 전체의 득점력을 평가할 때도 적용이 가능하다.


OCAR 공식의 원리


공식에 포함된 각 요소의 아웃카운트별 가치는 미국의 세이버매트리션 톰 탱고의 득점확률을 적용했다.


무사 득점확률

1사 득점확률

2사 득점확률

1루

0.424

0.271

0.127

2루

0.628

0.410

0.219

3루

0.863

0.655

0.253

홈런

1.000

1.000

1.000


비교적 최근인 2000년대의 수년간 메이저리그 자료를 근거로 하여 톰 탱고가 만든 득점확률은 수만 건의 실제 경기자료를 놓고 득점확률을 계산한 것이다. 홈런의 득점확률은 당연히 1이기 때문에 공식에 1의 가치를 부여했다.

상기 표에 나온 득점확률이 시합에서 발생한 타자의 모든 행위를 반영한 수치이지만 실질적으로 득점확률이 적용이 되는 요소는, 루상에 타자가 진루한 상황 즉 출루가 된 요소에만 한정된다는 사실에 근거하여 출루가 된 모든 요소에 아웃카운트별로 득점확률을 곱해주는 방식의 공식이다. 기존의 야구공식은 타점과 선행주자의 추가진루에 대한 영향력이 다르다는 이유로 1루타와 볼넷에 차등가치를 부여하고 있지만, 득점에만 한정할 경우에는 1루타와 볼넷이 똑같은 가치를 가지고 있다는 점에 착안한 공식이다.

득점확률에 의하면 아웃 카운트에 따라서 똑 같은 안타와 볼넷이라도, 득점확률차이가 크게 나고 있다. 무사는 1사와 2사상황의 합친 득점확률정도의 비중이고 1사는 2사 상황보다 2배가량, 득점확률이 높다. RC와 XR등의 기존 야구공식이 아웃 카운트별로 득점확률이 큰 차이가 나는데 아웃카운트별 득점가치에 차등을 두지 않고 모두 한 가지 득점가치로 평가했기 때문에 실제 득점과 일정수준의 오차가 존재할 수밖에 없다고 판단된다.

아래의 표는 2000년부터 2009년까지 메이저리그 30개팀의 10년간의 총 득점, OCAR, RC의 기록이다.



RC

ML 실제득점

득점대비 %

OCAR

ML 실제득점

득점대비 %

2009

23908

22419

93.77%

22932.2

22419

97.76%

2008

23913

22585

94.44%

22920.1

22585

98.53%

2007

24633

23322

94.67%

23293.5

23322

100.12%

2006

25020

23599

94.32%

23465.6

23599

100.56%

2005

23621

22325

94.51%

22634.8

22325

98.63%

2004

24805

23376

94.23%

23420.2

23376

99.81%

2003

24182

22978

95.02%

23008.8

22978

99.86%

2002

23605

22408

94.92%

22781.2

22408

98.36%

2001

24462

23199

94.83%

23216.9

23199

99.92%

2000

26307

24971

94.92%

24374.3

24971

102.44%

10년 평균

244,456

231,182

94.56%

232,047.6

231,182

99.62%

※ 2000~2009년 베이스볼 레퍼런스(http://www.baseball-reference.com/)의 RC 자료

   

지난 10년 기간의 메이저리그 30개 팀의 실제 득점과 RC, 그리고 OCAR  공식의 편차를 비교했을 때, RC는 지난 10년간 실제득점과 5.44% 편차가 나고 OCAR 공식은 10년간 99.62%의 득점정확도를 기록하여 실제 득점과 0.38% 차이가 나고 있다. 실제 득점과의 정확도가 기존의 RC보다 새로운 공식이 매우 높게 나타났다.

선수평가 방식 : 27아웃당 득점력, OCAR / 27

타자의 성적을 OCAR 공식에 의해 평가하면 득점확률 가산치가 가장 높은 무사상황 타석의 비중이 큰 1번 타자는 같은 실력을 가진 다른 타자에 비해서 더 높은 점수를 획득하게 되는 모순이 발생하게 된다. 무사 타석의 비중이 적은 중심타자나 하위 타선의 타자들은 상대적으로 낮은 점수를 획득할 수밖에 없기 때문이다. 또한 이 공식으로 계산된 값이 누적스탯이기 때문에 많은 경기에 출전한 선수들이 더 높은 점수를 얻게 되므로 이에 대한 조정이 필요하다.

모든 타자들을 공정하게 평가하기 위해서 타자의 무사, 1사, 2사상황의 타석수를 지난 10년간 메이저리그 평균으로 조정하고, 상황별 아웃수도 변경된 타석수를 기준으로 재조정한 이후, RC 27과 같은 방식으로 수치화했다.


OCAR / 27로 평가한 메이저리그 주요타자들의 통산 순위


선수

OCAR/27

RC/27

1위

알버트 푸홀스

7.646

9.967

2위

토드 헬튼

7.251

9.452

3위

매니 라미레즈

7.229

9.046

4위

랜스 버크만

7.126

8.703

5위

짐 토미

7.153

8.581

6위

알렉스 로드리게스

7.036

8.393

7위

치퍼 존스

6.859

8.293

8위

라이언 하워드

6.730

8.098

9위

아담 던

6.628

7.431

10위

카를로스 델가도

6.614

7.798

11위

마크 텍세이라

6.539

7.652

12위

맷 홀리데이

6.482

7.892

13위

블라디미르 게레로

6.413

7.703

14위

바비 어브레이유

6.392

7.694

15위

핸리 라미레즈

6.352

7.918

※ 베이스볼 레퍼런스의 2009년 도실 기록이 업 데이트가 되지 않아서 아웃에 대한 조정은 하지 못했으나 수치차이는 거의 없다.


27아웃당 득점능력을 평가한 OCAR / 27에서 메이저리그 현역선수중 1위는 알버트 푸홀스였다. 새로운 공식으로 평가했을 때 푸홀스는 자신만의 능력으로 한 경기에서 7.6득점을 기록할 수 있는 것으로 나타났다. 메이저리그 리드오프중에서는 작년 시즌 3번 타자로 활약한 핸리 라미레즈가 가장 높은 순위에 랭크되었다.

OCAR 공식은 타순에 따라 변동이 심한 스탯인 득점을 보다 객관적으로 분석하는데 적용할 수 있다고 판단이 된다. 중심타자의 역량에 따라 득점 기록이 크게 변동하는 1번타자와 2번타자로 구성된 테이블 세터들의 순수한 득점능력을 유용하게 평가할 수 있으며, 선수들이 기록한 총 득점에서 볼넷이 차지하는 비중과 안타가 차지하는 비중도 분석이 가능해진다. 더불어 야구팬들이 평소 궁금하게 생각하고 있던 중심타자들이 리드오프 위치로 타순이동을 했을 때의 득점 능력 또한 이 공식을 적용해서 가늠 할 수 있을 것으로 예상된다.

OCAR 공식에 대한 평가.

KBO의 윤병웅 기록 실장은 새로운 공식이 RC 등의 기존의 공식에서 한발 더 나아가 아웃카운트별로 득점공헌도를 세부적으로 측정한점은 진일보한 시도이며 OCAR 공식으로 계산한 결과물이 실제적인 득점을 더 정확하게 반영한다는 점에서 기존의 방식보다 더 우수한 방식이라고 평가했고, 성균관대학교 통계학 박사인 박용석씨는 야구 경기에서의 득점확률이 아웃카운트별로 차이가 난다는 것이 사실이며, 수만 건의 과거 경기 자료를 통해 계산된 득점확률을 가산치로 활용하고 있다는 점에서 기존 공식보다 OCAR 공식이 득점능력을 평가하는 데 더 효과적이라고 평가했다. 한국프로야구 공식 기록을 제공하고 있는 스포츠투아이에서는 한국프로야구 경기기록 수십만 건의 아웃카운트별, 주자상황별 득점확률을 분석한 자료를 본인에게 보내주어서 한국선수들도 이 공식으로 평가가 가능하게 되었다. 국내 프로야구팀의 한 전력분석팀은 새로운 공식으로 계산했을 때 실제 득점과 거의 오차가 나지 않는 점에 관심을 보였다.

그러나 본인은 아직 이 공식에 대해서 의구심을 해소하지 못했다. 99.62%라는 놀라운 득점정확도를 보이고 있는 이 공식이 타자들의 순수한 득점능력을 평가할 수 있는 스탯으로써 합리적인 것인지 야구팬들의 검증을 기다리고 있다.

제가 인식하지 못하고 있는 공식의 문제점이나 오류가 존재할 가능성을 찾아내기 위해서 차후 지속적으로 야구전문가와 새로운 공식을 검증할 것이며, 중대한 오류가 발견되면 즉시 공개하겠습니다. 또한 해외에서 이 공식이 과거에 이미 발표가 되었는지도 확인할 수 없었습니다. 혹시라도 이미 고안된 공식이라면 진심으로 사과드립니다.

이 공식에 대해 의문이 있는 야구팬은 쏘왓의 야구블로그 http://twooutsowhat.tistory.com에 의견 남기시면 함께 고민하겠습니다..

사용자 삽입 이미지

사용자 삽입 이미지
신고

댓글을 달아 주세요

  1. 이전 댓글 더보기
  2.  수정/삭제  댓글쓰기

    쏘왓님 지난시즌보다 투수력은 어떻게 생각하시는지
    지난시즌은 사실 기대이상으로 활약했다고 생각해서
    킹-리-스미스-피스터-스넬 이렇게 선발진은 구성하지 않을까요
    닉힐은 어떻게 생각하시는지

    2010.02.02 15:44 신고
  3. 글쎄요.  수정/삭제  댓글쓰기

    아웃카운트가 많을수록 루상에 주자가 많이 있다는 점을 생각해야겠죠. 루상에 주자가 있을 때의 안타가 더 가치가 있다는 점을 생각한다면, 아웃카운트만을 고려하는 것은 완벽하지 않다고 생각합니다.
    베리 본즈의 경우야, 고의사구가 워낙 많았는데, 그 고의사구를 어느 아웃카운트에 내주겠습니까? 당연히 아웃카운트가 쌓여있는 상황이죠. 또 주자가 있을 때 아웃카운트가 쌓여있구요.

    2010.02.03 08:56 신고
  4. 글쎄요.  수정/삭제  댓글쓰기

    주자상황을 고려하게 되면, 루상의 주자의 advance와 관련해서 복잡한 고려요소가 생기니까, 득점확률로 비교하고 아웃카운트 만을 고려하신 것같은데, 좋은 시도입니다만, 개선의 여지는 있어보입니다. 주자상황을 고려하지 않을 순 없는 것이거든요. 아웃카운트가 쌓일수록 주자가 많많이 있다는 사실이 결국은 걸림돌입니다.
    사실 저도 님과 비슷한 시도를 하다가, 모든 변수들을 처리하는데 한계를 느껴 그만두었습니다.

    2010.02.03 09:14 신고
    • BlogIcon 쏘왓의 야구블로그  수정/삭제

      아웃카운트가 쌓일수록 주자가 많이 있다는 사실이 걸림돌이라는게 무슨 뜻인지 이해가 안되는군요.

      이미 득점확률에는 그러한 변수들에 대한 고려가 되어 있는 것인데요..

      2010.02.03 09:26 신고
    • 글쎄요.  수정/삭제

      이 점에는 어느 정도 동의합니다. 득점확률에 주자상황의 변수도 고려된다고 볼수있겠네요. 그러나 주자 3루상황과 주자 만루사황과 같은 경우, 가치구별이 되지 않습니다.
      득점확률로 보면, 주자 3루에서의 안타나 주자만루에서의 안타가 동일한 가치를 가집니다.그러나 실제 득점에선 비교가 되지 않겠죠.

      2010.02.03 09:36 신고
  5. 글쎄요.  수정/삭제  댓글쓰기

    그리고 득점확률을 적용하신 것이 좀 의문스럽습니다. 결국 얼만큼 득점과 연결되었는가로 가치를 따져야 하는 것은 아닌지요. 타율만을 따졌을 때 선수의 능력을 제대로 평가할 수 없다는 것과도 연관되는 이야기인 것 같은데요. 안타의 확율을 말하는 타율의 가치가 점점 하락하듯이, 득점확률자체는 크게 의미가 없다고 보여지는데요.
    홈런의 가치를 1로 보신 것은 논리적으로 설득력이 전혀 없습니다. rc와의 정확도를 비교하신 것보면, 결국득점예상치를 비교하신 건데, 님의 공식은 확률값이고, rc는 득점수입니다. 단위가 전혀 다른 것입니다.
    문제가 있다고 생각하지 않으십니까?

    2010.02.03 09:24 신고
    • BlogIcon 쏘왓의 야구블로그  수정/삭제

      득점확률을 적용해서 계산했을때 10년간 실제 득점과 99.62%의 정확도를 보였기 때문에 실제 득점과 연결될 확률이 높다는 것을 보인것이라고 봐야죠..

      득점확률자체가 큰 의미가 없다면 실제득점과의 높은 연관성이 안 나와야 하는 것이라 봅니다.

      2010.02.03 09:23 신고
    • 글쎄요.  수정/삭제

      결과만이 중요한 것이 아니라, 계산과정이 논리적으로 맞아야죠. 득점확률을 통해 계산된 님의 공식과 득점수로 계산된 rc와의 직접비교가 논리적으로 타당하다고 보십니까?

      2010.02.03 09:27 신고
  6. BlogIcon 쏘왓의 야구블로그  수정/삭제  댓글쓰기

    rc는 득점수로 계산된게 아닙니다. rc에 대해서 완전히 잘못 알고 계시는 군요. rc도 이 공식과 마찬가지로 각요소에 일정수준의 가치를 부여해서 평가한 것이지 득점수로 계산된 공식이 아닙니다. 득점수로 계산되었다니요..
    그리고 rc는 이 공식과 비교해서 상당히 낮은 득점과의 정확도를 보여주고 있습니다.

    - 주자 3루와 주자 만루에서 안타가 동일한 가치를 가집니다 그러나 실제득점에서는 비교가 안되죠..-

    이 공식을 잘못 이해하고 있는 것 같군요. 이공식은 타점과는 관계가 없는 공식입니다. 오직 타자주자의 득점만을 따지는 공식입니다. 예를 든것을 보면 이공식의 목적과 개념을 잘못이해하고 있는 것 같습니다.

    2010.02.03 09:44 신고
    • 글쎄요.  수정/삭제

      rc가 안타에 대한 가치를 부여하여 실제 득점을 예상해내는 것 아닌가요? 따라서 그 rc의 가치는 예상 득점수죠.
      그런데 님의 공식은 확률이란 말입니다. 득점확률과 득점수는 전혀 다른 개념입니다.
      득점확률로 봤을 때, 주자 3루상황고 주자만루상황은 같지만(득점확률이란 1점이상 들어올 확률을 의미하므로 실제 얻어내는 득점의 수와는 관계가 없다.) 실제 득점 기대치는 다르죠.
      님의 목적은 아는데, 확률값으 이용해서 예상 득점수인 rc와 단순비교하는 것은 성립불가라는 것이죠.
      분명히 님은 자유로운 의견게진을 허락하셨습니다.
      저도 님을 비판하려는 것이 아니라, 함께 고민해보자라는 것입니다.
      rc가 득점수를 예상한 것이 아니라면, 왜 실제 득점과 비교해서 차이가 난다고 말하는 겁니까? 서로 단위가 완전히 다른 것을 왜 직접비교하느냐 이겁니다.
      장타율에서의 안타가치를 실제 득점수와 비교할 수 없듯이, 만일 rc가 그런 것이라면 비교불가인거죠.

      2010.02.03 09:53 신고
  7. BlogIcon 쏘왓의 야구블로그  수정/삭제  댓글쓰기

    득점수라는게 rc의 계산값을 의미하는 거였군요..

    그 rc의 예상득점수가 실제득점과 차이가 많이 나기 때문에 효과적이지 않다는 것입니다. 그리고 rc는 원리가 타당하지 않은 부분이 많은 공식입니다.

    2010.02.03 09:59 신고
    • 글쎄요.  수정/삭제

      더 이야기는 안드리겠습니다. 방어논리로 전환되시는 것 같아서.. 님의 시도는 가치가 있다는 것은 인정해드리나, 근본부터 개념의 오류가 있다고 전 생각합니다.
      나름대로 생각이 있는 것이니, 너무 나무라진 말았으면 합니다. 더 이상 반박드리는 것도 예의에 어긋나는 것 같군요. 아무쪼록 여러사람들의 생각을 모아, 제대로 된 선수평가의 도구를 만들어보자구요.

      2010.02.03 09:59 신고
    • rc나  수정/삭제

      rc나 xr과 같은 지표는 공격이벤트의 가치를 득점으로 표현하는 방식입니다.
      이 점은 동의하시죠?
      그런데 그 가치, 곧 득점은 평균득점입니다.
      예를 들어, xr에서의 단타가치가 0.5점이라 해서 언제나 단타의 가치가 0,5점이라는 것이 아닙니다.
      나올 수 있는 점수는 다양한데, 그 각각의 점수들과 그 각각의 점수들이 나오는 득점확률을 곱한 값들을 다 더하여 평균값을 구하는 것입니다.
      예를 들면, 1점이 나올 확률이 0.5 2점이 나올 확률이 0,5일 경우, 그 평균은 (1*0.5)+(2*0.5)=1.5, 이렇게 구해지듯이 말입니다.
      xr이나 rc에서의 안타가치는 바꿔말하면 득점*득점확률의 형태인 것입니다.
      그런데 님의 공식은 득점확률만을 따집니다.
      이상태에서 님의 공식과 득점예상치를 이콜로 놓고 비교해 본다는 것은 말이 안됩니다.
      님의 공식은 불완전 한 형태이기 때문입니다.
      득점확률* 득점에서 득점이 빠져버린 것입니다.
      곧 그 득점의 요소를 모두 1로 본 것이 되어버립니다.
      야구에서 나오는 점수가 항상 1점이겠습니까? 점수가 나오지 않을수도 있고 다양한 점수가 나올수 있습니다.
      논리적으로 성립하지 않습니다.
      님의 공식이 득점확률만을 고려해서 계산하였는데, 실제득점과 거의 엇비슷하게 나왔던 이유는 아웃카운트의 감점요소를 고려하지 않았기 때문입니다.
      득점을 고려하여 완벽한 식이었다면 그 값이 rc보다 훨씬 커야 정상입니다.
      이해가 되십니까?
      님의 공식에 의한 값과 rc의 값중 어느 값이 실제득점과 비슷한가 이것이 문제가 아니라, 님의 공식자체가 불완전하다라는 것입니다.
      rc를 개선하려고 한다면, 일단 rc처럼 득점*득점확률의 계산형태를 갖추면서 가치조정을 하는 것이 기본입니다.

      2010.02.04 08:27 신고
  8. BlogIcon 쏘왓의 야구블로그  수정/삭제  댓글쓰기

    현재 espn의 rc 공식이 희생플라이, 희생번트, 도루에 같은 가치를 적용하고 있다는 것과 희생번트를 고의사구보다도 더 높은 가치를 부여하고 있는 것을 아시나요?

    이런 공식을 지금 누군가 만들어서 발표했다면 미쳤다고 할 것입니다. 그런 터무니 없는 공식이 espn의 현재 rc입니다.

    2010.02.03 10:07 신고
    • rc나  수정/삭제

      RC의 공식이 실제득점과 잘 들어맞지 않는다란 점은 저도 인정합니다.
      그러나 님의 공식은 근본적으로 공식의 형태가 완벽하지 않다라는 것입니다.
      RC의 공식에 대한 수정에 대한 노력은 필요하지만, 그 수정노력은 올바른 방법으로 행해져야 한다는 것이 저의 의견입니다.

      2010.02.04 08:55 신고
  9. BlogIcon 쏘왓의 야구블로그  수정/삭제  댓글쓰기

    방어논리 전혀 없습니다. 저는 이공식에 대한 불합리성을 찾으려는게 진정한 목적입니다. 불합리성을 찾지못하고 기사를 쓰면 나중에 부메랑이 되어서 더큰 문제가 되기 때문입니다. 누구라도 제가 살펴보지 못한 오류를 지적해주면 감사하게 생각할 것입니다.

    그러나 님이 말하는 것은 이해하기가 어렵네요. 이공식이 타점과 관계없이 타자의 득점만을 계산하는 원리인데,,, 구체적으로 어떤 부분에 개념의 오류가 있다는 것인지 전혀 이해를 하지 못하겠네요. 제가 볼때는 님이 이 공식을 잘못이해하고 있는것 같습니다. 주자 만루건 주자 3루건 이공식에서는 모두 같은상황입니다. 차이가 나는 상황이 아닙니다.

    2010.02.03 10:28 신고
    • rc나  수정/삭제

      주자만루나 주자3루나 같은 상황으로 간주한다는 것이 님의 최대 오류인 것입니다.또 님은 득점을 고려하고 있지 않습니다. 그 득점의 한부분인 득점확류만을 고려하고 있을 뿐이죠.

      2010.02.04 08:56 신고
    • rc나  수정/삭제

      더 이상은 말씀드리지 않겠습니다. 감정싸움으로 번지는 것을 저는 극도로 우려합니다.어차피 님이 제 의견을 받아들일 생각이 있으면 그러실 것이고, 아니라면 무시하시겠죠. 그건 크게 상관이 없습니다.
      그저 이렇게 생각하는 사람도 있구나라고 이해해주시면 고맙겠습니다. 그런데, 저 이외에는 조언을 해주는 이들을 발견하기 어렵군요. 차라리 엠팍과 같은 곳에서 검증을 받아보시는 것이 어떨까요?
      그런 곳이라면 님이 원하시는 다수에 의한 검증을 받을 수 있지 않을까 하는데요.

      2010.02.04 08:59 신고
  10.  수정/삭제  댓글쓰기

    쏘왓님 제가 현지 이야기를 모르는편 입니다
    매리너스 페이롤 감축이야기 있었나요 ?
    누적기록을 아웃카운트별로 조절하는것이 어떻게 하는지 이해가 되지않네요
    생소한 공식이라서 그런지...

    2010.02.03 12:20 신고
    • BlogIcon 쏘왓의 야구블로그  수정/삭제

      저도 요즘 매리너스 뉴스를 챙기지 않고 있어서 페이롤 감축 어떻게 되는지 모르겠네요..

      통산 기록을 무사와 1사, 2사 메이저리그 평균으로 조정한다는 뜻입니다. 타석수를 조정하면서 아웃도 조정합니다.

      아웃을 조정한다는 것은 무사에서 출루율이 아주 높은 1번타자를 리그평균 무사타석수로 조정하면 타석수가 줄어드니까 아웃수도 줄어들겠죠. 그러니까 그 줄어든 타석수 비율만큼 아웃수도 줄여야지만 ocar 27로 평가를 공정하게 할수 있습니다.

      2010.02.03 13:22 신고
  11.  수정/삭제  댓글쓰기

    투수력에 대해서는 어떻게 생각하세요
    특히 좌완싱커 닉힐...

    2010.02.03 13:27 신고
  12. BlogIcon 쏘왓의 야구블로그  수정/삭제  댓글쓰기

    이 공식은 이미 야구사이트에 올려져서 지속적으로 검증을 받고 있습니다.

    그런데 님은 이 공식에 대한 이해를 잘못 하고 있는 것 같군요.

    - 주자만루나 주자3루나 같은 상황으로 간주한다는 것이 님의 최대 오류인 것입니다.또 님은 득점을 고려하고 있지 않습니다. 그 득점의 한부분인 득점확류만을 고려하고 있을 뿐이죠. -

    이 공식은 오직 득점만을 평가하는 공식입니다. 주자 만루나 주자 3루나 타자의 득점과 연관되서는 똑 같은 환경입니다. 주자가 있건 없건 관계가 없습니다. 이공식은 주자가 없다는 전제하에서 출발한 것입니다. 주자 만루나 주자3루가 팀 전체 득점과 관계가 있는 것이지 이 공식에서는 전혀 상관이 없는 것입니다.

    -------- 이 공식은 주자가 없다는 전제 ---- !!!!!

    며칠전에도 다른 분이 님과 똑 같은 착각을 해서 같은 질문을 했는데.. 본문의 내용을 다시 한번 차분히 읽어 보시기를 바랍니다.

    2010.02.04 22:51 신고
    • 그래요?  수정/삭제

      주자 없는 상황만을 상정하셨다구요? 조건을 엄청 제한하셨네요.그런데 이랬을 경우 심각한 문제가 발생하지 않나요? 볼넷과 단타의 가치가 구별이 되지 않습니다.
      주자가 없는 상황이라면 볼넷과 단타는 같은 가치를 가지게 되고 말죠. 제 생각에는 심각한 결함같은데요.
      근본적으로 득점확률만을 고려해서는 안된다는 것이 저의 생각인데, 득점확률을 쓰는 방법을 인정한다해도, 이런 문제가 있다고 보는데요. 이것을 지적하는 다른 분들은 없었나요? 정말 놀래서 그렇습니다. 저도 야구 잘 모르지만, 누구라도 이 정도의 문제점은 지적해낼 수 있으리라 보거든요. 제가 잘못 생각하는 건지. 당황스럽네요.

      2010.02.05 09:36 신고
  13. BlogIcon 쏘왓의 야구블로그  수정/삭제  댓글쓰기

    지금 님은 이 공식의 목적과 원리를 이해하지 못하고 있네요..

    이공식은 오직 한 타자가 기록하는 득점만을 구할려고 하는 것입니다..

    주자없는 상황만을 가정한게 아니라 주자가 있건 없건 주자가 없다고 전제했다는 것입니다. 한 타자의 득점에는 주자가 있건 없건 큰 차이가 나지 않기 때문입니다.

    볼넷과 1루타는 타점에는 차이가 나지만 득점에는 차이가 나지 않습니다.

    본문을 다시한번 읽어보시기 바랍니다.

    2010.02.05 18:17 신고
  14. 확실해 둬야할 것이.  수정/삭제  댓글쓰기

    님이야말로 이 공식의 목적을 이해하지 못하고 있습니다. 이 공식은 님이 전제로 한 주자의 요소는 무시, 아웃카운트만을 고려한 득점확률에 대한 공식일뿐입니다. 이것으로 득점을 예상하는 rc와 동등하게 놓고 비교하고, 실제 득점과의 오차를 말한다는 것이 이상하다는 겁니다. 공식이 가지고 있는 의미와 다르게 적용을 하고 있다고 저는 느낍니다.
    볼넷과 1루타가 차이가 나지 않는 님의 공식. 이것이야말로 님의 공식으로는 절대 득점을 예측할 수 없다라는 것을 잘 말해주는 것입니다.
    님이 정해놓은 안타의 가치란, 루상의 주자를 무시하고 아웃카운트만을 고려하여 득점이 아닌 득점확률을 근거로 매겨진 값이란 겁니다.
    득점확률과 득점은 명확히 좀 구별하십시요.
    1이닝당 평균 득점이 4점인 경우와 1점인 경우를 예로서 비교해보죠.
    이 경우 모두 득점이 나지 않을 확률은 50% 똑같다고 합시다.
    따라서 득점확률 역시 똑같이 50%겠죠. 님의 공식대로라면 이 두경우는 차이가 없습니다.
    그러나 전자의 경우 득점이 났을 때의 평균득점은 8점이고, 후자는 2점입니다.
    이 차이로 인해 득점에 있어서는 전자가 후자의 4배나 됩니다.
    득점확률만으로는 근본적으로 득점을 논할수가 없습니다.

    2010.02.06 12:08 신고
    • BlogIcon 쏘왓의 야구블로그  수정/삭제

      님은 득점확률에 대해서 잘못이해하고 있습니다.

      - 1이닝당 평균 득점이 4점인 경우와 1점인 경우를 예로서 비교해보죠. 이 경우 모두 득점이 나지 않을 확률은 50% 똑같다고 합시다. -

      이런 가정은 톰 탱고의 득점확률에서는 성립이 될수 없는 것입니다.

      볼넷과 1루타가 한 타자의 득점에서 다른 가치가 있나요? 똑 같은 겁니다. 선행주자를 추가진루시키고 타점에서는 볼넷과 1루타의 가치가 차이가 나지만 한 타자의 득점에 관해서만 볼때는 똑 같은 것입니다. 본문을 다시한번 숙독하시기 바랍니다.

      2010.02.06 14:26 신고
  15. BlogIcon 쏘왓의 야구블로그  수정/삭제  댓글쓰기

    무사 득점확률
    1사 득점확률
    2사 득점확률

    1루
    0.424
    0.271
    0.127

    2루
    0.628
    0.410
    0.219

    3루
    0.863
    0.655
    0.253

    홈런
    1.000
    1.000
    1.000

    톰 탱고의 득점확률표는 주자가 없다는 이 득점확률외에도 주자 1.2루, 주자 1.3루 주자2.3루 주자 만루의 득점확률도 있습니다. 그러나 주자가 없을때 기록한 1루타, 2루타, 3루타의 득점확률에 나머지 주자 있을때의 득점확률이 이미 포함이 되었습니다. 그렇기 때문에 주자없다는 전제하에서의 기록을 가지고 10년간 메이저리그 기록을 계산했을때 득점정확도가 99.62%가 나온겁니다.

    그러므로 타자의 득점능력만을 평가할때 주자가 있었다고 하더라도 주자가 없다는 가정하에 계산이 가능한것입니다.

    주자 만루에 한 타자가 1루타를 쳤다고 하면 1타점이나 2타점을 기록할수 있을 겁니다. 만약 볼넷을 기록했다면 1타점을 기록합니다. 그러나 이 타자가 기록할 득점만을 따지면 1루타나 볼넷이나 똑 같은 것입니다. 그러므로 득점능력을 계산하는 이 공식에서는 똑 같은가치를 부여한것입니다.

    2010.02.06 14:42 신고
    • 답답하네요.  수정/삭제

      팀의 득점이 개인의 득점과 같습니까? 만루상황에서 2타점 1루타라고 하면, 개인의 득점은 1점이겠지만, 팀의 득점은 2점입니다. 어떻게 팀의 득점을 논하면서, 주자상황이 아무런 관계가 없다고 말씀하실 수 있습니까? 이게 상식적으로 가능한 이야기입니까? 제가 계속해서 말씀드리는 것은 님의 공식으론 팀의 득점을 설명할 수 없다라는 겁니다. 그런데 무슨 rc등과 같은 지표와 비교한단 말입니까? 이만하겠습니다. 도저히 토론이 진행이 되지 않습니다. 님의 공식의 정의안에서 방어논리만 펼치면서, 이 공식이 rc를 대체할만한 공식이라고 말씀하시는 분과 어떻게 토론이 되겠습니까?

      2010.02.07 06:55 신고
  16. BlogIcon 쏘왓의 야구블로그  수정/삭제  댓글쓰기

    그래도 이해가 되지 않는다면 방명록에 전화번호를 남기시면 설명해 드리겠습니다. 님 말고도 몇분이 님과 똑 같은 오해를 했었습니다. 댓글로 설명을 해도 이해를 못하시는 분들과 통화를 했을때 모두 이해가 되었으니 전화번호를 남기시면 좋겠습니다.

    2010.02.06 14:55 신고
  17. egoist  수정/삭제  댓글쓰기

    확실히님인지 그래요님인지 어떻게 불러야 할지 모르겠지만...
    전반적으로 득점공식들을 잘 이해를 못하고 계시네요,.....

    주자별 상황이나 몇가지를 말씀하셨는데 RC나 BR이나 모두 같은 원리로 만들어져있습니다.
    대부분 각 상황의 득점 상황 모두 주자별 상황은 고려되있지 않고 출루율만 봐도 안타와 볼넷이 같은 가중치이죠.....

    위 공식에서 볼넷과 안타가 같은 가중치로 되있는 것은 톰 탱고가 통계낸 표 자체가 1B에서 진루할 상황을 같이 찾아냈기 때문일 것입니다.

    만약에 아웃카운트별 득점상황을 볼넷과 안타등으로 나눠서 계산했다면 그 가중치로 계산했으면 됬을 것입니다. 어짜피 1B에 대한 가중치가 볼넷과 안타의 중간값 정도 된다는 얘깁니다.


    제가 볼땐 님께서 만약 기타 RC나 XR같은 공식들을 직접 계산해보시고 원리를 생각해보셨다면 쏘왓님이 만드신 공식은 쉽게 이해가 갈텐데 공식들을 결과물만 보고 과정에 대해서 몇번 생각을 안해보다가 쏘왓님 같은 분이 공식을 만드는 원리까지 제시를 하니깐 그 과정들을 전혀 이해못하시고 내놓는 주장으로 보입니다.

    평소에 데이터 긁어다가 엑셀에서 몇번 계산해 본사람이라면 이 공식이 그렇게 이해 안되는 공식은 아닙니다.

    2010.02.06 20:22 신고
    • 답답하네요.  수정/삭제

      득점확률이란 것이 무슨 의미인지도 모르시군요.
      득점확률은 어느 특정 아웃카운트,주자상황에서의 이닝의 나머지동안 최소 1점이 들어올 평균적인 확률을 말하는 것입니다.
      이 득점확률이란 개념은 세이버 메트릭스를 조금만 알아도 등장하는 기본적인 개념인데, 이것에 대한 개념도 불확실하시군요.
      주자상황이 관계가 없다라는 것은 말도 안되죠.이닝의 나머지 동안 주자가 출루하지 않겠습니까? 안타와 볼넷의 득점확류이 절대로 같을 수가 없다는 거죠.
      그리고 제가 볼때. 님은 xr이나 rc와 같은 공식들을 제대로 이해하지 못하고 있습니다. 이런 공식들은 평균득점을 통해서 안타의 가치를 구해내는 것입니다.
      장타율과 출루율과는 근본적으로 다른 것입니다.
      평균득점이 득점확률만으로 설명될 수 있는 겁니까?
      최소 1점만을 얻어내는 경우의 확률값에 불과한데?
      말을 맙시다.
      그리고 1b에서의 득점확률만을 따져서 볼넷과 단타의 구별이 가지 않았다라는 부분에 대해 말씀드리는데,
      xr이나 rc도 아웃카운트별로 공식을 나누지 않았을 뿐, 쏘왓님처럼 쪼개면 충분히 값을 구할 수 있습니다.
      아웃카운트별로 안타와 득점간의 상관관계를 방식 그대로 분석해내면 그만입니다.
      아웃카운트별로 쪼개지 않고, 평균을 냈기 때문인 것이뿐입니다 왜 그렇게 하지 않았느냐. 한번 쪼개기 시작하면 끝이 없죠.정말 공평하게 할려면 영향을 미치는 모든 요소를 고려해서 쪼개야 합니다.전 의문이 드는데 xr이나 rc값을 아웃카운트 별로 쪼개면 될텐데, 왜 느낫없이 득점확률이 등장하는지 전 모르겠다는 겁니다.
      득점확률로 득점을 모두 설명할 수 없는 것인데 말이죠.
      세세하게 쪼개려 한다면, 보다 세부적으로 하던지, 또 그러면서 득점을 논하면서 득점확률만으로 간단히 가치를 구해내는 엉성함이 도저히 납득이 가지 않는다라는 겁니다.

      2010.02.07 07:19 신고
  18. egoist  수정/삭제  댓글쓰기

    굳이 말씀드리자면 한국식 주입교육의 폐해가 아닌가 싶은데요...
    아마 공식만 외우시고 도출과정은 별로 생각 안해보신가 싶군요....
    세이버의 이해라고 말씀하시는데 솔찍히 직접 계산해보거나 공식만들려고 노력해본적은 없으시지요?

    위 공식은 정확히 출루율에 기반한 공식입니다. 반대로 타점에 기반한 공식도 나올 수 있겠지요.....

    지금 이해를 못하시는게 2가지가 있습니다.

    한가지는 주자별 상황이고 두번째는 볼넷과 안타의 구분인데..
    볼넷과 안타의 구분은 만약에 톰탱고가 분류해줬다면 분류가 되었을 겁니다.
    다만 그 두가지가 중간 가중치가 구해져있어서 별차이가 없다는 것이죠...

    결과적으로 나온 계산이 실제득점과 일치하고 있지 않습니까?


    그리고 주자별 상황인데....

    말씀하시는 상황이 모든 세이버 공식들은 주자별 가중치를 두지 않습니다.
    RC나 XR에서 주자별 상황이 고려되는거 보셨나요?

    세이버의 이해를 말씀하시는데 세이버에서는 고전적으로 타점과 클러치를 인정하지 않습니다.


    그리고 위 톰탱고의 득점확률표도 득점이 난 통계를 가지고 만든 확률입니다. 말이 확률이지 통계란 말이죠... XR에 들어가는 가중치랑 같은 겁니다.

    글고 이해가 되실려나 모르겠는데 출루에 기반을 두고 계산한 값에서 주자를 놓게 되면 결과적으로 중복이 됩니다. 그래서 모든 공식들이 주자별상황이 안들어갑니다. 주자별 상황은 득점 통계와 같이 볼려면 중복이 되기 때문에 실제 득점보다 늘어나게 됩니다.

    클러치팩터는 따로 구해야 합니다.

    글고 제가 쏘왓님에게도 물어본 거였지만 XR이나 RC의 아웃카운트별 결과도 구할려면 구할 수 있습니다만 카운트별 가중치가 없습니다. 뭐가 됬던 득점팩터에 대한 예상치가 아웃카운트별로 나온 통계가 없다는 것이죠...


    제가 비록 제 3자지만 님의 의견을 보면 위 공식에 대한 깊이 없이 단지 쏘왓님의 의견을 까기위해 남기는 글로 밖에 안보입니다.

    세이버에 대한 이해라고 하시는데 세이버에서 클러치상황을 배제한다는 것도 기본적인 것인데 이걸 주장한다는 것도 세이버에 대해 아는건 별로 없으신 분 같구요....
    그저 공식을 까기 위해 주장하시는 것 같습니다.

    정말 실제로 직접 RC라도 구해보신 적 있으신가요?

    2010.02.07 19:16 신고
  19. BlogIcon buy link of london  수정/삭제  댓글쓰기

    본즈 기록은 rc의 단점이 드러난 케이스입니다. 그건 운이 아니라 rc에서 고의사구의 가치가 실제보다 과대평가되었기 때문에 그런현상이 나타나는 것입니다.
    본즈의 04년이 푸홀스의 통산 rc 27 2배 이상인데 말이 전혀 안되는 거죠.
    본즈 한명이 푸홀스 2명 연달아 타석에 들어서는것보다 더 생산력이 좋다는 것은 터무니 없는 것이니까요. 그것도 주된 이유가 고의사구 120개 기록했다는 것만으로 그렇다는 것은 말도 안되는 것이죠.

    2010.12.10 17:20 신고
  20. BlogIcon welding machine  수정/삭제  댓글쓰기

    이것은 지금까지 발견된 최고의 게시물 중 하나입니다. 내용이 매우 좋다 매우 informative.I 방식하여 RSS 피드를 구독! 감사합니다, 이것은 정말 멋지다!

    2011.07.22 16:11 신고
  21. BlogIcon miracle mineral solution  수정/삭제  댓글쓰기

    이 잘 정의된 도움을 발견했습니다. 우수 작동합니다.

    2011.10.08 20:59 신고

BLOG main image
쏘왓의 야구블로그
스포츠 서울닷컴에서 야구칼럼을 쓰고 있습니다.
by 쏘왓의 야구블로그

카테고리

전체보기 (1004)
WBC (52)
메이저리그 (124)
한국야구 (5)
일본야구 (4)
MLB 선수들 설문조사 (26)
박찬호. 추신수 (30)
이치로 스즈키 (73)
빌제임스 필딩 바이블 (8)
06~08 포지션별 수비랭킹 (37)
선수별 수비 챠트 (67)
선수별 홈런비거리챠트 (90)
구장 조감도 (29)
스카우팅 리포트(AL) (16)
스카우팅 리포트(NL) (35)
야구동영상 (121)
MLB 야구기록 (54)
김연아 (109)
ssowhat's view (121)

쏘왓의 야구블로그

쏘왓의 야구블로그's Blog is powered by Tistory
Copyright by 쏘왓의 야구블로그. All rights reserved.

쏘왓의 야구블로그's Blog is powered by Tistory. Designed by Qwer999.

티스토리 툴바