2013年8月31日,星期六

谢尔策在原始运行预防中落后于Darvish

看来今年在美国联赛中可能会引起一些争议的Cy 您ng比赛,传统主义者指的是老虎队目前的前锋Max 谢尔策令人难以置信的19-1纪录,而MLB.COM的Brian Kenny团结起来消除W-L纪录。 该博客的大多数读者不会在评估三地走势图时对三地走势图W-L记录施加太大的压力,但是最好使用什么统计数据呢? 当然没有简单的答案,最好查看各种数字。 我将在未来几周内讨论一些我的最爱。

在进入更复杂的项目(如FIP和BABIP以及团队防御)之前,我想看看简单的奔跑预防:三地走势图可以在多少局中进行多少次奔跑? 我们知道并不是所有允许的奔跑都是三地走势图的责任,但这是一个很好的起点。

谢尔策已在183 1/3局(IP)中允许进行62次运行(所有运行,而不仅仅是未赚取的运行),运行平均值(RA)为3.05。 下表1显示了Scherzer在RA中排在联盟第四,仅次于流浪者队的右手Yu v(2.84),队友Anibal 桑切斯(2.87)和Bartolo 结肠 of 竞技(3.00)。

表1:AL RA领导人

三地走势图
球队
知识产权
R
RA
宇 v
游骑兵
174.2
55
2.84
阿尼巴尔 桑切斯
老虎队
144.2
46
2.87
巴托洛 结肠
竞技
159.1
53
3.00
最高 谢尔策
老虎队
183.1
62
3.05
弘树 黑田
洋基队
171.1
60
3.16
费利克斯 埃尔南德斯
水手
187.2
67
3.22
尚志 岩ak
水手
184.0
66
3.23
詹姆士 盾牌
皇室
189.0
68
3.24
德里克 荷兰
游骑兵
180.0
66
3.30
克里斯 特卖
白色 袜
180.1
67
3.35
杰瑞德 编织者
天使
128.1
49
3.44
马特 摩尔
射线
121.1
47
3.49
贾斯汀 马斯特森
印第安人
188.1
74
3.54
约翰 走狗
红 袜
155.0
61
3.54
欧文 桑塔纳
皇室
180.2
72
3.60
 数据源: FanGraphs.com

您可能会注意到的第一件事是,Scherzer的投篮次数比他前面的所有三地走势图都要多,他需要为此而声名狼藉。 为了使三地走势图对投掷的投掷球数和质量有所贡献,皮特·帕尔默(Pete Palmer)于1984年引入了投球次数(PR)统计信息。 三地走势图次数告诉我们与联盟平均值相比,三地走势图节省或输掉的次数。 它基于三地走势图的IP,得分(R)和联赛RA。 帕尔默实际上使用了赚钱的跑步,但我更喜欢跑步。 

美国联赛的RA为4.33,每局为0.48。 因此,您希望平均三地走势图在183 1/3局中允许88.2跑。 因此,在相同的局中,Scherzer比平均三地走势图允许的奔跑次数少62-88.2 = 26.2,也就是说,他的三地走势图次数为26.2。 完整的公式是:

公关 = 知识产权 *(Lg RA / 9)-R 

或(如果您希望获得跑步成绩):

公关 = 知识产权 *(Lg ERA / 9)-ER

AL领导者在下面的表2中列出。 Darvish仍然是28.8的领先者,但是Scherzer在该指标上排名第二。 

表2:AL投球领先者

三地走势图
球队
知识产权
R
公关
宇 v
游骑兵
174.2
55
28.8
最高 谢尔策
老虎队
183.1
62
26.1
巴托洛 结肠
竞技
159.1
53
23.5
阿尼巴尔 桑切斯
老虎队
144.2
46
23.4
费利克斯 埃尔南德斯
水手
187.2
67
23.1
詹姆士 盾牌
皇室
189.0
68
22.9
尚志 岩ak
水手
184.0
66
22.5
弘树 黑田
洋基队
171.1
60
22.3
德里克 荷兰
游骑兵
180.0
66
20.6
克里斯 特卖
白色 袜
180.1
67
19.6
贾斯汀 马斯特森
印第安人
188.1
74
16.5
欧文 桑塔纳
皇室
180.2
72
14.7
约翰 走狗
红 袜
155.0
61
13.6
杰瑞德 编织者
天使
128.1
49
12.6
克里斯 蒂尔曼
金莺
167.0
68
12.3

数据源: FanGraphs.com

您 can go one step further by considering ballpark environment. According to the FanGraphs.com,由于考量因素,Comerica Park的跑步次数比平均值多2%,因此我们将Scherzer的投球次数乘以1.02,得出26.6调整后的投球次数。 表3显示Darvish以30.5调整后的投球次数领先,其次是Scherzer 26.6和Sanchez(23.8)。

表3:AL调整后的投球主管

三地走势图
球队
知识产权
R
公关 调整
宇 v
游骑兵
174.2
55
30.5
最高 谢尔策
老虎队
183.1
62
26.6
阿尼巴尔 桑切斯
老虎队
144.2
46
23.8
詹姆士 盾牌
皇室
189.0
68
23.4
巴托洛 结肠
竞技
159.1
53
22.8
弘树 黑田
洋基队
171.1
60
22.8
德里克 荷兰
游骑兵
180.0
66
21.8
费利克斯 埃尔南德斯
水手
187.2
67
21.7
尚志 岩ak
水手
184.0
66
21.2
克里斯 特卖
白色 袜
180.1
67
20.4
贾斯汀 马斯特森
印第安人
188.1
74
15.8
欧文 桑塔纳
皇室
180.2
72
15.0
约翰 走狗
红 袜
155.0
61
14.3
克里斯 蒂尔曼
金莺
167.0
68
12.7
杰瑞德 编织者
天使
128.1
49
12.1

数据源: FanGraphs.com

当然,投球分析并不会以得分得分结束。 我们需要设法将三地走势图的跑步责任与他的防守者的责任区分开来,但这很复杂,在某种程度上是未知的。 稍后我将详细讨论,但就纯分计算而言,Scherzer目前比Darvish落后了一个月。  

26条评论:

  1. 好吧,在我的OE%计算中,Scherzer击败了Darvish。上一次我将它与Bucholz和Sale进行比较时,Scherzer的值为.298。 谢尔策稳定在.300。但是达维什得分为.381。而这个统计数据是基于绩效和效率的衡量标准,因此如果我投票,这对我将有所不同。我认为Scherzer会赢。

    回复删除
  2. I'm guessing that 谢尔策 wins OE% because he has lower walk and home run rates. He also beats him in FIP for the same reason. However, if you include situational pitching (RE24), v takes the lead so 我不't think it'清晰。现在,我'd可能会投票支持Scherzer,但我认为两者都有合理的论据。

    I think 谢尔策 is going to win the Cy 您ng, but not necessarily for the right reasons.

    回复删除
    回覆
    1. 好吧,再加上19-1的投篮得分将在过程中给他得分。他有太多优势。当Verlander拥有"down"季节是个好故事。花花公子每次都投球不错,他做了一件地狱的工作。他'是胜利者,除非他吹了它。

      删除
    2. 是的,HRs是分数的一部分,所有数字实际上所做的都是解释发生的事情的分数,从而表明三地走势图对其产生的东西有多危险。因此,如果他相对于Darvish的投球次数完全相同,那么这将在头脑中代表不错的统计优势'竞争。这是这个特定统计数字必须说的故事。

      删除
    3. 您好李:为什么RE24与开始投球有关?我的意思是说起始三地走势图没有'继承高水平的情况。他负责所有基础运行人员。也许他可以*留下*一局少于3个出局和跑垒员(即高杠杆情况)?如果是这样,那么统计信息正在捕获(超出FIP或PR)正在排序?干杯,凯文

      删除
    4. 凯文(Kevin),您说对了,RE24对起步器的重要性不如对起伏器的重要性。它确实捕获了序列,例如他如何与垒手投球。我试图捕捉达尔维什'运动员在得分位置上的表现。在以后的评论中,我使用了LOB%,它可能更相关。

      删除
    5. 得分手的表现真的是一项技能吗?一世'确保它有一些小方面,但不是'它主要是运气吗?样本量足够大时,'t a pitcher'在特定情况下的表现会非常接近整体表现吗?如果是这样,它不会'对我来说,似乎没有比W / L唱片更有意义的了。

      删除
    6. Jeff, 我不'我不知道这项技能有多少,但是如果我们衡量一个球员在给定的一年中为其团队增加了多少价值,我认为离合器的击打/投球即使对运气很大也很有用。我不会'不能用它来预测未来的表现,但我可以将其纳入奖项投票中。

      It'不是很喜欢W / L记录。 W / L记录的最大问题是'很大程度上取决于进攻支持,而三地走势图无法控制。三地走势图可以根据自己的情况控制三地走势图。有一些三地走势图(例如波尔切洛)经常与垒手的三地走势图表现不佳,所以's not all luck.

      删除
    7. 我不'看不到区别。出色的W / L的关键是始终保持比对手更少的奔跑。显然,Scherzer无法控制进攻为他提供了什么,但是一旦这些进攻进入了董事会,那么唯一重要的是他保留了对手's号较小。他是通过投掷1-2-3局,在第三局搁浅赛跑者还是为了避免大局而让无意义的跑步得分来做到这一点,对我来说几乎没有什么区别。

      I'm sure there's *一些*任何特定玩家的技能'可以处理任何特殊情况,但是'实际上,他们的整体技能水平总是相形见war。

      删除
    8. 胜负是一个团队要做的事情。它没有'不能真正衡量任何有关单个三地走势图的细节。如果一个三地走势图在每场比赛中都能得到10连胜的支持,他可以以7.0的年龄赢得很多比赛,但事实并非如此。'不能使他成为优秀或有价值的三地走势图。使他成为一名出色的三地走势图的原因是阻止了奔跑。

      RE24确实测量了有关三地走势图的一些东西's performance. If two 三地走势图 give up the same numbers and kinds of hits, same walks, same strikeouts but one pitcher pitches better with men on base, it will help him prevent runs better. 您 can argue whether it'有没有技巧,但是'是三地走势图所做的事情。

      Now, if you argued that ERA with a one or two run lead was similar to ERA with RISP, then you might have an argument. However, 我不'看不到RE24与Wins的比喻。 RE24可能有用也可能没有用,但是它'不像赢/输。


      我不'认为MVP奖应该衡量技能。它应该衡量产量,所以我认为'给三地走势图更多功劳是合理的

      删除
    9. 杰夫提出的一个方案是,如果您知道自己有很大的领先优势,并且愿意或计划允许进行廉价的廉价运转以换取关键,那该怎么办?如果仅靠投球统计获胜,那么三地走势图可能不会'这么快就让步,将采取更激进的投球策略。因此,如果您获得的是普通三地走势图的双发奔跑支持,那么您可能更倾向于放弃奔跑以换取出场机会,而缺少奔跑支持的三地走势图可能会因为拼命而不得不尝试获得更好的统计性能。

      因此,如果在3B上有一个毫无意义的人并且比赛被平手,您可能会努力争取三振,并尽一切可能避免跑分。但是,如果您有很大的领先优势,那么您对跑步者的关注可能会减少。因此,如果有更多的运行支持,可能会导致更多的故意不正确的统计投放。就像NFL球队会知道这一点一样'只要您使另一支球队很难获得足够的积分来超越您,就可以轻松获得很多额外的码,这是值得的,但是您可能会在此过程中承认很多无关紧要的积分'否则,如果这是一场紧张的比赛,那就别做。

      删除
    10. W / L当然是团队合作的结果,但阻止跑步也是如此。世界上所有的投球都赢了 '如果您在野外有很多小联盟,对您没有帮助。即使您完全调整了守场员的水平,投球数据仍然会受到进攻的影响。三地走势图根据得分和局限更倾向于投掷或离开接触。最重要的是,对立的经理们一定会根据得分和局限调整他们的阵容,击球和跑步策略。所有这些调整将影响跑步得分。

      在过去的几十年中,统计数据已经走了很长一段路(而我'是改进的忠实支持者),但您可以'只是简单地将某项统计数据视为存在"team based" because they'*全部*以团队为基础。完美的统计数据可能会在一天后到来,但事实并非如此't here yet.

      考虑到这一点,进入季后赛需要获胜。出于预测目的,运行可能更可靠,但是您're right that production is what matters for awards. The starting pitcher has a far greater impact on the 游戏 than anyone else, so 我不'即使他得到了很多帮助,也不能因他带领球队取得胜利而归功于他。

      I'm not a "胜利才是最重要的"家伙想像力十足,但如果您让我在外设相似的两个家伙之间挑选,W / L似乎是我唯一明智的决胜局。

      删除
    11. 是的,防止奔跑是团队合作的结晶,这就是为什么我在后文中提到需要考虑防守的原因。但是,这种摆脱您的观点。您的论点是RE24受限,W / L受限,我不这样做'不同意。在我看来,团队防守不会使垒手上的三地走势图三地走势图比空基础上的三地走势图投球更好。它'可能会发生,但是'不是自然的关联。另一方面,进攻得分的跑动次数与W / L记录有很强的相关性。所以,我不'真正将获胜视为对单个玩家有用的手段。

      TSE指出,三地走势图可以投出正确的分数。棒球不像足球,因为没有时间限制,但是'三地走势图可能会在一定程度上将分数调高。杰克·莫里斯(Jack Morris)坚持要自己得分,但没有证据表明他的ERA高的原因是得分高。看来他在大领先者和小领导者之间也一样。如果有人可以证明某个特定的三地走势图因为他的得分高而使他的ERA更高,那么您可以对他的ERA进行某种调整。

      我了解W / L记录的传统,我'll look 在 it for the fun of it, but 我不'不能将其视为衡量个人绩效的有用方法。不只是因为它's不准确,但是因为它不'将团队胜利分配给单个球员真的很有意义。我可能会用它作为决胜局,但这将是不得已的决胜局。

      另一件事是,完美的统计数据永远不会到来,也没有优秀的分析师会假装它拥有或将会拥有。我总是建议您不仅查看统计信息,还使用其他统计信息回答不同的问题。



      删除
    12. 无论如何,我觉得整个讨论都是关于Scherzer的's W/L. I won'只看W / L记录。但是,如果您可以向我证明他在做比分高低之类的事情,这使得他的W / L记录要好于ERA,那么我'll look 在 that.

      删除
    13. 是的,我同意这种哲学。每个统计都有'自己的位置,因为每个统计信息都可以告诉它 '自己独特的故事。关键在于将所有统计数据笼罩在脑海中,并能够以最大的能力刺穿那复杂而神秘的面纱,从而看到更大的画面。

      删除
    14. 我的观点是,“每个”决定都会受到得分和局限的影响。无论是否有任何特定情况影响到任何特定统计数据,都比我的薪水高出很多,但是您必须承认分数和局面会给一切加色。

      *两侧的击球手或多或少愿意在不同情况下以不同的间距摆动
      *双方的击球手或多或少都愿意猜测在不同情况下会有特定的音高
      *双方的跑步者或多或少愿意在不同情况下偷垒
      *双方的跑步者或多或少愿意在不同情况下的比赛中以球为基础
      *三地走势图或多或少愿意在不同情况下投掷某些球场和/或某些位置
      *守场员或多或少愿意在不同情况下以某些方式定位自己
      *经理或多或少愿意在不同情况下致电某些剧本
      *哎呀,尽管你在不同的情况下,umps的称呼也不同'd永远不要让他们承认

      我的观点是,在任何给定的夜晚,在球场上做出的每一个决定都会因情况而改变。甚至团队'在三角旗比赛中的位置起重要作用。一世'm not saying that any of this supports 谢尔策 in the debate for Cy 您ng; I'我只是说'在忽略一个上下文(RE24)的同时却忽略了所有其他上下文,这是愚蠢的。

      肯定可以肯定的是,如果给予同等的奔跑支持,达维什是更好的人,但事实并非如此。'他也很合理'没错除非您拥有可以让我们科学检查所有不同排列的模拟器,否则我们只能说是"假说,假说。"

      删除
    15. "Shmypotheticals"....我喜欢它,它应该是威尔·费雷尔(Will Ferrell)担任棒球经理的电影的名字。

      删除
    16. 您'对了杰夫。我们可以'不能捕获所有内容,但是我们应该跟踪我们可以衡量的内容。我认为RE24比您要制造的要干净。它是跑步,击打,步行等的自然扩展。它捕获了易于测量的内容-三地走势图在不同基准/外出情况下的投球方式。我不'不知道这是多少技能,并且不会'不能用它来预测,但回顾一个季节,它对我来说有意义。

      如果您所谈论的其他变量足够干净,我也将对其进行衡量,但它们不会'在目前的状态下,对我来说似乎没有用。

      删除
  3. v占据优势的两个地方是三脚架和搁浅的垒手。他的连击命中率一直保持在.136的平均命中率,而跑者处于得分位置,他的基准命中率还剩下84.3。那些数字不'对我来说,担负着巨大的重担,但它们实在是太不容忽视了。

    回复删除
    回覆
    1. 好吧,Scherzer今年的收入也减少了近3百万美元,因此与一些选民可能获得无形的决胜分。

      哦,那Scherzer今年打出的两倍呢?'t that count too? 我不'看不到Darvish提供的!也许吧'从Scherzer减去一倍就更容易了'跑任何数字前的投球统计! v是0-3,Scherzer是1-3。

      删除
  4. 我同意你的一切'我说,李。我只是不't see why you don't对W / L应用相同的逻辑。虽然可能对预测没有用,但它'在衡量产量时,*至少*与其他任何统计资料一样有意义。

    为了将其转换为速率统计,可能应该以某种方式将其划分为运行支持,但即使是计数统计,它也可以'这是衡量三地走势图对他的导线的保护程度的好方法's been given.

    回复删除
  5. 我的W / L问题是我不知道'我们不知道它会增加三地走势图价值的任何其他方面,而其他统计数据已经做得更好。拥有非常出色的W / L记录的三地走势图通常是个好三地走势图,尤其是当您查看他的整个职业生涯时,但它真正衡量的是什么?它'同时结合了很多东西,其中太多与三地走势图无关。如果有办法隔离三地走势图对胜利的责任,我'd对此感兴趣。就目前情况而言,我认为它阻碍了故事的发展,而不是添加到故事中。

    正如您所说,一切都是相互联系且复杂的。允许的奔跑也结合了很多东西,但我相信三地走势图对允许奔跑的贡献百分比要远大于他对胜利的贡献。他可能以某种方式为允许的所有跑步做出贡献,因为他'是允许击球手击球的人。显然,防守也有影响,但这一切都始于三地走势图。有了胜利,方程式的一半完全落在了三地走势图的手里。

    回复删除
  6. >[W / L记录]真正衡量的是什么?

    它衡量了三地走势图如何保护他所获得的线索。它'全面的统计数据,所以您're right that there'里面有很多噪音,但是它也捕获了很多东西(例如我在上面给出的清单)'t尚未独立测量。

    >有了胜利,方程式的一半完全落在了三地走势图的手里

    那'的确如此,但是我认为任何对游戏有浓厚兴趣的人已经可以凭直觉适应这一事实。对于数学方法,所有人'd真正要做的是将获胜除以总奔跑支持,以表明三地走势图将其奔跑支持转化为胜利的程度。

    回复删除
  7. 在某些情况下可以衡量。但是,三地走势图可能擅长保护引线,但引线并不多。或者说三地走势图在保护主角方面可能很糟糕,但是他的进攻却使他无奈。如果一项统计数据能够衡量某项数据,而三地走势图擅长于某项数据,那么他应该在该统计数据上做得很好。一世'd宁愿看到当他的领先优势较小时还是在RA时看到的裂痕's a blow out.

    第二点,您可以查看三地走势图通常允许允许他的奔跑并获得奔跑支持的奔跑次数,并查看他的总胜利总数是否超过该数目。一世'd考虑到这一点,而不仅仅是W / L。

    有时,您可以调整传统统计数据,使它们更有意义。另一个例子是印度储备银行。 RBI是一项团队统计数据(尽管不算是获胜的程度),但是如果您除以RBI机会,则它作为一项单独的衡量指标将变得更加有意义。

    回复删除
  8. 好点。任何想法如何定义一个"win opportunity"?也许采用“节省百分比”的方法,例如1-(移交的铅/引线)?

    回复删除
  9. I'm not sure how I'd定义机会。一世'd probably want to look 在 a bunch of real 三地走势图 and see what made sense first, but something like that might work. 您 could make it like a save where you only give a pitcher credit for the win if he has a 3-run lead or 4-run lead or something and has an ERA under 4.00 for the rest of the 游戏. 我不'不知道这是否行得通-只是丢掉一些数字。

    回复删除

博客存档

订阅

我的Sabermetrics书

My Sabermetrics Book
《棒球美国》 2010年十大书籍之一

其他Sabermetrics书籍

统计计数器