2015年5月2日星期六

DRA简介:最新的Sabermetric Rage

该博客的大多数读者都知道ERA或运行平均值(RA)在评估投手表现方面的局限性。 最大的两个问题是:
  • 尽管事实与击球手分担责任,但RA会为投手的比赛结果给投手以充分的荣誉/责任。 例如,一个身后防守强的投手比他身后防守不佳的投手命中率(因此跑动次数)少。
  • RA赋予投手对事件的顺序或计时的全部责任,也就是说,假定投手可以控制何时放弃击球和步行。例如,如果一个投手在给定年份中的得分位置上使运动员的投球异常出色,那么他的ERA会比那些情况下的典型年份低。此外,比起通常一年平均分配基础跑垒手的投手,倾向于将单一基础跑垒手聚在一起的投手具有更高的ERA。
实际上,投手对击中落下的击球数和比赛顺序的控制有限。 因此,已经开发了诸如FIP,xFIP,tERA和SIERA之类的防御独立的投球统计数据(DIPS),以消除RA的某些噪声。 DIPS主要基于投手可以控制的事情-散步,击球手,三振,三垒打和击球类型(地球,飞球,线驱动器,果蝇)。

由于DIPS指标基于投手实质上控制的事物,因此,与RA相比,DIPS指标被认为是对真正人才的更好衡量。 结果,它们在预测未来性能方面也比RA更好。但是,它们仅能衡量投手才能的一部分,应作为RA的补充而不是替代。  

尚不确切知道投手对比赛中的球有多少控制,但最近的研究告诉我们,有些投手在防止击中球方面比其他投手更好。  For example, 迈克·法斯特,曾经是棒球招股说明书的一名,现在是美国职业棒球大联盟(MLB)的一名剑术师,他使用了Sportsvision的命中f / x数据来显示投手随着球拍速度的变化。 

因此,与其从RA到FIP进行巨大飞跃,不如先半途而废,这似乎是个好主意。  与其一次删除打击预防和排序,不如一次删除一个因素可能更好。 比尔·詹姆斯(Bill James) 组件ERA (ERC). 他将创建的运行方法应用于投手,他根据步行,击球手, 删除线,本垒打和命中率均允许。

此外,“基本跑步次数”指标是David Smythe在1990年代初创建的。 基于这样的想法,如果我们知道基本跑者的数量,总人数,本垒打和典型的得分率(得分率是平均得分的基本跑者的百分比),我们就可以估算得到的团队得分。 Base Runs也适用于单个投手。 完整的公式可以找到 这里.

现在有一个新的俯仰度量标准,超出了上述任何度量标准。 这项新措施应得运行平均值(DRA)是由棒球招募书研究者乔纳森·贾奇(Jonathan Judge)在哈里·帕夫利迪斯(Harry Pavlidis)和丹·图肯科普(Dan Turkenkopf)的帮助下开发的。 该统计信息在 概述文章 并在 更复杂的文章 解释所有数学。

第一篇文章解释说,DRA的计算首先根据每个击球事件的权重(根据击球手的wOBA统计数据)平均分配多少来开始。 例如,本垒打平均增加1.4次跑步,双打平均花费0.75次。 这类似于ERC和基本运行。

下一步是将DRA与之前的版本区分开来。 它针对各种上下文进行调整,例如:
  • 棒球场
  • 投手是在家还是在公路上投球 
  • 反对击球手的身份和 击球手的惯性
  • 接球手的身份以及他在球场上的熟练程度
  • 公断人的身份以及他多久致电罢工与接球
  • 每个板出现前的底脚和出局次数
  • 在每次印版出现之前进行微分
  • 投手后面的防守素质
  • 投手是开始还是缓解
  • 游戏时间温度
  • 跑垒员的素质
  • 投手控制跑步比赛的能力。
  • 投手负责野外投球和传球。 

有很多变数!

结果是一个看起来像ERA的数字,但它试图隔离投手真正负责的跑步。 例如,老虎队的先发球员阿尼巴尔·桑切斯(Anibal 桑切斯)的ERA为5.46,但其他统计数据表明他的状态还不错,并且正在为自己不负责的冲锋队充电。 FIP的赔率为4.11,而DRA的赔率则为3.93。 因此,虽然桑切斯在比赛中每9局获得超过5局得分,但DRA表示他只负责每9局少于4局。

您可能会遇到的一个问题是DRA的计算在数学上是否合理。作为具有混合模型经验(作为DRA的基础)的统计程序员,就我所知,该方法对我来说看起来不错。 汤姆·汤戈(Tom Tango)和布莱恩·米尔斯(Brian Mills)等研究人员对它进行了更彻底的审查,似乎批准了。 如果您数学上很想看自己,可以阅读 深入文章.  

我们是否需要另一个投球统计数据? I think we do.  由于上述原因,短期内ERA不足。 FIP和其他DIPS变体更接近于衡量投手的天赋,但仍未回答诸如如何对击球进行比赛等问题。组件ERA和基本运行解决了击球问题,但将全部责任归咎于投手,这是不正确的。 

DRA是否需要如此复杂? 那是我不确定的事情。 我喜欢他们控制击球手面对的质量和投手后面的防守,但是他们需要控制比赛时的温度吗? 到目前为止,关于每个组件对投手值的贡献程度并没有多少文章。  这里有很多变量,当我们如此迅速地从简单过渡到复杂时,我会感到有些不舒服。 这些是问题,而不是批评,因为我不知道答案,并期待进一步的研究和讨论。 

你们大多数人可能感兴趣的问题是DRA如何评估Tigers投手? 答案在下面的表1中显示。

表1:老虎入门的DRA 
投手
时代
FIP
DRA
西蒙
3.13
3.36
3.25
罗伯施泰因
3.91
3.32
3.36
价钱
3.48
2.82
3.40
格林
4.60
3.52
3.53
桑切斯
5.46
4.11
3.93
数据源: 棒球章程

惯用右手的阿尔弗雷多·西蒙(Alfredo 西蒙)带领老虎队首发,以3.25 DRA在美国联赛中排名第十。 这仅比他的ERA(3.13)高一点,但比FIP(3.36)略低。 所以,到目前为止,他看起来还不错。 从上面与桑切斯(Sanchez)的例子中可以看出,其他老虎新人肖恩·格林(Shane 格林)在DRA(3.53)上的表现也比在ERA(4.60)上好得多。

因此,我们有了一个具有很大潜力的全新的投球统计数据。 它可能比其他可用数字更好 但是,与任何新措施一样,我们不应将其视为所有投球统计数据的结尾,而应视为评估投手时要查看的另一个数字。 传统上,投球评估一直很混乱,因此非常欢迎采用新的方法。

2条评论:

  1. 有趣的统计数据,但是无论以哪种方式削减统计数据,最好的投手似乎总是在统计数据分析中位居榜首。

    回复删除
  2. 的确'一种类似的制衡体系,新的统计数据在某种程度上与其他统计数据相关联,因为任何统计手段都固有地试图提供描述球员素质的信息。

    如果您交叉引用那些不同的统计量度,您会看到,尽管它们通常具有相似的排名,但订单仍然存在一些差异。即使将一项统计数据与另一项统计数据进行比较,即使相差仅10%,也可能导致明显的差异。例如,假设有一个.300 BA的玩家。如果相对于.300 BA而言,另一个统计数据使该球员看起来好10%而差10%,那么这将导致0.2270-.330的潜在差距,这是一个相当大的利差波动。

    以这张图表为例,Price在ERA上比Simon更具优势,价格已接近60点范围的全部,而DRA弥补了所有这些,然后再增加15点使Simon领先。

    统计分析的关键是分别查看每个统计信息,并就该统计信息所讲述的故事准确评估该统计信息的价值。隔离每个独立统计信息的价值以及了解统计信息所代表含义的含义确实是一种艺术形式。您可以进一步迈出这一步,然后在得出任何总体评估结论时,将每个统计值相对于其他统计值的权重相加。做得好的人就是在数值分析的基础上评估球员的优势。

    回复删除

博客存档

订阅

我的Sabermetrics书

My Sabermetrics Book
《棒球美国》 2010年十大书籍之一

其他Sabermetrics书籍

统计计数器