2008年10月25日,星期六

平均命中率

我最近在TigsTown结束了,他们在讨论哪些Tigers小联盟球员最擅长“平均命中”。他们根据 侦察 继续 统计。从球探的角度来看,他们考虑了诸如保持稳定接触,击打各种投手以及使用整个场地等素质。从统计上讲,他们使用了击球平均值,导致击球手接触的板面百分比,击球时的击球平均值和击球时的击球次数等使用项目。它是高级内容,因此我无法透露很多结果,但我会提到二垒手贾斯汀·亨利(Justin Henry)在搜寻工具和统计方面的平均技能方面表现出色。

我在这里想要做的是对美国大联盟老虎队在2008年的平均命中率进行评估。我不是球探,所以我只考虑统计数据而不是工具。由于更多的统计数据可供大联盟球员使用,因此我使用的算法与TigsTown所使用的算法不同。我从查看击球平均值开始。表1显示了Tigers 2008的击球平均值。

表1:2008年老虎击球平均值

播放器

平均

马格里奥·奥多涅兹

.317

普拉西多·波兰科(Placido Polanco)

.307

米格尔·卡布雷拉(Miguel Cabrera)

.292

卡洛斯·吉伦(Carlos Guillen)

.286

柯蒂斯·格兰德森

.280

埃德加·伦特里亚(Edgar Renteria)

.270

马库斯·泰晤士

.241

加里·谢菲尔德

.225

布兰登·英格

.205


平均命中率的问题在于,击球手击球后发生的事情在很大程度上无法控制。他可以击中被抓住的线驱动器或逃脱内野手控制的软风衣。通常,这些运气和不幸在整个季节中都会消失,但有时却不会。因此,玩家的击球平均值不可重复。也就是说,它与 季节到季节 (相关系数= .43)。

比起击球平均值更可重复的统计数据是接触百分比(相关性= .90)。接触百分比是指击球手挥舞的球的百分比,使击球手接触。该统计资料摘自 粉丝图 它已迅速发展成为我在互联网上最喜欢的网站之一。击球统计数据的另一项统计是每只蝙蝠的三振出动率,与每年的相关度为.80。我本来可以使用K / PA,但是Fan Graphs数据库没有计算板外观所需的所有项目,与我的其他数据库合并将比现在更麻烦。接触率和K / AB的Tigers领导人见下表2和表3。

表2:2008年老虎的接触百分比

播放器

联系 %

普拉西多·波兰科(Placido Polanco)

.927

卡洛斯·吉伦(Carlos Guillen)

.862

埃德加·伦特里亚(Edgar Renteria)

.856

马格里奥·奥多涅兹

.851

加里·谢菲尔德

.830

柯蒂斯·格兰德森

.796

米格尔·卡布雷拉(Miguel Cabrera)

.775

布兰登·英格

.758

马库斯·泰晤士

.743



表3:2008年老虎的每只蝙蝠三振出局

播放器

K / AB

普拉西多·波兰科(Placido Polanco)

.074

埃德加·伦特里亚(Edgar Renteria)

.127

马格里奥·奥多涅兹

.135

卡洛斯·吉伦(Carlos Guillen)

.160

加里·谢菲尔德

.199

柯蒂斯·格兰德森

.201

米格尔·卡布雷拉(Miguel Cabrera)

.205

布兰登·英格

.271

马库斯·泰晤士

.301


普拉西多·波兰科(Placido Polanco)在两个类别中都领先老虎队,这不足为奇。实际上,他在两个方面都领导着美国联赛。 Contact%和K / AB为我们提供了建立联系的能力的信息,但它们并没有告诉我们联系的牢固程度。线路传动百分比可以帮助我们实现目标。您通常可以通过查看线路驱动器百分比来了解击球手的命运。相对于击球平均值,线驱动百分比高的球员可能会遇到很多困难。相反,击球手的线驱动率相对于击球平均值低的击球手可能会得到很多便宜的命中。表4中列出了Tigers线驱动器的百分比。

表4:2008年老虎的线驱动百分比


播放器

线驱动器%

埃德加·伦特里亚(Edgar Renteria)

.222

马格里奥·奥多涅兹

.204

卡洛斯·吉伦(Carlos Guillen)

.202

米格尔·卡布雷拉(Miguel Cabrera)

.196

柯蒂斯·格兰德森

.191

普拉西多·波兰科(Placido Polanco)

.187

马库斯·泰晤士

.170

布兰登·英格

.164

加里·谢菲尔德

.143


看到埃德加·伦特里亚(Edgar Renteria)的高线驱动率有点令人惊讶。这表明他可能不太走运,他的打击平均反弹可能会在2009年反弹。

我将以上四项结合起来,得出一个描述普通技能命中率的统计数据。首先,我对每个数字进行归一化,以便它们都具有相同的标度-平均值为0,标准偏差为1。然后,我为每个统计量分配了权重,以表示其重要性。最重要的统计数据是击球平均数(毕竟所有技能都称为击球平均数),因此我给击球平均数的权重是其他数字的两倍:

0.4 x BA + 0.2 x接触百分比-0.2 x KPCT + 0.2 x LD%

最后,我对结果进行反向归一化,以使我们回到原始的打击平均水平。
运作方式如下:埃德加·伦特里亚(Edgar Renteria)的平均击球率为.270。但是,他的联系方式,三振和线驱动率都非常好。因此,他调整后的击球平均值达到了.284。表5列出了所有Tigers的结果。

表5:2008年老虎平均命中率

播放器

平均

联系 %

K / AB

线驱动器%

调整后的平均

普拉西多·波兰科(Placido Polanco)

.307

.927

.074

.187

.304

马格里奥·奥多涅兹

.317

.851

.135

.204

.299

卡洛斯·吉伦(Carlos Guillen)

.286

.862

.160

.202

.285

埃德加·伦特里亚(Edgar Renteria)

.270

.856

.127

.222

.284

米格尔·卡布雷拉(Miguel Cabrera)

.292

.775

.205

.196

.275

柯蒂斯·格兰德森

.280

.796

.201

.191

.271

加里·谢菲尔德

.225

.830

.199

.143

.245

马库斯·泰晤士

.241

.743

.301

.170

.239

布兰登·英格

.205

.758

.271

.164

.227


Renteria和Sheffield的调整后击球平均值均明显好于实际击球平均值。 Magglio Ordonez和Miguel Cabrera调整了BA,使BA大大低于其实际平均值。最后,根据此算法,Polanco是2008年平均命中率最高的Tiger,而Brandon Inge最差。

5条评论:

  1. 好消息是,如果命中平均值与谢菲尔德平均值相关,则命中270和220的可能性相同。

    糟糕的是,如果平均命中率与击球平均命中率相关,那么Inge击中200和250的可能性一样大。

    回复删除
  2. 到目前为止,我只看了一年的数据,所以我不确定调整后的平均预测值如何。但是,谢菲尔德和英格的低线驱动百分比告诉我,去年他们的低打击率很可能不是运气不好的结果。

    回复删除
  3. Lee,我认为实际平均值与预计平均值之间的差异并不明显。最显着的变化是Inge,相差22分,或每50个AB命中约1.1点。看来随机性或其他因素(例如速度和功率)可能会更重要,并且会破坏分析可能拥有的任何预测值。我确实认为预测未成年人联赛的学士学位很有价值。我怀疑您会在他们的数字上看到更大的差异。

    回复删除
  4. 击球平均值与调整后的击球平均值之间没有较大差异的原因是,击球平均值是计算的一部分。对于小联盟球员来说,情况将是相同的。尝试根据接触率,线路驱动率和K pct来预测BA可能很有趣。

    我认为调整后的BA并没有任何重大的预测价值。我认为,OPS和RC等统计数据有三项基本技能:击中平均值,力量和板块纪律。这是尝试隔离普通技能的命中率。我认为这可能比击球平均好一些。接下来,我将研究功率,它要简单得多,因为隔离功率比BA更可重复,并且可能不需要调整。

    回复删除
  5. 李在这件事上一如既往地出色。

    麦克风
    www.DailyFungo.com

    回复删除

博客存档

订阅

我的Sabermetrics书

My Sabermetrics Book
《棒球美国》 2010年十大书籍之一

其他Sabermetrics书籍

统计计数器