我在这里想要做的是对美国大联盟老虎队在2008年的平均命中率进行评估。我不是球探,所以我只考虑统计数据而不是工具。由于更多的统计数据可供大联盟球员使用,因此我使用的算法与TigsTown所使用的算法不同。我从查看击球平均值开始。表1显示了Tigers 2008的击球平均值。
表1:2008年老虎击球平均值
平均 | |
马格里奥·奥多涅兹 | .317 |
普拉西多·波兰科(Placido Polanco) | .307 |
米格尔·卡布雷拉(Miguel Cabrera) | .292 |
卡洛斯·吉伦(Carlos Guillen) | .286 |
柯蒂斯·格兰德森 | .280 |
埃德加·伦特里亚(Edgar Renteria) | .270 |
马库斯·泰晤士 | .241 |
加里·谢菲尔德 | .225 |
布兰登·英格 | .205 |
平均命中率的问题在于,击球手击球后发生的事情在很大程度上无法控制。他可以击中被抓住的线驱动器或逃脱内野手控制的软风衣。通常,这些运气和不幸在整个季节中都会消失,但有时却不会。因此,玩家的击球平均值不可重复。也就是说,它与 季节到季节 (相关系数= .43)。
比起击球平均值更可重复的统计数据是接触百分比(相关性= .90)。接触百分比是指击球手挥舞的球的百分比,使击球手接触。该统计资料摘自 粉丝图 它已迅速发展成为我在互联网上最喜欢的网站之一。击球统计数据的另一项统计是每只蝙蝠的三振出动率,与每年的相关度为.80。我本来可以使用K / PA,但是Fan Graphs数据库没有计算板外观所需的所有项目,与我的其他数据库合并将比现在更麻烦。接触率和K / AB的Tigers领导人见下表2和表3。
表2:2008年老虎的接触百分比
播放器 | 联系 % |
普拉西多·波兰科(Placido Polanco) | .927 |
卡洛斯·吉伦(Carlos Guillen) | .862 |
埃德加·伦特里亚(Edgar Renteria) | .856 |
马格里奥·奥多涅兹 | .851 |
加里·谢菲尔德 | .830 |
柯蒂斯·格兰德森 | .796 |
米格尔·卡布雷拉(Miguel Cabrera) | .775 |
布兰登·英格 | .758 |
马库斯·泰晤士 | .743 |
表3:2008年老虎的每只蝙蝠三振出局
播放器 | K / AB |
普拉西多·波兰科(Placido Polanco) | .074 |
埃德加·伦特里亚(Edgar Renteria) | .127 |
马格里奥·奥多涅兹 | .135 |
卡洛斯·吉伦(Carlos Guillen) | .160 |
加里·谢菲尔德 | .199 |
柯蒂斯·格兰德森 | .201 |
米格尔·卡布雷拉(Miguel Cabrera) | .205 |
布兰登·英格 | .271 |
马库斯·泰晤士 | .301 |
普拉西多·波兰科(Placido Polanco)在两个类别中都领先老虎队,这不足为奇。实际上,他在两个方面都领导着美国联赛。 Contact%和K / AB为我们提供了建立联系的能力的信息,但它们并没有告诉我们联系的牢固程度。线路传动百分比可以帮助我们实现目标。您通常可以通过查看线路驱动器百分比来了解击球手的命运。相对于击球平均值,线驱动百分比高的球员可能会遇到很多困难。相反,击球手的线驱动率相对于击球平均值低的击球手可能会得到很多便宜的命中。表4中列出了Tigers线驱动器的百分比。
表4:2008年老虎的线驱动百分比
播放器 | 线驱动器% |
埃德加·伦特里亚(Edgar Renteria) | .222 |
马格里奥·奥多涅兹 | .204 |
卡洛斯·吉伦(Carlos Guillen) | .202 |
米格尔·卡布雷拉(Miguel Cabrera) | .196 |
柯蒂斯·格兰德森 | .191 |
普拉西多·波兰科(Placido Polanco) | .187 |
马库斯·泰晤士 | .170 |
布兰登·英格 | .164 |
加里·谢菲尔德 | .143 |
看到埃德加·伦特里亚(Edgar Renteria)的高线驱动率有点令人惊讶。这表明他可能不太走运,他的打击平均反弹可能会在2009年反弹。
我将以上四项结合起来,得出一个描述普通技能命中率的统计数据。首先,我对每个数字进行归一化,以便它们都具有相同的标度-平均值为0,标准偏差为1。然后,我为每个统计量分配了权重,以表示其重要性。最重要的统计数据是击球平均数(毕竟所有技能都称为击球平均数),因此我给击球平均数的权重是其他数字的两倍:
0.4 x BA + 0.2 x接触百分比-0.2 x KPCT + 0.2 x LD%
最后,我对结果进行反向归一化,以使我们回到原始的打击平均水平。
运作方式如下:埃德加·伦特里亚(Edgar Renteria)的平均击球率为.270。但是,他的联系方式,三振和线驱动率都非常好。因此,他调整后的击球平均值达到了.284。表5列出了所有Tigers的结果。
表5:2008年老虎平均命中率
播放器 | 平均 | 联系 % | K / AB | 线驱动器% | 调整后的平均 |
普拉西多·波兰科(Placido Polanco) | .307 | .927 | .074 | .187 | .304 |
马格里奥·奥多涅兹 | .317 | .851 | .135 | .204 | .299 |
卡洛斯·吉伦(Carlos Guillen) | .286 | .862 | .160 | .202 | .285 |
埃德加·伦特里亚(Edgar Renteria) | .270 | .856 | .127 | .222 | .284 |
米格尔·卡布雷拉(Miguel Cabrera) | .292 | .775 | .205 | .196 | .275 |
柯蒂斯·格兰德森 | .280 | .796 | .201 | .191 | .271 |
加里·谢菲尔德 | .225 | .830 | .199 | .143 | .245 |
马库斯·泰晤士 | .241 | .743 | .301 | .170 | .239 |
布兰登·英格 | .205 | .758 | .271 | .164 | .227 |
Renteria和Sheffield的调整后击球平均值均明显好于实际击球平均值。 Magglio Ordonez和Miguel Cabrera调整了BA,使BA大大低于其实际平均值。最后,根据此算法,Polanco是2008年平均命中率最高的Tiger,而Brandon Inge最差。
好消息是,如果命中平均值与谢菲尔德平均值相关,则命中270和220的可能性相同。
回复删除糟糕的是,如果平均命中率与击球平均命中率相关,那么Inge击中200和250的可能性一样大。
到目前为止,我只看了一年的数据,所以我不确定调整后的平均预测值如何。但是,谢菲尔德和英格的低线驱动百分比告诉我,去年他们的低打击率很可能不是运气不好的结果。
回复删除Lee,我认为实际平均值与预计平均值之间的差异并不明显。最显着的变化是Inge,相差22分,或每50个AB命中约1.1点。看来随机性或其他因素(例如速度和功率)可能会更重要,并且会破坏分析可能拥有的任何预测值。我确实认为预测未成年人联赛的学士学位很有价值。我怀疑您会在他们的数字上看到更大的差异。
回复删除击球平均值与调整后的击球平均值之间没有较大差异的原因是,击球平均值是计算的一部分。对于小联盟球员来说,情况将是相同的。尝试根据接触率,线路驱动率和K pct来预测BA可能很有趣。
回复删除我认为调整后的BA并没有任何重大的预测价值。我认为,OPS和RC等统计数据有三项基本技能:击中平均值,力量和板块纪律。这是尝试隔离普通技能的命中率。我认为这可能比击球平均好一些。接下来,我将研究功率,它要简单得多,因为隔离功率比BA更可重复,并且可能不需要调整。
李在这件事上一如既往地出色。
回复删除麦克风
www.DailyFungo.com