2013年2月22日,星期五

OPS +与wRC +

在过去的几年中,粉丝对“调整后的OPS”(OPS +)越来越熟悉,该统计数据由Pete Palmer于1980年代首次提出。 此OPS +指标是针对联盟平均水平和主场得分调整的OPS。 这很有用,因为它使我们可以比较在不同球场和/或不同时代玩过的球员。 它是使用以下各项计算的:

OBP =基准百分比
SLG =疲软平均值
美国职业棒球大联盟 OBP = 美国职业棒球大联盟平均OBP(删除投手)
美国职业棒球大联盟 SLG = 美国职业棒球大联盟平均SLG(删除投手)
BFP =球场因素

公式是

OPS + = (OBP / 美国职业棒球大联盟 OBP + SLG / 美国职业棒球大联盟 SLG-1)x 100 / BPF

以Miguel 卡布雷拉的2012赛季为例

OPS + =((.393 / .324 + .606 / .413-1)x 100)/ 102 = 165

通常,平均OPS +为100,大于100的OPS +高于平均水平,小于100的OPS +低于平均水平。 一个普遍的误解是,OPS与球员的OPS与联赛OPS的比率非常接近。 但是,OPS +为165并不意味着Cabrera的OPS比联盟平均水平高65%。  我们知道这是一个很高的OPS +,因为它是美国联赛中最高的,但没有具体含义。

OPS +的另一个局限性是,当OBP实际比SLG贡献80%的运行得分时,它对OBP和SLG的计数是相同的。 因此,OPS和OPS +都会短暂改变从OBP获得大部分作品的玩家。 无论如何,可以在以下位置找到OPS +数据: Baseball-Reference.com 对于所有玩家。

只要您了解缺点,OPS +指标就可以用于许多目的。 如果需要更可靠的统计信息,则可以使用“创建的加权运行(wRC +)”(Tom Tango的创建)。 因为它基于加权基准平均值(世界银行),wRC +比OPS更准确地权衡击球事件(1B,2B,3B,HR,BB,HBP,出局)。

计算公式为:

a =每个PA的MLB跑步次数(已删除投手)
b =停放调整后的wRAA / PA(已删除投手)
c = b / a +1
wRC + = c x 100

卡布雷拉(Cabrera)在2012年的数字如下:

a = .1164
b = 53.7 / 697 = .0770
c = .0770 / .1164 +1 = 1.66
wRC = 1.66 x 100 = 166。

wRC +的另一个好处是它具有准确的解释。 在卡布雷拉的情况下,他的奔跑次数比697 PA的平均击球手预期高出66%。 可以在以下位置找到所有玩家的号码 FanGraphs.com.

wRC +指标与OPS +具有相同的规模,通常不会产生完全不同的结果。 我发现Tigers的最大区别是Austin 杰克逊(135 wRC +与130 OPS +)。 下表1显示了2012年其他老虎的OPS +与wRC +的比较。 第三列是拥有250个或更多PA的玩家中的百分比。

这里要学习的教训是,wRC +比OPS +好一点,应该将其用于对玩家进行更认真的评估。 但是,如果您更喜欢使用Baseball-Reference网站,则在大多数情况下,OPS +是对球员相对击球价值的合理估计。

表1:2012年Tigers的wRC + vs OPS +


播放器
OPS +
wRC +
PCTL
卡布雷拉
165
166
99
守场员
152
153
97
杰克逊
130
135
88
德克斯
130
133
87
猎人(LAA)
132
130
85
阿维拉
100
104
52
婴儿(DET / MIA)
93
92
34
浆果
86
89
29
年轻
89
89
29
佩拉尔塔
85
86
24
布施
77
77
13
圣地亚哥
52
55
1
拉本
30
28
0


2013年2月20日,星期三

冠军萨默斯致敬视频

在今年早些时候,我写了一篇关于前老虎外野手的文章 冠军萨默斯,去年秋天去世。  今天,我收到了Champ的好朋友Stan Beaubouef的电子邮件,他已经阅读了该文章。 博布夫先生在萨默斯(Summers)的追悼会上致悼词, 服务是幻灯片放映,他后来发布到 你管. 该视频做得很好。 我希望它能给1970年代末,1980年代初的Tigers粉丝们带来一些回忆。 

2013年2月18日,星期一

最佳老虎阵容是什么?

每个球迷都有自己的理想阵容想法。 传统主义者倾向于喜欢以更快的速度领先,以蝙蝠控制的家伙排在第二,以最佳击球手排在第三,以最佳拍手(谁也不是最佳击球者)排在第四。 有些人只是希望排名第一和第二的击球手能打基础,而不是太在乎速度。其他人跟随 这本书 由汤姆·丹戈(Tom Tango),米切尔·利希特曼(Mitchel Lichtman)和安德鲁·海豚(Andrew Dolphins)提出,最佳击球手不应打第三,第二,第四。  还有一些玩具的想法是让团队中最好的击球手领先,第二最好的击球手排第二,依此类推,理由是最好的击球手应该在击球时获得最大的收益。  

我想在每个赛季之前做的一件事是在 棒球沉思. 由分析师西里尔·莫龙(Cyril Morong),肯·阿内森(Ken Arneson)和瑞安·阿姆布鲁斯特(Ryan Armbrust)开发,它估计阵容的跑动次数将根据每个击球手的场上命中率(OBP)和拍打平均值(SLG)来评分。 由于打基础得分(OBP)和带得分命中领先的跑步者(SLG)是跑步得分的两个最重要因素,因此他们的方法具有一定的道理。

但是,排队算法也有局限性。 也许最重要的是,它没有考虑慢跑者的速度。 它也没有解决心理因素,例如击球手在某些地方感觉舒适。 它所做的就是尝试纯粹基于击球来确定最佳阵容,这是一个不错的起点。

使用 比尔·詹姆斯手册 投影时,我将九个Tigers起动器的OBP和SLG插入了 阵容分析仪. 《手册》的预测趋于乐观,但这是一年中的乐观时间。 无论如何,下面的表1中显示了一种可能的阵容。 阵容工具说,阵容每场得分5.687,162场得分921。 这是很多次的比赛,但这是因为我们假设所有九名球员都将参加162场比赛,这当然不会发生。  That's OK though. 目的只是比较不同的阵容。

表1:老虎预测阵容


玩家1:
玩家2:
玩家3:
玩家4:
玩家5:
玩家6:
玩家7:
玩家8:
玩家9:

排球工具会考虑这9个击球手的所有可能排列,并估计最佳排球得分为5.766 RPG或934分,而最差排球得分为5.502 RPG或891分。 那是43次奔跑的差额,虽然不算大,但也不是微不足道的-在4到5胜之间。

表2显示了五个最佳阵容中的四个,其中有Fielder王子率领! 实际上,前十名中有八名将Fielder排在第一位,而前三十名中的全部都有Fielder或Alex 阿维拉。 请记住,尽管这仅是击中,而不考虑Fielder和Avila所没有的速度。 对我来说,更有趣的是卡布雷拉(Cabrera)在所有前三十名阵容中的两个洞中。 这实际上是有道理的,但我可能希望某个人在他的面前至少有一点点速度(以及打基础的能力)。

您可能还会注意到,在所有“最佳”阵容列表中,奥马尔·英菲特击球手排名第九,其后依次是安迪·迪克斯,托里·亨特和琼尼·佩拉尔塔。 尽管我已经知道亨特将在吉姆·莱兰德的阵容中排名第二,但这对我来说还是不错的。  

表2:五种顶级生产阵容

5.766 守场员 卡布雷拉 杰克逊 阿维拉 马丁内斯 佩拉尔塔 猎人 德克斯 婴幼儿
5.766 阿维拉 卡布雷拉 杰克逊 守场员 马丁内斯 佩拉尔塔 猎人 德克斯 婴幼儿
5.766 守场员 卡布雷拉 杰克逊 马丁内斯 阿维拉 佩拉尔塔 猎人 德克斯 婴幼儿
5.765 守场员 卡布雷拉 马丁内斯 阿维拉 杰克逊 佩拉尔塔 猎人 德克斯 婴幼儿
5.765 守场员 卡布雷拉 杰克逊 阿维拉 马丁内斯 猎人 佩拉尔塔 德克斯 婴幼儿

表3列出了最差的阵容。 马上,您会看到第一个问题-卡布雷拉正在打击第九名 这显然永远不会发生。 尽管这些阵容很糟糕,但与最佳阵容相比,它们的跑步次数仍少于5%。 不过,我们希望获得这5%的收入,因此这些阵容不多。 
 
表3:最低的五个生产批次

5.502 佩拉尔塔 婴幼儿 杰克逊 德克斯 猎人 马丁内斯 守场员 阿维拉 卡布雷拉
5.502 德克斯 婴幼儿 杰克逊 佩拉尔塔 猎人 马丁内斯 守场员 阿维拉 卡布雷拉
5.502 佩拉尔塔 婴幼儿 杰克逊 猎人 德克斯 马丁内斯 守场员 阿维拉 卡布雷拉
5.503 佩拉尔塔 婴幼儿 杰克逊 德克斯 猎人 守场员 马丁内斯 阿维拉 卡布雷拉
5.503 德克斯 婴幼儿 杰克逊 佩拉尔塔 猎人 守场员 马丁内斯 阿维拉 卡布雷拉


怀疑有没有哪位经理能带上Fielder或Avila bat领先,但假设我们先是Jackson紧随其后,然后是Cabrera,这个想法对我很有吸引力。 倒数第四的是德克,亨特,因凡特和佩拉尔塔。 菲尔德,马丁内斯和阿维拉将以某种顺序击打3-4-5。 我尝试了各种组合,并提出了表4中的组合。 与表1的阵容相比,这项得分将达到930杆,多跑9杆或胜1杆。 这可能不值得让Cabrera击球第二而引起的轩然大波,但是我在理论上喜欢它。 

表4:  One More Line-up


玩家1:
玩家2:
玩家3:
玩家4:
玩家5:
玩家6:
玩家7:
玩家8:
玩家9:

2013年2月17日,星期日

将棒球场效果纳入战争

超越胜利(WAR)框架中最容易被误解的要素之一就是球场因素。 大多数球迷意识到,极限公园如科罗拉多州的打手高兴的Coors Field和圣地亚哥的投手友好的PETCO公园往往会对在那里打球的运动员的生产产生重大影响。 但是,有些人不了解如何在WAR中使用棒球场效果。 人们理解用于测量棒球场效应的复杂公式并不重要。 他们了解平衡因素的目的更为关键,但有些似乎有些困惑。 因此,我将在这里尝试澄清这一点。

Rockies outfielder Carlos Gonzalez and Cardinals catcher Yadier Molina and had very similar batting lines in 2012.  Gonzalez hit .303//.371/.510 with 27.2 Runs Above Average (wRAA) in 579 plate appearances (PA), while Molina batted .315/.373/.501 with 27.3 瓦拉 in 563 PA.  However, Gonzalez played half his 游戏s in Colorado's Coors Field which was the best hitters park in the majors.  On the other hand, Molina played his home 游戏s in  Busch Stadium which was more of a pitcher's park.  These different environments need to be accounted for in our evaluation.

一些粉丝说他们不喜欢球场因素,因为我们真的不知道冈萨雷斯或莫利纳在另一个公园会做什么。 实际上,冈萨雷斯在2012年的房屋/道路激进分拆(1.046 OPS对.706 OPS)表明,他可能比普通球员从Coors中受益更多。 以莫利纳为例,过去两年他实际上在家里的表现稍好,因此无法保证在更好的击球手公园打球会有所帮助。

的确,公园可以以不同的方式影响玩家。 一个玩家的技能组合可能比另一个玩家更适合自己的家乡公园。 例如,某些公园是为左手击球手在右手击球手之上而设计的,或者是动力击球手在接触击球手之上。 在其他情况下,玩家可能只是在一个公园里比另一个公园更舒适。 如果我们对玩家将来在给定公园中的表演能力感兴趣,这些因素都将非常重要。

但是,WAR并非旨在确定玩家在其他公园玩游戏的能力或潜力。 在计算WAR时,如果冈萨雷斯被交易到红衣主教或更改了Coors的尺寸,他会做什么。 战争与玩家的能力或天赋无关。 WAR的目的是评估玩家对其团队的价值。

感兴趣的问题是Coors vs Busch的跑步价值多少? 由于在Coors中得分比在Busch中得分更容易,因此在Colorado得分比在St. Louis得分没有价值。 换句话说,普通玩家在Coors中的奔跑贡献要比在Busch中贡献更多,因此洛基山脉的击球手需要产生更多的奔跑才能具有与红雀队的击球手相同的价值。

同样,像胡安·皮埃尔(Juan Pierre)这样的球员是否没有从科罗拉多打球中受益也没关系。 如果他为落基山脉队效力,那么他需要将其价值下调(就像其他任何球员一样),因为Coors的高得分环境会降低他贡献的奔跑价值。 

球场因素的计算很复杂。  A 详细说明 可以在Toirtap的sabermetrics网站上找到。 这也是FanGraphs使用的方法。 简而言之,五年的家庭和道路运行得分数据可用于计算公园效果。 如果公园是新建的或在五年内进行了翻新,则使用的时间较短。

已经确定,在Coors Field中跑步比在中立公园中容易得分26%。 一位落基山脉的击球手在库尔斯(Coors)玩一半的比赛,在一半平均水平接近中性的公园组合中玩一半(由于时间安排不平衡,在每种情况下都不是很正确,但是我们在这里保持简单)。 因此,与亚特兰大的特纳菲尔德(Turner Field)这样的中立公园相比,落基山脉的平均跑步价值要低13%。

鉴于上述情况,我们说落基山脉球场因子(BPF)为113。 中立公园的BPF为100。 对投手最友好的公园是PETCO,BPF为92。  See the FanGraphs胆量 部分中列出了所有按年列出的影响因素。

回到开头的示例,请记住,冈萨雷斯在579 PA处的wRAA为27.2,而在563 PA的Molina为27.3 瓦拉。 现在,让我们计算其调整后的运行值: 

2012年,每个PA的平均玩家创造了.114跑步,因此他会 在中立公园的579 PA中创建的估算行径为.114 x 579 = 66.0。如果他的主场是Coors,则同一位玩家将有66.0 x 113/100 = 74.6击球跑。 因此,冈萨雷斯的价值减少了74.6-66.0 = 8.6列。冈萨雷斯在2012年的wRAA为27.2,因此他调整后的打击值变成27.2-8.6 = 18.6。 

在中立的公园中,一个普通的玩家会创造出.114 x 563 = 64.2的成绩。 使用97的Busch Stadium BPF,该球员会为圣路易斯创造64.2 x 97/100 = 62.3的奔跑。 所以,莫利纳的价值是 增加 乘以64.2-2.3 = 1.9。 因此,他的球场调整后的击球值为27.3 + 1.9 = 29.2。 修正球场后,冈萨雷斯和莫利纳不再看起来像是一个击球手。 相反,莫利纳(Molina)以29.2比18.6领先。

2013年2月11日,星期一

佩科塔可比

棒球章程已发布其球员经验比较和优化测试算法(佩科塔) 2013年的预测。 PECOTA是一个复杂的投影系统 由Nate Silver创建,最近由Colin Wyers改进。  It uses 统计数据和特征(年龄,身高,体重,位置) 给定玩家以及类似玩家的统计和特征 得出那个球员的预测。

访问数据需要订阅,所以我不能透露太多, 但我会给你看一些球员。 而不是给你 统计预测,我将介绍哪些球员 被认为是与老虎玩家最接近的比较。  These comparisons 很有趣,但可能不应该那么认真。 

尼克·卡斯特拉诺斯(Nick Castellanos)

Aramis Ramirez Brooks Robinson凯文·贝尔

像大多数投影系统一样,PECOTA也不相信Castellanos已经为专业做好了准备,但是Ramirez是将来考虑的不错的比较。 鲁滨逊没有多大意义,因为卡斯泰拉诺斯不太可能成为精英防守者,无论他身在何处。 贝尔不是我们想要考虑的比较。     

阿维赛尔·加西亚(Avisail Garcia)

克劳德尔·华盛顿·何塞·吉伦·罗伯托·克莱门特

华盛顿/吉伦和罗伯托·克莱门特之间肯定有很多基础! 我猜想加西亚会比前者更像前者。 

安迪·德克斯

Alejandro De Aza Darin Erstad Omar 婴幼儿

De Aza不太有趣,因为我们比Dirks还不知道他要去哪里。 Erstad似乎是一个合理的比较。 坏消息是,德克斯(Dirks)已经比埃斯塔德(Erstad)在他职业生涯的2000年大了27岁。 Dirks将和他的其他同级别球队(Omar 婴幼儿)一起踢同一支球队。 顺便说一句,PECOTA非常喜欢Infante,他在2013年的猛虎组织WARP排名第四。 

布鲁斯·朗登

Ambrioux Burgos Matt Anderson布恩·洛根

还记得马特·安德森(Matt Anderson)吗? Rondon / Anderson协会可能是您进入2013赛季的最大恐惧。 我确实相信Rondon具有更多的能力,但要投射年轻的救助者真的很难。

德鲁·史密利(Drew Smyly)

科尔·哈默斯·约翰·丹克斯·詹姆斯·麦克唐纳


Hamels可能有太多希望。 约翰·丹克斯?也许。

菲尔德王子

Miguel 卡布雷拉 Jeff Bagwell弗兰克·托马斯

你不会错的。 

2013年2月10日,星期日

使用RE24进行情景击中的核算

许多球迷抱怨说,OPS和击球跑等统计数据无法说明情况如何。  For example, if 猛虎队的拳王菲尔特·菲尔(Prince 守场员)单打获得亚军,并获得第二名和第三名,他获得了与单打冠军相同的荣誉 the bases empty. 有人会说这是不公平的,因为他 在前一种情况下,对团队的贡献要比在后一种情况下要大。  In 在这篇文章中,我将介绍一个统计数据,说明击球手的 在不同情况下的表现。

传统粉丝喜欢 用熟悉的“击打”统计数据来解决情境击球,但这是一个团队 dependent measure.  A 玩家有多少机会参加比赛,具体取决于谁 在他面前击球。 因此,玩家会因驾驶而得到认可 本垒打,但不会因未能进行本垒打而受到处罚。  因此,RBI计数不足以衡量情节打击。

其他球迷则指出,跑步者处于得分位置时的平均击球率, 但这是基于有限数量的印版外观。  It also 不考虑淘汰次数,即特定的基本跑垒员(例如 加载的底数与仅使用第二底数的底数)或命中类型(单底, 两次,三次或本垒打)。 此外,它会忽略玩家的表现 没有跑者得分时。 

我们想要的是一种统计数据,该统计数据可让玩家为一切 他的确包括情境打击。  击球 Above 24个基本/输出状态的平均值(RE24) -在FanGraphs中找到-就是这样做的。 RE24统计数据也是 有时称为“增值”。 该指标将为玩家提供 归功于他的单打,双打和所有其他赛事,并给予他 额外的功劳来自与跑步者在基地上发生的点击。  It even gives him 大多数其他指标忽略的方案的得分-移动跑步者 在地面上。 相反,它会减去加倍的击球次数。

在最近的一篇文章中,我只是简单地讨论了 击球 或高于平均水平的加权跑步(wRAA) 估算一个球员为团队贡献的跑步次数超过了 一个普通的击球手会为他做出贡献。 RE24指标与此类似 到wRAA,除了它在 calculation. 基本/退出状态的示例是“首先是跑步者 third and one out". 有24种可能的基本/输出状态和RE24 将所有这些因素都考虑在内。

在wRAA的计算中,将一个加倍的基数加到 两场比赛的底数为空时,两次出局的得分相同(0.770分) and no outs. 相反,RE24将装载的碱基数加倍 比基数为空的两倍(2.544对0.632),因为它做得更多 增加在局中得分的预期成绩。

一个击球手的RE24度量标准为我们提供了 戏剧的开始和结束。 例如,假设Fielder蝙蝠以 亚军,先出手。在这种情况下,我们期望0.556 在比赛结束时得分。 假设菲尔德 翻倍,将奔跑者拿到第二和第三。在那里面 在这种情况下,我们预计到局结束时1.447分会得分。 因此,Fielder的双倍价值为0.891。

将RE24累加整个面糊’的板块出现使他的赛季总成绩达到RE24。对于
例如,Fielder今年的RE24为51。 因此,按照该衡量标准,他贡献了51次跑步,超出了平均击球手的水平 期望在同样的机会下做出贡献。这比他的46 瓦拉高一点,这意味着Fielder 在期望值很高的情况下尤其出色,并为他的团队增加了更多’s的总运行次数比wRAA指示的次数多。 我们可以估算出他另外贡献了5次 他的处境令人hit目结舌。

由于情境命中在很大程度上(尽管不是完全)是随机的,因此RE24的预测性不及wRAA,因此不应用作对能力的衡量。 但是,从wRAA来看过去的表现,它是一个很好的选择。

下面的表1向我们展示了2012年以前和现在的Tigers的RE24。  Other 该表中的列包括wRAA以及RE24和wRAA之间的差异 (RE24-BatRuns). 菲尔德(Fielder)是Tigers RE24的领袖,其次是Cabrera,他拥有47 RE24。 卡布雷拉(Cabrera)是wRAA的失控领袖(57),但在猛虎组织的突袭下付出了代价。造成这种情况的主要原因可能是他的双打总成绩很高。

通过情境打击增加价值的其他老虎包括Quintin 浆果(+10)和新收购的Torii 猎人(+6)。 其他倾向于在高杠杆情况下损失老虎队的击球手是Delmon 年轻(-20)和Jhonny 佩拉尔塔(-7)。 与卡布雷拉不同,这两人的整体表现也不佳。

表1:《老虎》的RE24(2012)

播放器
RE24
瓦拉
RE24-wRAA
守场员
51
46
+5
卡布雷拉
47
57
-10
猎人(LAA)
25
19
+6
杰克逊
23
28
-5
德克斯
10
15
-5
浆果
7
-3
+10
阿维拉
-1
4
-5
婴儿(DET-FLO)
-1
-2
+1
布施
-8
-11
+3
佩拉尔塔
-14
-7
-7
圣地亚哥
-16
-13
-3
拉本
-20
-18
-2
年轻
-25
-5
-20

博客存档

订阅

我的Sabermetrics书

My Sabermetrics Book
《棒球美国》 2010年十大书籍之一

其他Sabermetrics书籍

统计计数器