2012年8月27日,星期一

三振出局和Z得分

(警告:此职位将比我平时的职位更加数学化,但Mike Rogers和希望其他人希望看到它)

在昨天关于Max Scherzer的帖子中,我列出了在游戏历史上得分最高的K9 +投手(相对于联盟平均水平的九局淘汰率)。 K9 +统计资料类似于OPS +或ERA +,只是用于投手三振。 事实证明,1920年代和30年代布鲁克林道奇投掷手Dazzy 万斯在有史以来排名前七的K9 +中有五成占据了榜首。 迈克·罗杰斯(Mike Rogers),您可能在《保佑男孩》和《超越盒子比分》等地方认识过, 在评论中指出,比尔·佩蒂(Bill Petti)前段时间在 粉丝图.

佩蒂先生使用三振出手率或K%(投手面临的击球手造成三振出手的百分比),而不是每九局三振出手作为基数。然后,他计算了K%+(相对于联盟平均水平的三振出局百分比),还发现万斯(Vance)占据了排行榜的首位。 FanGraphs的许多评论者建议他尝试计算一种称为Z分数的东西,以比较不同年份的投手。 我不确定他或其他人是否可以解决这个问题,但是我找不到它,因此我将在这里尝试。

总的来说,当尝试相对于联盟平均值对不同时代的球员进行排名时,早期时代的最佳球员往往会比现代时代的球员表现更好。 当然,在确实好一些的情况下,这是可以的,但在许多情况下,它们获得了不公平的优势。 随着时间的流逝,明星球员的素质似乎下降,实际上通常是人才流失的减少。 在游戏初期,可以真正玩得很好的玩家比例相对较小。 因此,这些玩家比普通玩家领先。

在更现代的时代,吸引了更多的玩家(主要是由于非裔美国人,拉丁裔和亚洲人的融合),并且更多的玩家已经学会了如何玩得好。 因此,最好的球员并不比普通球员领先。 换句话说,最好的球员并没有变得更糟,而是普通的球员正在变得更好。

为了适应随着时间的推移而逐渐缩小的人才分布,我们使用标准差。 标准偏差是针对特定统计量的数字分布的度量。 如果K%在给定年份的每个投手之间变化很大,则将有很大的标准偏差。 如果给定年份中所有投手的K%均接近平均水平,则标准偏差很小。

查看数据可以发现,最近几年标准偏差实际上更高,但这是因为删除线百分比更高。 变异系数(相对于平均值的标准偏差)较低,这将使我们的结果有所不同。

z分数的计算方式为(k%联盟k%)/ k%的标准偏差。 这将使我们了解到,根据天赋的调整,哪些球员在联赛中的统治地位最高。

下表1显示了游戏历史上排名靠前的Z评分。万斯仍然在榜首附近名列前茅,但随着佩德罗·马丁内斯和兰迪·约翰逊的排名上升,他现在拥有更多的公司。 这三个投手在名单上排名前11位。

表1:单赛季三振出局率的历史最高百分比

播放器
球队
知识产权
K
k%
K%+
Z分数
佩德罗 马丁内斯
1999
BOS
213.3
313
37.5
248
5.52
令人眼花azz乱 万斯
1924
BRO
308.3
262
21.5
297
5.38
佩德罗 马丁内斯
2000
BOS
217.0
284
34.8
229
5.14
令人眼花azz乱 万斯
1925
BRO
265.3
221
20.3
282
4.83
兰迪 约翰逊
1995
214.3
294
33.9
230
4.64
令人眼花azz乱 万斯
1926
BRO
169.0
140
19.6
273
4.56
兰迪 约翰逊
1997
213.0
291
34.2
221
4.50
兰迪 约翰逊
2001
ARI
249.7
372
37.4
216
4.37
令人眼花azz乱 万斯
1923
BRO
280.3
197
16.6
233
4.33
兰迪 约翰逊
2000
ARI
248.7
347
34.7
210
4.27
兰迪 约翰逊
1999
ARI
271.7
364
33.7
210
4.25
诺兰 瑞安
1987
OU
211.7
270
30.9
206
4.15
德怀特 古登
1984
纽约
218.0
276
31.4
218
4.05
诺兰 瑞安
1976
CAL
284.3
327
27.3
227
4.02
诺兰 瑞安
1978
CAL
234.7
260
25.8
224
4.01
强尼 范德·梅尔
1941
CIN
226.3
202
21.4
230
4.01
诺兰 瑞安
1989
特克斯
239.3
301
30.5
227
3.99
鲁贝 瓦德尔
1903
PHA
324.0
302
23.1
223
3.96
兰迪·约翰逊(Randy 约翰逊)
1993
255.3
308
29.5
206
3.95
佩德罗 马丁内斯
2002
BOS
199.3
239
30.4
197
3.95
数据源: Baseball-Databank.org

表2显示了Tigers三振出局百分比Z得分榜首。 哈尔·纽豪斯(Hal 纽豪斯)的1946赛季位居榜首,其次是1969年的米奇·洛里奇(Mickey 萝莉)。 我不知道2012年的确切标准差,但如果我们使用近年来的标准差,则Scherzer的z得分约为2.61。


表2:老虎单赛季三振出局百分比 

播放器
知识产权
K
k%
K%+
Z分数
哈尔 纽豪斯
1946
292.7
275
23.4
207
3.25
米奇 萝莉
1969
280.7
271
23.1
158
2.71
哈尔 纽豪斯
1945
313.3
212
16.8
188
2.69
哈尔 纽豪斯
1943
195.7
144
16.9
178
2.56
贾斯汀 维兰德
2009
240.0
269
27.4
163
2.40
吉姆 邦宁
1959
249.7
201
19.4
153
2.33
西尔 约翰逊
1923
176.3
93
12.7
168
2.28
汤米 桥梁
1943
191.7
124
16.0
168
2.24
波波新闻报
1941
250.3
175
15.5
168
2.20
波波 新闻新闻
1939
246.0
164
15.6
171
2.12
数据源: Baseball-Databank.org

Scherzer的赛季结束后,我将尝试更新此表。 我还计划在有时间时用其他一些投球和击球统计数据来做同样的事情。  

1条评论:

  1. 干得好,李。这正是我希望比尔在FG所做的,但他从未做到。一世'我很高兴你能做到这一点,因为我没有'没有数据库,所以收集所有这些数据将'我很烂。做得好。这是我最喜欢阅读的东西。

    回复删除

博客存档

订阅

我的Sabermetrics书

My Sabermetrics Book
《棒球美国》 2010年十大书籍之一

其他Sabermetrics书籍

统计计数器