2008年12月19日,星期五

杰克·莫里斯(Jack 莫里斯)和得分

随着名人堂投票的临近,我认为这是重新审视杰克·莫里斯辩论的好时机。通常情况如下:

杰克·莫里斯的支持者:莫里斯(Morris)一生获得254场胜利,是1980年代最出色的投手。那应该让他进入名人堂。

杰克·莫里斯持怀疑态度:他赢得了很多比赛,因为他耐久并且效力于伟大的球队。耐力是一件好事,但并不能使他成为一个出色的投手。至于赢得十年来最多的比赛,那是一个任意时间段。成为1976年至1985年或1985年至1994年的最佳投手不再有意义。莫里斯恰好在一个方便的时期(1980-1989年)达到了巅峰时期。

支持者: 杰克是个大游戏投手。 1991年世界大赛的那10局比赛是经典。他还为老虎1984冠军队赢得了三场季后赛。他是您想要为季后赛第七场比赛投手的投手。

怀疑论者: 但是在1987年和1992年的季后赛中,他的投球表现不佳。

怀疑论者: 让我们谈谈他的一生3.90 时代。他的ERA +为105,这意味着他的职业生涯仅比联盟平均投手高5%。

支持者: 他的ERA高,因为他得分高。当他的团队取得领先时,他会滑行,并将自己最好的东西保存在紧张的比赛中。如果他像在近距离比赛中那样以大的领先优势投球,他的ERA将会低很多。

交流的最后一部分就是这篇文章的其余部分。 莫里斯(Morris)曾多次表示,他对获得胜利和深入研究游戏更感兴趣,而不是他对ERA的兴趣,他将放弃在他的团队已经取得巨大领先的比赛中的许多表现。我毫不怀疑投手根据情况的不同而有所不同,但这对他们的实际表现有多大影响?

几年前,棒球招股书中的乔·希恩(Joe Sheehan)在 “杰克莫里斯计划”。他追踪了莫里斯的职业生涯的每一局,并查看了他在不同比赛情况下的表现-并列,一杆领先,六杆领先等。乔没有发现莫里斯在近距离比赛中的投手要比获得大型领先的要好。但是他确实承认自己不确定如果他确实投了比分的话投手的表现会是什么样。

当我开始研究投球得分理论时 可能,我的目标是通过查看一大批投手,而不只是一个,来扩展Sheehan的项目。当时我的分析的局限性是我仅从1990年开始下载和准备了清单数据。因此,我将杰克·莫里斯(Jack 莫里斯)与更现代的投手而不是他的同时代人进行比较。我现在拥有的数据可以追溯到1977年,因此我可以更好地了解在莫里斯时代,比分的投球形式以及哪些投手具有这种趋势。


分析工作方式的一个示例是:如果起始投手以两连贯领先开始一局比赛,则在该局中允许的奔跑进入“上两连胜”类别。
使用样张数据库,我查看了1977年至1994年之间每个起始投手所投的每一局。结果显示在下面的表1中。

表1:MLB 时代的得分-1977-1994

最多7+

上6

上5

上4

上3

上2

上1

知识产权

458,407

11,702

7,897

12,618

19,252

29,734

44,332

67,341

时代

4.01

4.19

3.98

4.16

4.05

3.98

3.97

3.93


下降1

下降2

下降3

下降4

下降5+

知识产权

167,082

50,392

27,688

13,438

5,057

1,376

时代

3.98

3.93

4.16

4.22

4.10

4.09



该表显示,初始投手的总ERA为4.01,并且最低ERA的确确实出现在利润率很小的局中:平局中为3.98,一次运行上下时为3.93,等等。相比之下,投手具有落后大局的ERA较差:下降4时为4.10,下降5或更多时为4.09,依此类推。这应该是可以预料的,因为落后很多投手的投手一定不是在投球远在局之前,并且会继续努力前进。

更有趣的是,投手中有较大领先优势的局中的ERA也相对较高:4.05(具有四个运行线索),4.16(具有五个运行线索),等等。一个例外是3.98 时代(具有六个运行线索),但看起来只是一个刷入数据。总体趋势表明投手在近距离比赛中表现更好。

表2列出了比较近距离比赛(并列,下降一倍,上升一倍)和井喷(领先五次或更多)的投手表现的数据。我计算出的比率如下:

(近战游戏中的ERA /井喷游戏中的ERA) X 100

如果比率为100,则意味着投手在边距较小的局中的表现与在大领先度的局中的表现相同。小于100的比率表示分数接近时表现更好,而大于100的比率表示以大领先优势开始的局中ERA更好。


表2:MLB 时代-最多增加5次运行,而不是一次运行
(1977-1994)

总ip

总ERA

知识产权 up 5+次运行

时代向上运行5次以上

1次内运行IP

运行中的ERA

458,407

4.01

32,218

4.12

284,815

3.96

96



在1997-1994年期间,我们得到(3.96 / 4.12)x 100 =96。这意味着,近距离比赛中的投手比井喷情况下的投手命中率高4%。

接下来,我研究了单个投手,这就是为什么我在研究中加入了这么多年的原因。只看一年或几年的数据是行不通的,因为以五次或更多的领先优势进行的一局投掷的样本量太小了。因此,对于该部分分析,我选择了46个投手,在此期间投掷了2000或更多局。这些数据在下表3中。

并非所有投手在近距离比赛中的投球都更好。实际上,21 0f和46的井喷效果同样好或更好。比率从Ron 宠儿的59(更好的情况下提高41%)到Jerry 罗伊斯的140(更好的情况下提高40%)不等。这使我们对投手得分的投手的表现有一些了解-可能更像达令而不是罗伊斯


杰克·莫里斯(Jack 莫里斯)的比率为91,这表明他在近距离比赛中比在领先优势大的游戏中高9%。这比联盟平均水平要好,但也并不罕见-在46个投手中排名第12。如果莫里斯在井喷中的投掷与在近距离比赛中的投掷一样,该怎么办?好吧,他本该放弃少跑12次,职业生涯ERA为3.87,而不是3.90。这几乎不是一个令人震惊的差异。

表3:单个投手ERA-上5步而不是1步

第一

持续

总ip

总ERA

知识产权 up 5+次运行

时代向上运行5次以上

1次内运行IP

运行中的ERA

罗恩

宠儿

2,219

3.76

122

6.11

1,401

3.61

59

法案

古利克森

2,544

3.91

208

5.58

1,519

3.57

64

标记

兰斯顿

2,442

3.74

134

5.05

1,502

3.49

69

坦率

中提琴

2,791

3.67

189

4.86

1,707

3.41

70

汤米

约翰

2,300

3.71

176

4.90

1,350

3.51

72

里克

苏克利夫

2,565

4.10

203

5.13

1,466

4.00

78

罗恩

吉德里

2,302

3.30

219

3.99

1,294

3.12

78

里克

罗敦

2,276

3.68

163

4.13

1,410

3.52

85

大卫

斯图尔特

2,238

3.85

144

4.44

1,299

3.87

87

鲍勃

福施

2,148

3.84

182

4.11

1,298

3.61

88

麦克风

克鲁科夫

2,164

3.90

138

4.25

1,386

3.84

90

插口

莫里斯

3,746

3.90

320

4.11

2,178

3.76

91

费尔南多

瓦伦苏埃拉

2,417

3.42

149

3.50

1,510

3.19

91

坦率

塔纳那

3,308

3.91

305

4.39

1,952

4.02

92

丹尼斯

埃克斯利

2,121

3.81

160

4.16

1,277

3.86

93

麦克风

摩尔

2,687

4.25

161

4.59

1,639

4.27

93

史蒂夫

卡尔顿

2,488

3.30

251

3.19

1,510

2.99

94

布雷特

沙伯哈根

2,004

3.20

143

3.41

1,239

3.23

95

道尔

亚力山大

2,493

3.88

177

3.91

1,577

3.73

96

凯文

2,001

3.96

133

4.06

1,250

3.90

96

丹尼斯

马丁内斯

3,341

3.59

244

3.77

2,006

3.63

96

汤姆

西弗

2,062

3.37

162

3.49

1,252

3.38

97

里克

罗舍尔

2,417

3.28

167

3.35

1,535

3.31

99

吉米

2,032

3.34

200

3.51

1,230

3.48

99

萨顿

2,465

3.52

157

3.50

1,525

3.48

99

Niekro

2,269

3.51

206

3.53

1,381

3.56

101

奥勒尔

赫希瑟

2,089

2.99

159

2.89

1,288

2.92

101

史考特

桑德森

2,380

3.84

171

3.78

1,452

3.86

102

查理

ough

2,999

3.82

185

3.79

1,797

3.90

103

罗杰

克莱门斯

2,391

2.94

203

2.88

1,368

2.97

103

弗洛伊德

栏干

2,298

4.04

143

4.09

1,416

4.24

104

麦克风

威特

2,021

3.89

189

3.62

1,196

3.84

106

鲍勃

韦尔奇

3,013

3.45

173

3.17

1,918

3.38

107

麦克风

博迪克

2,041

3.81

172

3.41

1,198

3.64

107

麦克风

弗拉纳根

2,537

3.89

197

3.65

1,608

3.96

108

鲍勃

克内珀

2,611

3.71

151

3.33

1,616

3.62

109

吉姆

克兰西

2,373

4.19

167

4.00

1,473

4.37

109

麦克风

史考特

2,026

3.53

119

3.09

1,342

3.43

111

德怀特

古登

2,163

3.10

187

2.69

1,328

3.01

112

菲尔

Niekro

2,626

3.76

206

3.27

1,555

3.84

118

大卫

施蒂布

2,809

3.42

191

3.02

1,746

3.56

118

布鲁斯

赫斯特

2,371

3.83

228

3.20

1,459

3.79

118

伯特

布莱尔文

3,055

3.63

268

3.02

1,778

3.73

123

史考特

麦格雷戈

2,003

3.99

188

3.02

1,199

4.11

136

诺兰

瑞安

3,451

3.24

203

2.35

2,177

3.26

139

杰瑞

罗伊斯

2,032

3.58

126

2.50

1,210

3.51

140



现在,让我们尝试不同的条件来获得更大的领先优势-连续运行4次或更多。表4中显示了1977-1994年的主要联赛结果。投手在近距离比赛(3.96 时代)中的投手比领先四分或以上(4.10)的投手高出3%。

表4:MLB 时代-进行四次测试,而不是一次测试

知识产权 up 4+次运行

时代向上运行4次以上

1次内运行IP

运行中的ERA

51,469

4.10

284,815

3.96

97



表5列出了各个投手,并显示杰克·莫里斯在领先的游戏中拥有3.92 时代。这样的比率为96,在46个投手中排名第23。因此,就此而言,杰克在投篮得分方面处于联盟平均水平附近。

表5:单个投手ERA-上四轮而不是一轮

第一

持续

总ip

总ERA

ip_up4_

era_up4_

1次内运行IP

运行中的ERA

比4

罗恩

宠儿

2,219

3.76

214

5.37

1,401

3.61

67

法案

古利克森

2,544

3.91

351

4.85

1,519

3.57

74

汤米

约翰

2,300

3.71

278

4.76

1,350

3.51

74

坦率

中提琴

2,791

3.67

329

4.30

1,707

3.41

79

标记

兰斯顿

2,442

3.74

236

4.35

1,502

3.49

80

丹尼斯

马丁内斯

3,341

3.59

389

4.47

2,006

3.63

81

费尔南多

瓦伦苏埃拉

2,417

3.42

253

3.88

1,510

3.19

82

凯文

2,001

3.96

210

4.58

1,250

3.90

85

鲍勃

福施

2,148

3.84

277

4.20

1,298

3.61

86

里克

苏克利夫

2,565

4.10

343

4.61

1,466

4.00

87

罗恩

吉德里

2,302

3.30

346

3.59

1,294

3.12

87

麦克风

克鲁科夫

2,164

3.90

224

4.38

1,386

3.84

88

大卫

斯图尔特

2,238

3.85

267

4.35

1,299

3.87

89

麦克风

史考特

2,026

3.53

201

3.72

1,342

3.43

92

里克

罗敦

2,276

3.68

268

3.79

1,410

3.52

93

里克

罗舍尔

2,417

3.28

240

3.56

1,535

3.31

93

德怀特

古登

2,163

3.10

285

3.19

1,328

3.01

94

史考特

桑德森

2,380

3.84

289

4.08

1,452

3.86

95

麦克风

摩尔

2,687

4.25

277

4.51

1,639

4.27

95

布雷特

沙伯哈根

2,004

3.20

235

3.41

1,239

3.23

95

萨顿

2,465

3.52

290

3.66

1,525

3.48

95

道尔

亚力山大

2,493

3.88

297

3.91

1,577

3.73

95

插口

莫里斯

3,746

3.90

507

3.92

2,178

3.76

96

吉姆

克兰西

2,373

4.19

237

4.51

1,473

4.37

97

鲍勃

克内珀

2,611

3.71

279

3.68

1,616

3.62

98

坦率

塔纳那

3,308

3.91

450

4.08

1,952

4.02

99

Niekro

2,269

3.51

289

3.58

1,381

3.56

99

吉米

2,032

3.34

284

3.49

1,230

3.48

100

史蒂夫

卡尔顿

2,488

3.30

374

2.98

1,510

2.99

100

布鲁斯

赫斯特

2,371

3.83

306

3.71

1,459

3.79

102

弗洛伊德

栏干

2,298

4.04

244

4.13

1,416

4.24

103

奥勒尔

赫希瑟

2,089

2.99

229

2.83

1,288

2.92

103

丹尼斯

埃克斯利

2,121

3.81

262

3.71

1,277

3.86

104

麦克风

威特

2,021

3.89

259

3.68

1,196

3.84

104

史考特

麦格雷戈

2,003

3.99

298

3.93

1,199

4.11

105

查理

ough

2,999

3.82

336

3.69

1,797

3.90

106

罗杰

克莱门斯

2,391

2.94

358

2.79

1,368

2.97

107

麦克风

博迪克

2,041

3.81

277

3.42

1,198

3.64

107

汤姆

西弗

2,062

3.37

256

3.13

1,252

3.38

108

菲尔

Niekro

2,626

3.76

298

3.54

1,555

3.84

109

鲍勃

韦尔奇

3,013

3.45

299

3.04

1,918

3.38

111

麦克风

弗拉纳根

2,537

3.89

318

3.54

1,608

3.96

112

诺兰

瑞安

3,451

3.24

329

2.65

2,177

3.26

123

杰瑞

罗伊斯

2,032

3.58

234

2.81

1,210

3.51

125

伯特

布莱尔文

3,055

3.63

402

2.98

1,778

3.73

125

大卫

施蒂布

2,809

3.42

313

2.59

1,746

3.56

137



对于那些需要更多说服力的人,我尝试了另外一个截止点-3次或更多次。表6显示,大联盟投手经过三轮或以上跑步时的ERA为4.05。那就是98的比率。我已经有太多桌子了,所以我不会再增加一个大桌子了,但是莫里斯在798局中拥有4.03 时代,他领先三局甚至更多。结果是96的比率,在46个投手中排名第16。

如果莫里斯在那798局比赛中的投掷方式与他在近距离比赛中的投掷方式相同,那么他将减少23次奔跑,职业生涯ERA为3.85。同样,与3.90并没有根本性差异。

表6:MLB 时代-最多运行3次,而一次运行不超过

知识产权 up 3+次运行

时代向上运行3次以上

1次内运行IP

运行中的ERA

81,204

4.05

284,815

3.96

98



总而言之,典型的投手在近距离比赛中的投篮要比领先优势大。就是说,投手确实有倾向得分的倾向。有证据表明,杰克·莫里斯的得分比典型的投手高出一点,但他在这方面并不出色。他与Ron 宠儿,Bill 古利克森和Tommy 约翰这样的投手相距甚远,他们的大领先率比近距离比赛高25%-40%。也没有证据表明,如果莫里斯不按比例投入,他的职业生涯ERA会好得多。
The information used here was obtained free of charge from and is copyrighted by
回顾表. Interested parties may contact 回顾表 在 "www.retrosheet.org".

10条评论:

  1. 爱你的工作。感谢您的所有努力。我有一个题外话的问题。您是否计划今年再次对所有不同的防守指标进行平均?如果是这样,我们什么时候可以看到它?我最近两年非常喜欢它,希望您计划继续进行并完善它。

    回复删除
  2. 是的,我打算这样做。我目前正在收集数据,然后需要将其合并。合并是最耗时的部分,因为不同的数据库使用不同的播放器名称。我将从一月份的某个时间开始发布结果。

    今年的主要改进是,现在可以在扇形图上完全获得UZR数据。去年,我只能包括领导者和预告片。

    背风处

    回复删除
  3. 我当时在想,Sheehan在几周前的新闻中对HOF选票进行了研究,但我不知道该在哪里找到它。感谢您的答复,并与其他所有初学者进行比较,将其提升到一个新的水平。

    我想知道WHIP是否可能是“得分高”的良好测试?如果您有很大的优势,只是投快球进行罢工,也许您会放弃更多的跑垒员,但不会显着增加跑垒次数。但是,请耐心等待,如果您不打算拐弯抹角,您应该放弃更少的BB。也许您的BB / 9领先优势实际上下降了,但您的BA却反而上升了?我现在必须停止思考。

    回复删除
  4. 谢谢!我期待阅读它们。

    顺便说一句,我了解Fangraphs上的UZR是使用BIPS数据而不是STATS数据。我认为STATS数据仍然存在UZR,我只是不知道在哪里或如何找到它们。如果您可以同时访问这两者,我将对这两个如何比较感兴趣。当然,如果您同时访问BIPS UZR和STATS UZR,我当然希望它们都包含在分析中。

    再次感谢您的辛勤工作。我认为,更好地了解我们都非常喜欢的MLB球员的防守能力确实具有真正的价值。

    回复删除
  5. 这项研究的问题在于,联赛/公园/公园等更有可能发生更大的跑分差异。跑步得分更常见的地方。 (在以后的一局中,当起始投手通常也不会投球时,它也更有可能面临高分差。)您必须比较一个投手在那年,那个联赛中以及那个公园中允许的跑分与奔跑差额相比,他如何放弃奔跑。

    回复删除
  6. 查尔斯很好。步行率和三振出手率将是下一步的不错选择。

    科林,尽管您的观点可能会超出我的工作范围,但我也会牢记您的观点。我不能一辈子den毁我的儿时英雄之一。 :-)

    背风处

    回复删除
  7. 同理科林说的话。您必须控制停放,局限和常规跑步环境,以确定所有投手是否都可以分组得分。

    我猜想一旦您这样做,大多数差异将消失。我也认为在某种程度上所有投手都可以得分。当您在大量奔跑中上下运动时,为什么要消耗大量精力或受伤?

    而且,如果您的跑步次数很多,那么您的音高也会有所不同,这样您就可以避免大局而牺牲一些跑步次数(您的ERA稍微提高,但差异会缩小)。

    另一方面,您不会期望“得分高低”是对称的。您会期望,当一个投手的队伍上升很多时,他的ERA会上升,但是当下降很多次运行时,它实际上应该下降,这与分数接近时类似。我们看到了很多对称性(当运行时向上或向下运行时,ERA会爬升)的事实表明,正在进行的其他事情不在投手的控制范围之内,例如运行环境。

    即使我们发现投手总体上倾向于或不倾向于得分,看单个投手(如莫里斯)有什么意义?

    一方面,它可能有助于我们协调ERA与赢/输记录。赢/输记录主要取决于以下四个方面:投手能否投进分数以及投多少分,球队的进攻,每场比赛投出多少IP以及他的钢笔。 (当然还有随机波动。)

    如果一个投手的w / l记录与他的ERA不一致,即使考虑到他的球队的进攻(rpg)并且我们发现他确实比平均投手的得分更高,那么我们可以合理地认为他是MVP或HOF类型的评估。如果事实证明他并没有超过平均投手的得分,并且我们已经考虑了他的奔跑支持,那么很有可能发生其他他无法控制的事情,例如随机变异或牛棚。

    因此,我想知道像莫里斯这样的投手是否比平均发球手更好或更差,这尤其有帮助,特别是如果有人声称自己做到了或没有。

    现在,仅仅因为我们发现莫里斯或其他任何人比平均投手更多或更少没有投分,或者仅仅因为我们展示了一个有趣的点差分布或范围,就像李在本博文中所做的那样,但这并不意味着它是一项技能。无论绩效考核中是否包含技能要素,您都会在任何绩效考核中发现变化(如果涉及到技能,我应该添加相对于该技能而言是否是真正的才能传播)。

    这将是接下来有趣的步骤之一-拿一张类似Lee生成的清单,并查看分配是否与偶然期望的分配有显着差异,或者查看单个玩家的“比率”在一个时间段到第二个时间段之间是否持续(相关)。另一个。

    与大多数这些事情一样,我想即使对于每个观测使用相当大的数据样本(如每年),也几乎没有相关性。

    MGL

    回复删除
  8. MGL,感谢您的长期批评。你所说的一切都说得通。我只有一点不同意。对于首发投手,我认为当他们落后很多时,您不会期望ERA下降。如果一个投手落后很多,那可能意味着他那天的投球表现不佳,可能会继续遇到问题。

    回复删除
  9. 我很喜欢读这篇。像其他读者一样,我对对称性感到惊讶。

    不好意思进一步混淆,但让我持怀疑态度。

    假设作为经理,我的投手日子过得好或不好。如果行程差很大,我可能会将投手放在那儿,以便在需要时将笔停下来。在封闭游戏中,无论笔的形状如何,我都可能会更换投手。因此,投手可能只有在状态良好(低ERA)时才在近距离比赛中投球。

    回复删除
  10. 杰夫,我同意牛棚管理也可以在其中发挥作用。变量太多了。我确实认为我将在几周后再次尝试进行此操作,以控制运行环境和局限性,并查看获得什么样的结果。

    回复删除

博客存档

订阅

我的Sabermetrics书

My Sabermetrics Book
《棒球美国》 2010年十大书籍之一

其他Sabermetrics书籍

统计计数器