2007年12月29日,星期六

将区域等级转换为有用的东西

在我的2007年实地分析的第1部分中,我对测距仪和区域等级进行了排名。 既然可以使用更复杂的度量,则范围因子就没有那么有用了。 区域评级仍然被认为是更好的措施之一,’全年也很方便。在这篇文章中,我将解释如何将“区域等级”转换成比百分比更有用的内容。 整个领域系列的目录如下所示:

基本实地统计
将区域评级转换为有用的东西
修订的区域等级
范围的概率模型
守门圣经
最终区域评分
风机现场调查与范围测量
外场武器
排名第二垒手
排名游击手
排名第三垒手
排名第一垒手
排名中场
对合适的守场员进行排名
排名左外野手
捕手呢?

如果我们可以将ZR从某个百分比更改为诸如高于平均水平的比赛或节省高于平均水平的比赛,那将是很好的。没有STATS的实际Ball In In Zone数据,我们无法精确地做到这一点,但是我们可以获得估计值。 克里斯·迪尔他为《棒球智囊团》撰写文章,并可以访问一些用于计算ZR的数据,他开发了一种获取此类估算值的方法。

Dial会利用每个位置的平均机会和球员的区域等级来计算球员的出场次数,并将其与具有ZR联盟平均水平的球员会出场的次数进行比较。结果就是“平均水平以上的表现(PMAA)”。他还估计了每个位置球在比赛中的大概跑动值。发现了他的运行价值方法 这里。您会注意到,尽管它因位置而异,但多进行一次打球平均需要0.8趟。 汤姆·探戈 在他的博客上更直观地说明了这一点。 由此,他确定所保存的奔跑次数超出了其所在位置(RSAA)的平均玩家的总和。

下表显示了2007年Tigers球员的ZR,PMAA和RSAA(曾在2007年加入球队的球员以及那些在本休赛期被收购的球员)。 PMAA / 150是PMAA按比例分配的150场比赛。 RSAA / 150 = RSAA按比例进行了150场比赛。 PMAA / 150和RSAA / 150使我们可以更好地比较具有不同游戏数量的玩家。最后一列显示了每个玩家在RSAA / 150上的排名。由于游戏的调整,这可能与ZR等级略有不同。

我将以雅克·琼斯为例。琼斯在2007年担任645局比赛,作为中场得分手的区域评分为.904。考虑到他的上场时间,他的得分比中场得分手高出5倍。这样算来,有4场比赛的成绩超过了平均中场得分。如果我们假设在150场比赛中保持相同水平的表现,那么琼斯本来会比平均水平取得11场比赛,而比平均水平节省9次。

2007年每150场比赛节省的比赛中领先的老虎有:布兰登·英格(12),柯蒂斯·格兰德森(10),马格里奥·奥多涅斯(10)和肖恩·凯西(8)。唯一低于平均水平的老虎是卡洛斯·吉伦(Carlos 吉伦),其RSAA / 150为-7。新收购的雅克·琼斯(Jacques 琼斯)比平均水平高出9分。但是,米格尔·卡布雷拉(-16)和埃德加·伦特里亚(-9)低于平均水平。根据这一统计数据,老虎在休赛期似乎没有帮助他们的防守。

替换级别洋基博客 现在包括区域评分数据库,该数据库具有区域评分以及1987-2007年期间所有玩家保存的跑分以上的转换。只需转到左侧边栏,您将看到指向数据库的链接。


表1:Tigers外场手制作和保存的剧本-2007

销售点

#

播放器

ZR

PMAA

RSAA

PMAA / 150

RSAA / 150

RSAA / 150排名

1B

29

凯西

989.0

.886

7

6

10

8

7

2B

28

波兰科

1209.0

.828

5

4

5

4

11

3B

27

英格

1310.2

.803

15

12

15

12

4

3B

27

卡布雷拉

1311.2

.714

-20

-16

-20

-16

25

SS

30

吉伦

1074.0

.807

-7

-5

-9

-7

20

SS

30

伦特里亚

1019.1

.800

-9

-7

-12

-9

23

如果

27

门罗

806.2

.882

5

4

9

7

10

碳纤维

27

格兰德森

1285.0

.908

12

10

12

10

4

碳纤维

27

琼斯

645.0

.904

5

4

11

9

6

射频

28

奥多涅兹

1221.0

.908

11

9

12

10

2

2007年12月27日,星期四

基本战绩-2007

今天的文章是系列文章中的第一篇,这些文章探讨了老虎队和2007年其余棒球的个人外勤统计数据。 比起击球或什至投球来衡量比赛更加困难,因此我将在接下来的几周中讨论几种不同的选择。 我将从最基本的字段统计开始,然后逐步发展到更复杂的现代方法。 最后,我将通过汇总所有统计信息对每个位置的球员进行排名。 今天我’将简要介绍统计数据,并讨论最常用的度量。 之后,我’将显示老虎在这些措施上的排名。 在以后的帖子中,我’将讨论一些较新的野外测量方法。该系列的目录如下:

基本实地统计
将区域评级转换为有用的东西
修订的区域等级
范围的概率模型
守门圣经
最终区域评分
风机现场调查与范围测量
外场武器
排名第二垒手
排名游击手
排名第三垒手
排名第一垒手
排名中场
对合适的守场员进行排名
排名左外野手
捕手呢?

最常报告的野外测量是 实地百分比 (FPCT),这是守门员在他们到达的球上犯错误的频率低。计算为(总播放次数–错误)/总播放次数。不犯错误是一件很积极的事情,因此此统计信息虽然有价值,但也存在一些重要的缺陷。首先,错误是主观的,判断从一个官方得分手到另一个得分手都不同。

更重要的是,FPCT没有提及范围。一些球员得到很多其他球员无法达到的球。范围的测量是sabermetrics仍在发展的领域。下面讨论了两个最易于访问的范围统计信息,即范围系数(RF)和区域等级(ZR)。

范围系数(RF) 棒球作家阿尔·赖特(Al Wright)于1870年代起源,但直到100年左右,比尔·詹姆斯(Bill James)才重新引入它已有100多年的历史。 射频的局限性之一是它是依赖团队的统计信息。例如,在主要有地面球的工作人员后面打球的外场手比在拥有很多飞球投手的工作人员中的外场手机会少。同样,如果一个团队的所有投手击球手都受到打击,他们的射程因素也会受到影响。

区域等级(ZR) 由John Dewan在他工作时开发的 STATS,Inc 在1990年代初期。他们将棒球场划分为小区域,并按以下方式将这些区域分配给守场员:根据击中位置数据,如果击中某个区域的一半球被他所有球员在给定位置转换为出球,则认为该区域成为该位置区域的一部分。例如,如果1,000个球被击中X区域,而506被棒球的游击手转换为出球,则X区域被视为游击手位置区域的一部分。

给定玩家的ZR的计算考虑了三个因素:在比赛中击中其区域的球数(Balls In Zone或BIZ),他转换为出局的这些球数(Zone或PIZ中的游戏数) )以及他在自己所在区域(区域或OOZ以外)进行的比赛次数。 ZR计算如下:

ZR =(PIZ + OOZ)/(BIZ + OOZ)。

因此,ZR可以看作是球员在其区域内将球转换成出场的球的百分比,再加上他在区域外进行的成功比赛所获得的额外功劳。由于“区域等级评定”将球员误认为是错失机会而对他们进行处罚,因此FPCT几乎已经过时。

区域分级的问题之一是,它取决于收集数据的人员的可靠性。他们需要判断是否确实将球击中了该区域,并区分飞球和直线驱动器,因为每个区域都有一个不同的区域。 区域评级的另一个缺点是,即使可能很难到达区域内的某些球,也要以相同的方式处理区域内的所有球。

表格1 显示老虎守卫者(2007老虎队和最近的收购)在2007年有600局或更多局的球员中在FPCT,RF和ZR上的排名。 守门员百分比并没有告诉我们很多有关守门员表现的信息,但已包含在表格中以显示其在评价守门员方面的欺骗性。 距离系数和区域等级之间的差异,两个应该用来衡量同一事物的统计数据,告诉我们它们并不完全可靠。区域等级被认为更可靠,因为它与团队无关。实际上,测距学家已经很少使用距离系数了。

下表以柯蒂斯·格兰德森(Curtis 格兰德森)为例,告诉我们:2007年有27名美国职业棒球大联盟中场球员打了600局或更多的比赛。格兰德森的.PCT得分为.989,在棒球比赛中排名第14。他的3.04 射频意味着他平均每场比赛有3场比赛。根据该统计数据,他在棒球比赛中排名第二。他的ZR为.908,表示他将自己所在区域的90.8%的球转换为出球(包括他在自己区域外打的球的额外功劳)。在这一指标上,他在专业中排名第四。

肖恩·凯西(Sean 凯西)在区域评分方面表现出色,其中在专业领域排名第七。请注意,射程测量可能不会像其他守场员那样告诉我们有关一垒手的信息,因为它们不能解决从内野手那里获得的投掷,这显然是一垒手工作的重要组成部分。

在ZR上排名靠前的其他人是三垒手布兰登·英格(Brandon 英格)(专业排名第四),中场前锋雅克·琼斯(Jacque 琼斯)(第六名)和马格里奥·奥多涅兹(Magglio 奥多涅兹)(第二名)。该组中最大的惊喜可能是Ordonez。去年他的确有进步,但第二名比我预期的好。 ZR只是范围测量之一。当我们达到目标时,我们将看到这些参与者在其他指标上的排名。

另一个有趣的案例是Placido 波兰科,他的FPCT不错,但在ZR比赛中仅获得第13名。这说明了投篮命中率的问题之一-它忽略了球员所覆盖的地面。也许有些人会感到惊讶,埃德加·伦特里亚(Edgar 伦特里亚)在ZR中的排名(第23名)甚至比卡洛斯·吉伦(Carlos 吉伦)(第20名)低。同样,ZR只是一个区域度量。我总是建议在评估实地考察时考虑不止一种措施。

请注意,这些统计信息不会’确实与捕手有关,因此必须在其他时间处理该位置。

下表的统计资料摘自 ESPN数据库。


表1:2007年Tigers Basic 田野统计数据

销售点

#

专利合作条约

专利合作条约排名

射频

射频等级

ZR

ZR等级

1B

凯西

29

.998

4

9.41

12

.886

7

2B

波兰科

28

1.000

1

5.08

10

.828

13

3B

卡布雷拉

27

.941

25

2.51

19

.714

25

3B

英格

27

.959

16

2.86

8

.803

4

SS

吉伦

30

.955

30

4.29

19

.807

20

SS

伦特里亚

30

.977

11

4.14

24

.800

23

如果

门罗

27

.983

17

1.92

17

.882

10

碳纤维

格兰德森

27

.989

14

3.04

2

.908

4

碳纤维

琼斯

27

.981

25

2.83

11

.904

6

射频

奥多涅兹

28

.996

3

1.95

21

.908

2

2007年12月26日,星期三

威利·莫(Wily Mo)和小海斯顿(Hairston Jr.)

不,老虎队不仅进行了Wily Mo Pena和Jerry Hairston Jr的交易。我正在收集来自互联网的现场数据- 硬时报, 棒球沉思, 坦古格.net, 守门圣经ESPN。我几乎完成了所有合并工作,但是Wily Mo Pena和Jerry Hairston Jr.都因为他们的名字,多个职位以及在Pena的情况下有多个团队而变得一团糟。以前合并过数据库的任何人都可能理解我的意思。完成后,我将讨论接下来几周的数据访问(除非出现重大新闻中断)。

同时,我希望每个人都喜欢假期。

2007年12月22日,星期六

运行预防事件-2007

今天我’ll continue with 日e 击球与投手 我本周早些时候开始的主题。 蝙蝠会导致以下任何事件:

  • 淘汰赛
  • 基于球
  • 击球手
  • 地球
  • 线驱动
  • 外场飞
  • 内场飞
这些事件中的三个通常是对投手有利的事件:

  • 淘汰赛
  • 地球
  • 内场飞
我称这些为运行预防事件(RPE)。 当然,地面球不如三振球或内场蝇那么容易出手,并且对投手可能有负面影响。 但是,引入大量的地面球将有助于防止在整个赛季中奔跑。 另一方面,对投手来说 在大多数情况下,避免以下事件:

  • 基于球
  • 击球手
  • 线驱动
  • 外场飞
去年,我创建了一个统计信息,称为运行预防事件百分比(RPE%),其计算公式如下:(SO + 国标 + 如果F)/ BFP。 击打击球手和诱导地面球被证明是可重复的技能。 年复一年,击球手击中内蝇并不稳定(2005年至20065年间相关系数= 0.1)。 但是,与其他击球类型相比,内蝇比较少见,而且在大多数情况下,包括在内不会实质改变RPE%。 另外,我怀疑(没有统计证据)对于某些投手来说,这是一项真正的能力。

事实证明,2005年至2006年之间,RPE%相当稳定,相关系数为.66。 也可以将其视为场独立统计数据,因为尽管最终结果并非独立于场外人员,但首先让场上人员或内场飞行与场上人员无关。 它与FIP ERA一样稳定或更稳定,但没有加权,因此不能解释允许的运行次数。 RPE%的部分价值在于其简单性。

在2007年,有65个美国联赛首发球员的起步数为17个或更多。表1列出了老虎首发球员的RPE%排名。 表2列出了联盟中排名前20位的投手。 总的来说,RPE%似乎对确定有效的投手很有帮助,但对于几个老虎先发球员杰里米·邦德曼(Jeremy 邦德曼)和贾斯汀·维兰德(Justin 维兰德)来说,却给出了不寻常的结果。

从表中可以看到,邦德曼(RPE%= 57.2)排名非常好(9 在里面 ),是2007年前20名中唯一的老虎投手。 投手FIP ERA文章,邦德曼(Bonderman)在场上独立统计数据上表现出色(三振,步行,地面球),但允许成束跑,尤其是在第一局。他的OPS对分的情况说明了他在底垒上遇到的问题:.827底跑的得分,.888得分手的得分和.748底位空的得分。

与Bonderman相比,Verlander的RPE%(52.1)接近联盟平均水平。 维兰德的地面球命中率低于平均水平(41%),但在飞球和直线驱动器上有非常不错的成绩。 根据《棒球时报》 2008年年度报告,他允许每线驱动器(.32)的奔跑次数少于任何美国联盟投手。他还以每场外飞(.14)进入前5名。这可能表明他在跑步者在基地上时不允许击中好球。

预计其他三支投手将从2008年开始为虎队效力,其RPE百分比为联盟平均水平或略低于该水平:肯尼·罗杰斯(Kenny 罗杰斯)52.0,唐特雷·威利斯(Dontrelle 威利斯)(51.5)和内特·罗伯森(Nate 罗伯逊)(51.1)。

用于计算RPE%的原始数据摘自 硬时报数据库.


表1:2007年Tigers起动器的运行预防事件

名称

知识产权

所以

国标

如果

RPE

RPE%

9

邦德曼

174.3

145

266

20

431

57.2

31

维兰德

201.7

183

245

23

451

52.1

34

威利斯

205.3

146

322

17

485

51.5

41

罗伯逊

177.7

119

266

14

399

51.1

50

杜宾

127.7

66

193

17

276

49.2

.

Jurrjens

30.7

13

37

6

56

45.9

.

马罗斯

78.3

28

120

9

157

45.4

.

磨坊主

64.0

56

102

7

165

53.4

.

罗杰斯

63.0

36

102

5

143

52.0



表2:前20名 2007年按RPE排名首发

名称

球队

知识产权

所以

国标

如果

RPE

RPE%

1

埃尔南德斯

190.3

165

357

11

533

66.0

2

卡莫纳

CLE

215.0

137

431

8

576

65.5

3

伯内特

TOR

165.7

176

239

15

430

62.2

4

贝达德

巴尔

182.0

221

216

12

449

61.3

5

贝克特

BOS

200.7

194

276

29

499

60.7

6

纽约市

199.3

104

381

12

497

60.4

7

麦高文

TOR

169.7

144

264

10

418

59.3

8

汉拿节

TOR

225.3

139

391

19

549

59.2

9

邦德曼

DET

174.3

145

266

20

431

57.2

10

沙巴亚

CLE

241.0

209

324

25

558

57.2

11

e

特克斯

136.0

78

269

3

350

56.9

12

迪纳多

橡木

131.3

59

249

7

315

56.8

13

卡兹米尔

结核病

206.7

239

238

23

500

56.4

14

威斯布鲁克

CLE

152.0

93

264

7

364

56.2

15

哈伦

橡木

222.7

192

304

28

524

56.0

16

盾牌

结核病

215.0

184

279

25

488

55.8

17

塔瓦雷斯

BOS

134.7

77

252

8

337

55.8

18

机车

KC

216.0

156

321

26

503

55.5

19

高丁

橡木

199.3

154

318

18

490

55.3

20

布兰顿

橡木

230.0

140

359

26

525

55.3

博客存档

订阅

我的Sabermetrics书

My Sabermetrics Book
《棒球美国》 2010年十大书籍之一

其他Sabermetrics书籍

统计计数器