2017年こそリアルガチで\横浜優勝/するのか分析してみた

松本 健太郎

 

昨年、広島カープの優勝を予想して見事に的中したマメ研所長。

2016年プロ野球順位予想!監督の選手時代から勝利数は予測できる!?
http://www.mm-lab.jp/statistical/professional_baseball_standings_expected_2016/

 

今年は、躍進を遂げている横浜DeNAベイスターズが優勝するか検証します。

 

2016年の成績をピタゴラス勝率の観点で振り返る

2016年の結果を振り返ります。広島の圧倒的な優勝で終わったセ・リーグでした。

 

2016年のセ・リーグ成績
2016年のセ・リーグ成績

 

得失点が多い横浜DeNAと、得失点が少ない巨人がほぼ同じ勝率という点に違和感を抱くかもしれません。

しかしピタゴラス勝率を求めると、だいたい似た勝率に落ち着きます。

P勝率列を参照ください。

 

チームの傾向は、打力の横浜DeNAと投手力の巨人という位置付けで良いかと考えます。

ちなみに、打撃系指標を比べるとOPSは巨人と横浜DeNAで同率なのに、得点は巨人が60点も下回っています。

WBSでも4番を務める筒香という傑出した存在がいることの証左ですね。

もし筒香が怪我で長期離脱でもしたら…ゾッとします。

 

さて、これを交流戦と公式戦の2つに分けてみましょう。

 

交流戦とそれ以外のセ・リーグ成績
交流戦とそれ以外のセ・リーグ成績

 

巨人と横浜DeNAの命運を分けたのは、交流戦だったことが分かります。

交流戦以外は、全く同じ勝敗数でした。

 

山口の抜けた穴は埋まるのか?

去年の成績を基準に新戦力面では「抜けた人」と「加わった人」、そして既存戦力面では「成長した人」と「衰えた人」を足し算・引き算すれば今年のおおよその成績が出せます

しかし何れも非常に予想が難しい。

例えば、2014年、2015年と2年連続最多ホールドを獲得した福原選手が、急に衰えて2016年にプロ野球選手を引退するとは思ってもいませんでした。

逆に2014年に阪神を自由契約になった新井選手が2016年に101打点でリーグMVPを受賞するとも思っていませんでした。

 

そんな中で抜けた戦力がどれくらい痛手なのか、これはまだ予想しやすいです。

例えば去年の優勝を広島だと断言した時に、周囲は「マエケンの抜けた広島は無い!」といった反応を示した。

恐らく「2015年は前田健太で15勝したから、彼が抜けることで15勝分無くなる」という思い込みによるものです。2013年に24勝をあげた田中将大が抜けた楽天が、翌年に最下位に落ち込んだことも拍車をかけているかもしれません。

しかし投手がいくら0点に抑えても、打線が1点以上取らなければ勝つことはありません。つまり3点取られようが5点取られようが、それを上回る得点をあげれば勝つことができます

これをRS(援護点)と言います。

去年の広島の場合は、前田健太の抜けた穴を野村祐輔が埋めました。防御率、WHIPともに2015年の前田健太に及びませんでしたが、ほぼ同じ16勝をあげました。

RS/9(9イニングあたりの援護率)で見てみると2016年の野村祐輔が5.66に対して、2015年の前田健太が3.40です。野村の能力は前田に劣りますが、援護点が多かったので勝利数はほぼ同数だったのです。

このあたりが投手の能力を勝利数で図ることが間違っていると言われる証拠なのだと感じています。

 

さて、2016年のオフシーズンに山口俊が巨人へ移籍しました。

これも「11勝抜けた!」と考えるのではなく、山口選手の防御率、援護率から、どの程度の能力を持つ選手であれば11勝あげられるか?を考えてみましょう。

まず、登板回数が100イニング以上の横浜DeNAの選手は以下のような成績でした。

 

横浜DeNA100イニング以上投げた選手
横浜DeNA100イニング以上投げた選手

 

山口選手はDeNAの中でも援護点の多い投手であることがわかります。

セリーグ全体ではどのような傾向にあるでしょうか?

 

セ・リーグ全体
セ・リーグ全体

 

「援護率-防御率」と「勝利数」に相関がありそうに見えます。

そこで横軸を「援護率-防御率」、縦軸を「勝利数」とする散布図を作成し、回帰直線をプロットしてみました。その結果は以下の通りです。

 

横軸を「援護率-防御率」、縦軸を「勝利数」
横軸を「援護率-防御率」、縦軸を「勝利数」

 

中日のバルデスが最も当てはまりの悪い結果となっていますが、その内訳を見ると7月28日登板の援護点が13点と異常値を示しているので、こういうこともあるのでしょう。

上の表にこのモデルを用いて「想定勝利数」と実際の勝利数との差分を掲載しています。

 

セ・リーグ全体(再掲)
セ・リーグ全体(再掲)

 

さて、比較的分かりやすい回帰モデルが作成できたので、このモデルを元に山口俊が巨人に移籍したと仮定して考えます。

2017年の巨人は、打者では陽岱鋼、元楽天のマギーを獲得していますが、いったん2016年の援護点を参考に考えます。

4人の先発陣の平均援護率が3.63です。

2016年の山口の成績を考えれば2.1198*(3.63-2.86)+7.7362=9.37勝≒約9勝となります。

各球団は対巨人相手にエース級を投入するでしょうから、そう簡単に得点をあげられません。そんななかで、山口選手は1点を守りきる野球ができるのでしょうか

というか山口選手は隔年投手の匂いがするので、2017年は正直どうでしょうかね。

 

では、山口選手の抜けた穴をどうするかですが、これと全く同じくロジックを考えます。

2016年の横浜DeNAの平均援護率が4.00ですから、2.1198*(4.00-X)+7.7362=11勝…すなわちX=防御率2.46です。つまり約140イニング投げて38自責点の投手が必要です。

このあたりは新外国人、三嶋、砂田に期待です。別に1人で達成する必要なく、2人で6勝ずつでも全く問題無いのであります。

そう考えると意外に穴埋まりそうじゃないですか?

 

今年の新外国人投手活躍予想

では、その期待されうる新外国人は、どんなもんでしょうか。

こればかりは全く分かりません。オープン戦で何度も第2のバースを見た関西人が言うのだから間違いありません。

それでも何とか考えてみます。

 

援護率と防御率が勝利数に関係することが分かったので、防御率を目的変数とした説明変数を考えてみます。

対象として2007年以降にMLBから参戦した107人の助っ人外国人のうち、最低10試合登板した71人を対象としました。

その結果、以下のモデルがもっとも当てはまりが良いことがわかりました。

model1 <- lm(防御率 ~ H/9+HR/9+制球力,data=war)
summary(model1)

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept) -0.50818    0.62754  -0.810 0.420920    
H/9          0.46319    0.06687   6.927 2.05e-09 ***
HR/9         0.88189    0.24077   3.663 0.000494 ***
制球力      -0.18057    0.07403  -2.439 0.017369 *  
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.7576 on 67 degrees of freedom
Multiple R-squared:  0.7346,	Adjusted R-squared:  0.7227 
F-statistic: 61.83 on 3 and 67 DF,  p-value: < 2.2e-16

H/9(9イニングあたりの被安打)、HR/9(9イニングあたりの被本塁打)が高いほど防御率が上がり、かつ制球力(奪三振/与四球)が高いほど防御率が下がるようです。

言い換えるとH/9、HR/9、制球力それぞれが、過去のMLB(及びAAA)での成績から推測できれば、自然と2017年の結果も予想できるのではないでしょうか。

 

そこで71人の助っ人外国人選手の来日1年目の成績を目的変数、1〜3年前の成績を説明変数にしてモデルを作ってみました。

AAAとMLBを行き来している選手もいるので、その場合は登板回数を多い方を参照することにしました。

# 所属=1:MLB 0=AAA
model4 <- lm(H/9_4 ~ H/9_3+所属_3+H/9_2+所属_2+H/9_1+所属_1,data=war)
summary(model4)
Coefficients:
            Estimate Std. Error t value Pr(>|t|)   
(Intercept)   7.1742     2.5514   2.812  0.00775 **
H/9_3         0.1974     0.1627   1.213  0.23246   
所属_3       -1.2763     0.7515  -1.698  0.09762 . 
H/9_2        -0.2617     0.1366  -1.916  0.06295 . 
所属_2        2.0320     0.6956   2.921  0.00584 **
H/9_1         0.1877     0.1354   1.386  0.17371   
所属_1       -0.7544     0.6954  -1.085  0.28481   
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 1.863 on 38 degrees of freedom
  (26 observations deleted due to missingness)
Multiple R-squared:  0.2844,	Adjusted R-squared:  0.1715 
F-statistic: 2.518 on 6 and 38 DF,  p-value: 0.03769
model4 <- lm(HR/9_4 ~ HR/9_3+所属_3+HR/9_2+所属_2+HR/9_1+所属_1,data=war)
summary(model4)
Coefficients:
            Estimate Std. Error t value Pr(>|t|)  
(Intercept) -0.11723    0.29740  -0.394   0.6956  
HR/9_3       0.23470    0.19478   1.205   0.2357  
所属_3      -0.04089    0.17406  -0.235   0.8155  
HR/9_2       0.25588    0.14258   1.795   0.0807 .
所属_2       0.09565    0.17219   0.556   0.5818  
HR/9_1       0.38900    0.22466   1.731   0.0915 .
所属_1      -0.25748    0.20544  -1.253   0.2177  
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.446 on 38 degrees of freedom
  (26 observations deleted due to missingness)
Multiple R-squared:  0.1813,	Adjusted R-squared:  0.05204 
F-statistic: 1.403 on 6 and 38 DF,  p-value: 0.2389
model4 <- lm(制球力_4 ~ 制球力_3+所属_3+制球力_2+所属_2+制球力_1+所属_1,data=war)
summary(model4)
Coefficients:
            Estimate Std. Error t value Pr(>|t|)   
(Intercept) -0.10015    0.58950  -0.170  0.86600   
制球力_3     0.31121    0.09601   3.242  0.00248 **
所属_3       0.67420    0.44062   1.530  0.13427   
制球力_2     0.56588    0.17768   3.185  0.00289 **
所属_2      -0.45884    0.50664  -0.906  0.37082   
制球力_1     0.17554    0.17230   1.019  0.31473   
所属_1      -0.10998    0.48060  -0.229  0.82022   
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 1.16 on 38 degrees of freedom
  (26 observations deleted due to missingness)
Multiple R-squared:  0.4865,	Adjusted R-squared:  0.4054 
F-statistic:     6 on 6 and 38 DF,  p-value: 0.0001748

んー、薄々分かっていたことではありますが、当て嵌まり度合いが微妙です。

Estimate±Std.Errorで値が反転する変数もあります。

ただしH/9と制球力については「当て嵌まり度合い」だけを見れば、まだマシです。

そこで無理矢理ではありますが、H/9と制球力のみのモデルを作成して、来日する横浜の新外国人3投手のうち先発が予定されているフィル・クラインとジョー・ウィーランドの予想防御率を作ってみます。

model1 <- lm(防御率_4 ~ H/9_4+制球力_4,data=war)
summary(model1)
Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept) -1.19375    0.65136  -1.833   0.0712 .  
H/9_4        0.59529    0.06124   9.721 1.72e-14 ***
制球力_4    -0.12542    0.07882  -1.591   0.1162    
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.8239 on 68 degrees of freedom
Multiple R-squared:  0.6815,	Adjusted R-squared:  0.6721 
F-statistic: 72.75 on 2 and 68 DF,  p-value: < 2.2e-16

モデルから、フィル・クラインの予想防御率3.13、ジョー・ウィーランドの予想防御率3.18となりました。

フィル・クラインは荒れ球タイプ、ジョー・ウィーランドはコントロールタイプということですが、想定していた防御率2.46には届きそうにありません…。

2人合わせて5勝~10勝って感じかと思います。

何とか独り立ちしてよ、三嶋、砂田。

 

まとめ

横浜DeNAは主砲・筒香が怪我で長期離脱でもしない限りという制約がありますが、今年もAクラスは確定、\横浜優勝/だとおもいます。山口選手の穴も何とか埋まるでしょう。

しかし、あくまで本命は広島東洋カープ。暫くは黄金時代が続くと予想しています。

奇跡があるとすれば、筒香の後を打つ5番がしっかり決まって、ロペスと3人で合わせて250点ぐらいとるような打線になることぐらいでしょうか。

以上、お手数ですがよろしくお願いいたします。

 

参考文献

1.02 - Essence of Baseball | DELTA Inc.
http://1point02.jp/op/index.aspx