予想いろいろ

 以前、NFLの勝率を使ってその「遺伝子型」を調べてみたことがある"http://blogs.yahoo.co.jp/desaixjp/55486084.html"。それと同じことがQBの成績予想に使えないだろうか。
 扱うデータが多いため対象はnシーズンの成績と、その前3年間つまりn-1からn-3シーズンの累計成績を比べる。1978年以降を対象に1シーズン224試投以上のQBについて調べ、その結果についてこちら"http://blogs.yahoo.co.jp/desaixjp/54443205.html"の調査結果と比べる。対象期間を合わせるため、データは2012シーズンまでとする。すると対象QB数は延べ521人となり、R自乗は以下のようになる。

成功率  0.426
Y/C   0.200
Y/A   0.188
TD率   0.108
Int率  0.176
サック率 0.347
NY/A   0.225
ANY/A  0.204

 全体として上昇しているが幅は小さい。中にはNY/AやTD率のようにむしろさがっているものもある。唯一大きな上昇が見られるのはInt率だけであり、結果としてTD率よりInt率の方が相関係数が高まっている。
 果たしてInt率の上昇はどういうことか。母数が増えることで相関度が増した、と考えたいところだが、比較対象として確かに過去は3年分に増やしているものの、nシーズンは1年分のデータしか使っていない。従ってランダム成分の影響が減ったと考えるのは難しいだろう。Int率がTD率より高くなったのは偶然の結果だと考えた方が安全だと思える。
 要するにチームの勝率ほどしっかりとした相関係数の上昇は見られないのである。おそらく特定の1シーズンだけ予想するには、QBのプレイ数は母数が少なすぎるのだと思う。またチーム全体なら多くの関係者の影響が重なることでランダム要素が相殺されることが期待できるが、QBのプレイに関与する人数はもっと少ないためランダム要素を排除しきれない面があるのだろう。
 コーチングスタッフやレシーバーの能力が変わることに伴う「遺伝子型」自体の変化も否定しきれない。チーム全体が一斉に入れ替わることはあまりないが、QBのパス成績に影響を与える環境が大きく変わるのはさして珍しくない。だとすると過去3年のデータを積み上げてもあまり意味はないかもしれない。
 残念ながら、このシンプルな方法でQB成績を正確に予想するのは無理があるようだ。もしかしたらn-1からn-3シーズンの累計成績をnからn+2シーズンまでの累計成績と比較すればもっと相関係数が上がるかもしれないが、残念ながらそれでは「来シーズンのQBの成績はどうなるのか」という一番知りたいこととずれてしまう。難しい問題だ。

 一方、チーム単位で見た「遺伝子型」からの成績予測が、単純に前シーズンと比較するよりマシなのは以前に見た通り。Football Perspectiveのこちらの記事"http://www.footballperspective.com/correlating-wins-in-year-n-and-year-n1/"では「n-1シーズンの成績とnシーズンの成績が平均してどの程度ずれるかについて「2.84勝」という数字を出している。それに対し、遺伝子型をあぶりだす「n-1からn-3シーズンの累計」とnシーズンとの比較をすれば、このずれは2.48勝まで下がるし、「n-1からn-4」で計算すれば2.39勝とさらに低下する。
 だが、こうした方法はPythagenpat Winning Percentage"http://www.footballperspective.com/pythagenpat-records-in-2013/"で予測するのに比べると劣る。この方法ならずれを2.31勝まで縮めることができるから、だそうだ。ただ、私が調査対象とした02シーズン以降だとこの数値は2.74勝だから、それよりは遺伝子型の方が高い可能性がある。
 さらに遺伝子型をPWPに応用すれば、一段とずれが減る。何しろ過去3年分のPWPを使えばこのずれは2.40勝に、過去4年分のPWPなら2.34勝になるのである。単純な遺伝子型よりも精度は高い。というわけで過去4年のPWPを使って今シーズンのプレイオフ出場チームを予想すると以下のようになる(数字は予想勝利数)。

NE 11.96
Den 10.80
Bal 9.77
Hou 8.75
Cin 9.72
Pit 9.46

Sea 11.66
GB 10.64
NO  9.92
Dal 8.80
SF 10.82
Det 8.55

 単純に過去4年分の勝率を並べた場合と比べ、AFCではIndianapolisがHoustonに、NFCではArizonaがDetroitに入れ替わっている。つまりIndyの過去の得失点差は勝率ほどよくないということになる(Houstonはその逆)。これはLuckが入る前の2011シーズンを除いても同じで、過去3年のIndyは勝率がリーグ4位なのに対し、得失点差は8位に落ちてしまう。今シーズンのIndyの事前評価は高いが、少なくとも過去の彼らは見た目ほど強くなかったのかもしれない。

 それにしても驚きなのは、全チームが8勝8敗になると予想しても、このずれは2.48勝(つまりn-1からn-3の遺伝子型を使うのと同じ)まで減らすことができる点だ。平均への回帰が持つ力は、遺伝子型と比べても負けず劣らず強いってことだろうか。
スポンサーサイト



コメント

非公開コメント

トラックバック