前に統計解析ソフトRの勉強をやったので、今回はRを使ってもう少し積極的な対応を。ANY/Aに及ぼす効果を調べるのはretrospectiveな分析だが、predictiveな予想がどこまでできるかを調べてみたい。つまりn年の成績とn+1年の成績との相関だ。以前も調べたことがあるが、Rを使って重回帰分析も取り組んでみる。
まずはいつものように個別指標のn年とn+1年の相関を。R自乗は以下のようになる。ちなみにデータはまだ2012年まで。
成功率 0.3805
Y/C 0.1864
TD率 0.1494
Int率 0.08424
サック率 0.3159
NY/A 0.2472
ANY/A 0.1974
以前、調べたのと当然ながら同じ結果が出てくる。R自乗が高いのはパス成功率>サック率>Y/C>TD率>Int率の順番だ。そしてNY/Aはサック率に次ぐ高さで、ANY/AはそのNY/Aより少し下となる。相関係数として見るのなら成功率0.617、サック率0.562、NY/Aが0.497、ANY/Aが0.444、Y/Cが0.432、TD率0.387、Int率0.290となる。TD率とInt率は弱い相関にとどまり、残りがそこそこの相関だ。
次はn年の時のパス成功率、Y/C、TD率、Int率、サック率、NY/Aとn+1年のANY/AのR自乗を調べた。
成功率 0.2075
Y/C 0.0004409
TD率 0.1118
Int率 0.03631
サック率 0.06341
NY/A 0.1883
翌年のANY/Aを予想するうえで最も役に立ちそうなのはパス成功率だが、それでも数値は低い。またNY/Aも何とか使えるが、後は正直使えなさそうな指標ばかりであることが分かる。
同様にn年のパス成功率、Y/C、TD率、Int率、サック率、ANY/Aとn+1年のNY/AのR自乗も調べた。
成功率 0.1951
Y/C 0.0186
TD率 0.1438
Int率 0.01192
サック率 0.08257
ANY/A 0.2162
なぜかn年のTD率とn+1年のNY/Aの相関性が少し目立っているが、まあ小さな数字である点には代わりはない。後はパス成功率などが少し高い程度だ。何より、NY/AにせよANY/Aにせよ、n+1年の予想をしたければn年の同じ指標を使った方が相関性が高い点に代わりはない。これについてもっと高い相関性を出せる計算式はないのか。まずはn年のパス成功率、Y/C、サック率を、n+1年のNY/Aと比べて重回帰分析をしてみる。
切片 0.006405
成功率 7.537364
Y/C 0.186173
サック率 -3.422647
切片はほぼ無視していい数値。パス成功率の比率が高く、サック率は実際はほとんど影響を及ぼさないレベルだ。問題はこの数式を使った場合のR自乗も結局0.2692に過ぎず、残差標準誤差は0.6734に達していること。確かに前年のNY/Aを使うより少しは相関性が高まるものの、例えば2013年のNY/Aで見るなら平均を0.67上回れば全体10位以内に入れる一方、下回った場合は下から6番目になる可能性があるわけで、ブレが大きすぎて予測に使うには厳しい指標だ。
ANY/Aになるともっと厳しい。同様にパス成功率、Y/C、TD率、Int率、サック率の重回帰分析をしてみた結果は以下の通りだ。
切片 -1.44117
成功率 9.95305
Y/C 0.12566
TD率 8.87589
Int率 -3.98250
サック率 -2.45436
こちらは予想通りNY/Aより酷く、R自乗は0.2368にとどまる。前季のANY/Aから予想するよりはマシと言えそうだが、一方で残差標準誤差も1.024とでかい数値になっており、予測に使うのが難しそうなのは同じだ。QBの翌年の成績を予想するのは、実は結構難しいんじゃなかろうか。
スポンサーサイト
コメント