統計ソフトR 標準化など

 前回の追加分。生数値ではなくstandardizeした場合にどうなるかを調べてみる。まずはn+1年目のNY/A(standardized)をn年のパス成功率、Y/C、サック率(同)を使って重回帰分析してみる。
 
切片   1.506e-12
成功率  0.4625
Y/C    0.2697
サック率 -0.1013
 
 パス成功率の及ぼす影響が最も高く、サック率は低い。要するにY/Aの影響が大きく、その中でも年ごとの安定性が高いパス成功率の比重が高まる。一方、サック率も年ごとの安定性は高いが、そもそもNY/Aに及ぼす影響が小さいので効果も限定される。
 次はANY/A。こちらは以下のようになる。
 
切片   1.825e-12
成功率  0.4105
Y/C    0.1223
TD率   0.09008
Int率  -0.03541
サック率 -0.04881
 
 こちらもパス成功率が、次にY/Cが大きな影響を及ぼしているが、その次に来るのはTD率だ。Int率は同じ年のデータには大きな影響を与えていたが、年ごとの安定性の低さが災いして影響度が最低に落ちている。サック率も大したことはない。これを見る限り、翌年のQBの成績を予測するうえで役に立つのは正直パス成功率くらいしかないと言えそう。
 実際、特に影響力に乏しいInt率とサック率をなくして重回帰分析をすると結果は以下の通り。
 
切片  1.913e-12
成功率 0.4448
Y/C  0.1159
TD率  0.09446
 
 R自乗は0.2366となり、Int率やサック率を含めた場合の数値(0.2368)と大して変わらない。要するに無視していいレベルの要素なのである。というかInt率の場合は年ごとのぶれが大きすぎるために織り込むのが難しく、逆にサック率はANY/Aに与える影響が小さすぎるために無視できる、というのが正しいんだろう。いずれにせよパス成功率以外をQBの将来の成績を予測する道具に使うのは結構難しいことがこちらの分析からも分かる。
 
 ではもう少し過去の成績を採る期間を長くしてみたらどうか。n年とn+1年の成績を足し合わせ、そこからn+2年の成績を予測できるかどうか調べてみる。まず(n+n+1)の成績とn+2の成績のR自乗。
 
成功率  0.4527
Y/C   0.1647
TD率   0.1171
Int率  0.1674
サック率 0.3725
NY/A   0.2282
ANY/A  0.2066
 
 パス成功率、Int率、サック率、ANY/Aは上昇しているが、Y/C、TD率、NY/Aは逆に低下。あまり目覚しい予測性能の向上は見られない。重回帰分析をしてもNY/AについてはR自乗が0.2626とむしろ低下。ANY/Aは0.2416と少し向上するが、やはり目立ったメリットを感じさせるような数値ではない。過去2年分くらいでは役に立つ度合いは限られているようだ。
 さらに過去3年の成績を足し合わせてやってみても、NY/Aの過去3年分と最新年のR自乗が0.2203、ANY/Aが0.2115となる状態で、やはり予測性能の向上は感じられない。重回帰分析だとNY/Aが0.251、ANY/Aで0.2373。面倒な計算までして過去3年分の成績から将来を予測しようとしても効果に乏しい。
 要するにQBの将来成績についてある程度頼りになる指標は、結局のところパス成功率とサック率くらいしかないという結論になる。そしてサック率はANY/Aなどに与える影響が限定的。これだけ色々とデータを弄ってみたが、やはりpredictiveに使えるQB関連の指標はパス成功率くらいという結論を乗り越えることはできなかった。
スポンサーサイト



コメント

非公開コメント

トラックバック