コンバージョン

 3rd down conversionは、果たしてどの程度重要なのだろうか。スタッツ分析をしている人の間では「あまり重要視すべきでない」という見解が多い。例えばBrian Burkeはこちら"https://www.washingtonpost.com/news/football-insider/wp/2012/10/10/third-down-conversion-rate-can-mislead-coaches-and-fans"で3rd down conversionはコーチやファンをミスリードさせると指摘する。3rd downでの率を高めるよりも、1st downや2nd downでさっさとFirst Down更新を目指す方がより正しい選択である、という指摘だ。
 3rd down conversionの相関係数が悪いというわけではない。例えば2016シーズンの数字を見ると得点と3D convの相関係数は0.730と強い相関を示している。勝敗との相関となるとディフェンスの問題も絡んでくるために0.391まで低下してしまうが、少なくともオフェンスを見るうえではそれなりに役立つ指標なのは確かだろう。しかもランの回数などと違って3D convが高い方が得点につながるという因果関係が十分に想定できる。
 問題は3rd downの母数が小さいこと。16シーズンのプレイを見ると3rd downののプレイは7002回と1st down(14974回)の半分以下、2nd down(11255回)の6割強にとどまる。母数が少なければそれだけ偏りが発生しやすくなり、数値の妥当性が下がる。加えて3rd downの平均残りヤードを見ても最も多いBrowns(8.18ヤード)と最も少ないSaints(6.18ヤード)の間には2ヤードもの差があり、conversionの違いが持つ意味がさらに変わってきてしまう。
 要するに3D convはretrospectiveな指標としては問題ないが、predictiveに使うには困った指標なのである。過去の勝ち負けについて説明するうえでは「3D convが高かったから」という指摘は正しいのだろう。でも母数の少ない指標でたまたま高い数値を出したチームが、今後も同じく高い数値を出す保証は低い。実力ではなく偶然の可能性が高まるからだ。それよりはプレイ全体に占めるFDの比率を見た方が母数が大きい分だけ予想に役立つ指標が得られるだろう。
 少し話がずれるが、同じ問題がRed Zoneにもある。しばしばRed Zoneの効率性が高いことを評価したり、あるいは低いことを批判する声がネット上で見られるのだが、これはあまり意味のある指標だとは思えない。例えば16シーズン、Red Zone内に入ったドライブ数が最も多かったPackersでもドライブ数は67回、つまり1試合当たり4回ちょっとだ。彼らのドライブ当たりスコア率は91%でこれは最下位だったJetsの77%より高いのは確か。でもその差14%は67回のドライブのうち9.4回分弱にしか相当しない。つまり1試合につきドライブ0.6回弱の差にしかならないのだ。あまり重視しすぎるのはよくないように思う。

 問題はここから。3D convは(Red Zoneも同じだが)、母数が小さすぎることがpredictiveな使用に向いていない要因となっている。だとすれば母数を増やせばpredictiveに使えるようになるのだろうか。つまり長期間のデータを取れば使える指標であることが判明するのだろうか。
 今度はリーグが32チームになった2002シーズンから16シーズンまでの累計を使って相関係数を算出してみた。まずはオフェンスの3D convと総得点との相関だが、こちらは0.872となる。1シーズンの結果よりも高く、まあまあな水準だ。ところがディフェンスの3D convと総失点との相関を調べると、係数はたったの0.325にとどまってしまう。
 predictiveかどうかを調べる以前に、そもそもディフェンスでは相関係数自体がかなり低くなるという予想外の結果が出た。もちろんディフェンスの係数は全体としてオフェンスより低くなりがちだ。だが母数を増やし、長期間のデータを取るとディフェンスでも係数は一般的に高まる。例えばディフェンスのANY/Aは16シーズンだけだと0.703にとどまるが、02-16シーズンだと0.824まで高まる。
 3D convに比べるとはるかに信頼度が低いとされるトータルヤードも、長期間で見れば失点との相関は高まる。02-16シーズン合計なら0.777だ。FDがらみの指標が当てにならないというわけではなく、例えばディフェンスのプレイ全体に占めるFDの比率と失点との相関は、同じ期間で0.734と強い相関を示す(オフェンスだと0.928になる)。要するに3D convという指標が突出して相関が低くなっているのである。
 なぜディフェンスの3D convはこれほどまでに失点との相関が低いのだろうか。理由は分からないが、そもそも相関自体が低い指数をpredictiveに使用するのは無理があるだろう。オフェンスの方は高いのでまだ使える可能性は残っているものの、試合の半分でしか使えない指標を重視しなければならない理由はない。むしろプレイ全体に占めるFDの比率などを使った方がよほど役立つ。
 でもネット上に載っている各種のデータを見ても、3D convや4th down conversionはきちんと載せているのに、FD比率を載せているところは見当たらない。MLBなどでマネーボール的な指標が幅広く紹介されているのに比べると実に対照的だ。マネーボール導入が遅れているのはフロントだけではなくメディアも同じらしい。つまり今のNFLはMLBなどに比べて保守的になっており、リーグだけでなくその周辺も含めて新しい概念の導入に対して否定的な姿勢を取っていると考えられる。

 ちなみにディフェンス関連の指標で突出して変なデータを示しているのがPatriots。先ほど紹介したディフェンスプレイ全体に占めるFDの比率と失点との相関は、Patriotsを除くと0.734から0.824まで急上昇する(PatriotsはFDを取られまくるわりに失点が少ない)。以前紹介した「曲がるが折れない」指標"https://blogs.yahoo.co.jp/desaixjp/55224974.html"でもPatriotsが突出して高い数字を出していた。このチームのディフェンスだけは、リーグ全体とは異質なところでプレイしているように見える。
 あるいは異質なのはディフェンスではなくSTなのかもしれない。Patriotsは関連指標を見る限り、今シーズンもリーグトップクラスのキックオフを維持しているという"http://www.footballperspective.com/guest-post-the-patriots-league-best-kickoffs/"。こういう強みが残っている限り、Patriotsのせいで相関係数が下がる事態は続きそうだ。
スポンサーサイト



コメント

非公開コメント

トラックバック