スタッツ相関

 以前、Pro-Football-Referenceが最近になって掲載するようになったAdvanced Passing Statsについて言及したことがあった。取り上げているのはAir Yards、Accuracy、Pressure、Play Typeという切り口からのデータであり、それぞれプレイヤー単位だけでなくチーム単位のものもまとめている。ただし、データがあるのは2018シーズンからである。
 Advanced Passing Statsがゲーム内でどのような意味を持つかを知るためには、おそらくもっと多くのデータを集める必要があろうだろう。正直、やっと2シーズン分しかないデータではまだ細かい判断まではできない。それでも、まずはデータの傾向を調べてみるのは悪い話ではあるまい。というわけで2シーズン分のデータについてチームの勝率や得点との相関を調べてみた。

 Air Yards関連のデータは、名前の通りQBが実際にパスを投げた距離(Air Yards)とキャッチ後にレシーバーが稼いだYACとに関するデータだ。出てくるデータはIAY(Intended Air Yards)とIAY/PA、CAY(Completed Air Yards)、CAY/CmpとCAY/PA、YAC(Yards after Catch)、そしてYAC/Cmpだ。
 まずチームの勝率とチームのこれらの成績(オフェンス)との相関だが、2018シーズンにおいて最も高い数字を出したのはCAY/PAの+0.451であり、その次はYACの+0.332、そしてYAC/Cmpの+0.311、CAYの+0.277、CAY/Cmpの+0.227となっている。2019シーズンだとYAC/Cmpの+0.485が最も高く、以下YAC(+0.359)、IAY(-0.232)が続いている。またPFRのデータには載っていないが、YAC/PAを計算してみると2018は+0.463、2019は+0.546となる。見ての通り、両年に共通して勝率と高めの相関を示しているのはYAC関連の指標が中心だ。つまり勝率との関連で言うとAir YardsよりYards after Catchの方が重要に見える。
 だが得点との相関を見るとそうとは言い切れなくなる。2018シーズンだと数値が高いのはCAY/PA(+0.627)、CAY(+0.616)、YAC/PA(+0.609)、YAC(+0.595)などであり、2019シーズンならCAY/PAが+0.538でトップ、以下YAC/PA(+0.485)、YAC(+0.426)、YAC/Cmp(+0.409)といった順番に並んでいる。どちらの年もCAY/PAが最も高い数字を出しているのだ。
 得点との相関だとCAY/PAが、つまり成功したパスの平均Air Yardsが重要ということになる。もちろんその後にYAC関連の指標が順番に並んでいるため、Yard after Catchも大切なのは間違いないが、勝率その相関でそれほど目立っていたわけではないCAY/PAがトップに躍り出るあたりは気に留めておくべきだろう。正直、現時点ではAir YardsとYACのどちらが大切なのか、判断がつかない。

 Accuracy関連データについてはその一部において2018シーズンのデータが存在しない。具体的にはBats(Passes batted by a defender)とOnTgt(On Target throws)、OnTgt%(Percentage of on-target throws)それぞれの数字だ。これらについては2019シーズンのみを参照する。
 勝率との相関が最も高いのは2018はDrop%で、-0.527となる。次はDropsの-0.441となり、後はThrow Away(-0.241)、Bad%(Percentage of poor throws)の-0.227あたりが目立つ。2019だと最も高いのはOnTgt%の+0.531で、以下Bats(-0.512)、Bad Throw(-0.317)、Spikes(-0.274)、Bad%(-0.205)となっている。1年分のデータしかないOnTgt%やBatsが高くなっているが、Drop%のように2018は高くても2019はほとんど無相関という例もあるので、この時点で度のデータが重要なのか判断は不可能だ。
 得点との相関を見ると2018はDrop%が+0.413で最も高く、以下Bad%が-0.301、Dropsが-0.210となっている。2019はDrop%が-0.369、Dropsが-0.351となっており、以下OnTgt%(+0.342)、Bats(-0.238)、Bad%(-0.226)といった順番で並ぶ。こちらは勝率との相関とは異なり、Drop%やDropsが2年連続でそこそこの相関を示しており、それなりに影響を及ぼしている可能性があるかもしれない。ただし相関係数の水準はかなり低いし、そしてくり返しになるがまだたった2年分のデータでしかない。
 個人的にBatsやDrops、Spikesのようにそもそもの数字が小さいデータで高い相関が出ているのをそのまま信用するのは拙いと思う。すると一連のデータでそれなりに頼れそうなのは、実はOnTgt%くらしかなく、それも最初に紹介したCAYやYACといったヤード関連の指標と比べて明確に相関度が高いわけではない、という結論になる。パスの正確さはもちろん大切なのだが、実はどのくらいの距離に正確に投げられるかの方が重要、ということだとも解釈できる。

 次はPressure関連のデータ。2018シーズンにおいて勝率との相関が最も高かったのはSack、つまりサック回数の-0.464なのだが、それ以外に0.2以上の絶対値を示したものはない。2019シーズンだとSack(-0.516)とHurry(-0.448)、PktTime(ポケットに留まる時間)の+0.274、そしてHitsの-0.223が出てくるが、このうちHurryとHitsは2018に低い相関を示している指標であり、あまり当てになりそうにない。
 得点との相関は2018だとSackが-0.596、Yds/Scr(Yards per Scramble Attempt)が-0.221となっている。2019はHurryが-0.594と最も高く、以下Sackが-0.451、PktTimeが+0.324、Yds/Scrが+0.209だ。このうちYds/Scrは2018シーズンと19シーズンで正負が逆転しており、とてもじゃないが当てになるデータではないことが分かる。要するに両年通じてデータのある指標としては使えるのはSackのみ、19シーズンしかデータはないが勝率、相関とも僅かながら相関がみられたのはPktTimeのみ、ということになる。
 パスラッシュと勝敗との相関はパスカバーよりも低いという指摘は、これまでもいくつか紹介してきた。サックという具体的な結果につながったプレイはさすがにそれなりの相関を出しているが、それ以外のPressure関連指標と勝率や得点との相関が低い点は、そうした指摘と平仄を合わせたものと見ることができる。むしろカバーを密にしてOn Targetへ投げ込むのを難しくする方が、ディフェンスとしては効果的なのかもしれない。

 そして最後にPlay Type別のAdvanced Passing Statsだが、こちらもまた2018シーズンには存在しなかったデータであり、2019シーズンのみで分析してみる。
 とはいえこちらもあまり高い相関はない。勝率との相関だとPlay ActionのPass Attemptとの相関が+0.323、Pass Yardsとが+0.320となっているのが少し目立つくらいで、他は全て絶対値0.2未満だ。得点との相関ならPlay ActionのPass Yardsが+0.591、Pass Attemptが+0.520となり、そこそこの相関になる。少なくともPlay Actionはゲームの勝敗や得点に一定の効果をもたらしている可能性がある。
 しかしこれがRPO、つまりRun Pass Optionだと、相関はぐっと低下する。RPO全体のYardsと勝率の相関は+0.150しかないし、得点との相関でも+0.342にとどまる。より細かくパスやランのYardsとの関係を見ても、得点との相関が前者で+0.275、後者で+0.334という程度だ。それに多くのチームでそれなりの回数プレイされているPlay Actionに比べ、RPOは一部チームでは1桁回数しか実行されておらず、正直データとして信用が置けない。

 さらにTeam Advanced Defenseというスタッツも2018シーズンから記録されるようになっている。ディフェンススタッツはもともと相関が低くても仕方ない面があるのだが、それでも同じように調べてみた。
 勝率との相関が最も高く出たのは2018ではQB Pressuresで+0.515、次がQB Hurriesの+0.466、そしてSack(+0.395)、Missed Tackles(-0.360)と続く。つまりパスラッシュが上位に来ている。だが2019になるとパスラッシュ関連はSackが+0.318、Blitzが-0.241、Blitz%とQB Pressuresが+0.215と、あまり高くない。またTotal Air Yards(-0.433)やYAC(-0.216)が逆相関になっているが、これらは2018には正の相関となっていた指標であり、要するにやはり当てにならないデータだ。唯一、Missed Tackles(2019は-0.409)のみが使えそうな指標に思える。
 DADOT(Averagede Depth of Target)という指標もあるが、勝率との相関は2018も19も0.2未満でほぼ無相関。現時点ではディープパスの多寡が勝敗に及ぼす影響はほとんどないと考えられる。DADOTとPressure%との相関も2019は-0.396あるが2018は-0.153にとどまっており、QBへのプレッシャーがディープへのパスを減らす効果は限定的であることが窺える。少ないデータを前提にするのなら、ディープのパスの多寡が勝率に影響するわけでもなさそうだ。
 失点との相関だと2018はSackが-0.390、QB Pressuresが-0.362、Missed Tacklesが+0.325でPressure%が-0.318となっている。2019年になるとパスラッシュ関連の相関度はあまり変わらないが、Total Air Yardsが+0.633、YACが+0.528、Missed Tacklesが+0.465、DADOTが+0.356と高い数字になっており、2018との差がかなり大きい。正直、ここに載っているデータが本当に我々の知りたいことを示しているのかどうか、まだよく分からない。
 要するにパスオフェンス絡みのデータも含め、Advanced Statsが本当にゲームに影響を及ぼすようなデータなのか、もしそうだとしてもではそのデータはどう扱えばいいのか、まだ分からないことが多いというのが個人的な印象だ。ゲームに勝つうえでこれらのデータが定量的にどの程度の重要性を持っているのか、それを理解するにはもっとデータの積み重ねが必要に思える。
スポンサーサイト



コメント

非公開コメント