勝利の可能性

 今回のSuper BowlでWin Probabilityを見直すべきではないかという声が出ている。Win ProbabilityはESPNのツイッターが出している"https://twitter.com/ESPNStatsInfo/status/828459362737852416"ものがあり、またPro-Football-Referenceも算出している"http://www.pro-football-reference.com/boxscores/201702050atl.htm"。試合の途中時点における点差やシチュエーションから、そのゲームで最終的に勝利する確率がどの程度あるかを示すものだ。
 この手法を最初にNFLに適用したのは確かBrian Burkeだったと記憶している。彼がAdvanced Football Analytics"http://www.advancedfootballanalytics.com/"(当初はAdvanced NFL Statsという名称だった)でWin Probabilityの算出を始めたのはおそらく2008年から。その際には2000-2007年の実績に基づいて勝利確率を算出したという"http://archive.advancedfootballanalytics.com/2008/08/win-probability.html"。
 BurkeがESPNに入って以後、Advanced Football Analyticsの更新は止まっているが、引き続きESPNでもこの指標の算出を続けていることは彼のツイート"https://twitter.com/bburkeESPN"を見てもわかる。Pro-Football-Referenceが算出を始めたのはもっと後だと思うが、具体的にいつのデータを使ってこの確率を算出しているのかは分からない。

 Win Probabilityに関する疑問は、単に「Atlantaの勝利確率99%以上といいながら実際にはNew Englandが勝ったじゃないか」という結果論からの否定ではない。いやそういうことを言う人もいるんだが、そうではなくもう少し真面目に調べ、議論している人がいる。この記事"http://thebiglead.com/2017/02/08/win-probability-for-nfl-games-needs-to-be-re-assessed-risks-being-marginalized/"がそうだ。
 筆者は2016シーズンのプレイオフ出場チームが絡んだ試合について、第4Q残り10分で算出されたWin Probabilityと試合結果を調べたそうだ。対象173試合のうち、実に110試合では91%以上のWin Probabilityが記録されていた。そこから期待できる勝利数は108勝であり、要するに2試合以外は全部有利だった方が勝つと予想されていたのだが、実際に勝てたのは102試合。Win Probabilityが予想していた勝利確率98.2%に対し、実際の勝利確率は92.7%にとどまった。
 この傾向は、もっと低いWin Probabilityを出していた試合でも同じ。いずれの場合も予想された勝利確率より実際の勝利確率の方が必ず低くなった。どうもリードしている側が勝つ確率をおよそ5~6%ほど高めに算出しているらしい。それでも全体的には正しい予想を示しているとは言えるものの、誤差というには一方への偏りが目立ちすぎる。
 実際、91%以上の数値が出ながらも最終的に逆転された試合を見ると、確かに17点差や11点差を追っていたゲームがある一方で、7点差や中には5点差だったにもかかわらずこれだけ高いWin Probabilityが算出されたゲームもあったそうだ。いくら何でも高すぎる、という批判を浴びても仕方ない例が今シーズン中に既に存在していたわけだ。
 なぜそうなるのか。筆者はWin Probabilityのモデルが過去の出来事に依存しているのが理由ではないかと見ている。NFLでは21世紀に入り、特にパスオフェンスの効率性が随分と高くなっている。その結果として短時間で得点を取る能力も高まっており、それがゲーム終盤の逆転が起きる可能性を引き上げているのではないか、という理屈だ。実際、2015-16シーズンには1ドライブ差で追っているチームがラスト2分に70個のTDを取っているが、10年前の2005-06シーズンのこの数値は40だった。
 もしBurkeが2000-07ではなく2009-16のデータを使ってWin Probabilityを算出するようにしていたなら、現在よりも小さい勝利確率が示されていたかもしれない。それでも文句をつける連中はいると思うが、少なくともデータを調べて「高すぎる」という批判を浴びることはなかったかもしれない。もちろんそれでもブレは生じるはずだが、一方的にどちらかに偏るような誤差は出てこなかったと見られる。

 一方こちらの記事"https://t.co/kJAMvMiMhh"では、実際にWin Probabilityを算出している面々に話を聞いている。彼らも最近の風向きが変わっていることには当然気づいており、「パスハッピー時代以前のデータは少しばかり時代遅れ」だと見ている。4ドライブ差はとても安全なリードではあるが、10年前に比べれは安全度は劣る、というわけだ。
 BurkeによればYards per pass attemptは2010年の6.2から6.4へと上昇したという。たった0.2ヤードと思うかもしれないが、1シーズン通じて考えると多大な影響を及ぼす。チームがより容易に前進できるようになれば「ポールポゼッションがより重要になる一方でフィールドポジションはより重要でなくなる」というのが彼の分析だ。
 でも彼はWin Probabilityそのものを捨てる必要はないとしている。一部の極端な事例のみに反応するのではなく、あらゆる逆転劇をデータに取り入れて修正していけばいいという判断だろう。つまり、今後もWin Probabilityを算出するためには常にデータを更新し続けなければならないわけだ。それを怠るとすぐ実態から離れた数値が算出されるようになりかねない。ビッグデータの時代ってのは、何かと忙しい時代なのかもしれない。
スポンサーサイト



コメント

非公開コメント

トラックバック