パワーランキング1

 シーズンも半ばに達したところで、序盤にやったNFLパワーランキング分析をもう一度やってみよう。これだけ試合数が増えればパワーランキングに必要な材料も増えてきただろうし。
 分析に際しては各種のパワーランキングを大きく3種類に分けて検討する。一つは各メディアのサイトに掲載されているランキングで、評論家や記者などが「専門知識を生かして」作っているランキングだ。これを専門家ランキングと呼ぶ。具体的にはESPN、FOX、CBS、NBC、Pro Football Weekly、USA Today、Yahoo、Sports Illustrated(Dr.Z)の8種類を対象にし、その平均を取る。New Englandは全てのランキングでトップなので「専門家ランク」は1位、Miamiは4つのランキングで31位、残り4つで32位なので「専門家ランク」は31.5位となる。
 次は「ギークランキング」だ。スタッツや様々なデータを一定のルールに基づいて処理したランキングを出している連中のランキングが対象。米国ではスポーツは賭けの対象になっており、両チームの実力をできるだけ正確に測る必要があるため、こうしたデータに基づくランキングもたくさん出ている("http://www.nutshellsports.com/wilson/nfl.html"参照)。
 専門家ランキングと数を合わせるため、Football Outsiders(DVOAとWeighted DVOAの平均)、Beatpath、Bud Goode(Killer StatsとKiller Stats IIの平均)、Aikman Efficiency Ratings、USA Todayにデータを提供しているJeff Sagarin、上のリンク集を作ったサイトに敬意を表してRay Waits、日本代表で「チャージャーズとパドレスを応援するBlog」(ドライブ結果ランキングと真の実力ランキングの平均)、そして最もシンプルなランキングとして私が使っている総得点/総失点の8種類を選んだ。かなり恣意的な選択なので、あくまで参考程度に考えておいてもらう方がいいかもしれない。
 最後は「ファンランキング」だ。NBCのランキングサイトにはファン投票の結果をあわせて算出されたFan Power Rankingsなるものが載っている。専門家でもスタッツギークでもない、普通のファンが各チームの力をどう見ているかを知るために、このランキングも活用する。
 調べたいのは専門家、ギーク、ファンのそれぞれが出すランキングにはどのような特徴があるか、という点。そのためには各ランキング相互の比較をする前に、何か基準になる指標がほしい。そこで「基準ランキング」を設定する。単に勝率順に並べたランキングであり、同じ勝率のチームは順位の平均値を取る。具体的には7勝1敗のIndy、Green Bay、Dallasの「基準ランキング」は(2位+3位+4位)/3の「3位」に、0勝8敗のMiamiとSt.Louisは(31位+32位)/2の「31.5位」になる。
 実際に比較をする前に予想もしてみた。基準ランキングと最も似たものになるのはおそらく「専門家ランキング」、最もかけ離れるのは「ギークランキング」、そして両者の中間が「ファンランキング」。果たしてこの予想は正しいだろうか。

 各ランキング間の相似度を調べる方法は色々あるだろうが、ここでは単純なやり方をする。二つのランキングで同じチーム同士のランクを比較し、その差の絶対値を出す。そして32チーム分の絶対値の平均を算出すれば、二つのランキングがどの程度似ているか分かるだろう。
 結果、私の予想した通りの結果が出た。専門家ランキングと基準ランキングの「平均順位差絶対値」は1.01。ほとんど基準ランキングと変わらないのである。一方、ギークランキングと基準ランキングの間ではこの数値は3.09へ拡大する。ファンランキングと基準ランキングだと2.34でやはり両者の中間になった。
 基準ランキングと専門家ランキングの相似ぶりはちょっと異常なほどだ。32チーム中20チームは差が1未満にとどまっており、ファンランキング(12チーム)やギークランキング(8チーム)に比べてかなり多い。専門家と基準の間で最も差が大きかったのは3.63。ファンと基準の間の8.5、ギークと基準の間の13と比べればこれまた似すぎていると言える。
 個別の専門家はもっと大胆な予想をしているが、平均値ではそれが互いに打ち消しあって基準ランキング(つまり単なる勝率順)と似てしまったと考えることもできるが、中身を詳しく調べてみるとその可能性もないことが分かる。専門家8人のランキングの標準偏差を32チーム分算出し、その平均を出すと1.44。ギークランキングで同じことをすればこの数値は2.99。ギークランキングに比べ、個別チームの順位がほとんどばらついていないのが専門家ランキングなのだ。
 各メディアサイトが掲載しているパワーランキングは、専門家の目で分析、判断した結果が載せられているという建前になっている(のだろう)。知識と経験がそのランキングの裏づけにある、と一般には思われている。だがその実態は、単に勝率順に並べたランキングを少し修正したものに過ぎないことがこれで分かってしまった。
 勝率順にチームを並べるのに専門家は必要ない。表計算ソフトで十分だ。なのになぜ各メディアサイトはパワーランキングなるものをわざわざ載せているのだろうか。需要があるから、と考えるしかない。実際、現地のファンのblogなどを見ると、応援しているチームが各サイトのランキングでどの順位にあるかをわざわざ抜き出して並べているところもある。ランキングが一定の視聴率(という表現がいいのかどうか不明だが)を得られるからこそ、メディア側もわざわざランキングを提供するのだろう。
 しかし「需要がある」と言うだけでは、専門家が勝率順とほぼ等しいランキングを提供している理由を説明することにはならない。自分の知識や経験を生かして(あるいは独断と偏見に従って)もっと大胆なランキングを出してもいい筈である。なのに専門家はそれをしない。おそらく、主観で作ったランキングについては十分な説明責任を果たすのが難しいからだろう。「このチームは強そうに見えた」と言っても視聴者は納得しない。「実際に勝率が高いのだからこのチームは強いのだ」と言えば、一応説明にはなる。
 いや、もっと言うなら、そもそも主要メディアのランキングに興味がある人間は、勝率からかけ離れたランキングなど求めていないのではないかとすら思える。かつてFOXがFootball Outsidersのランキングをそのまま自分たちのランキングとして掲載していた時期があったが、ファンの猛烈なリアクションのためか、彼らは短期間でそのやり方を取りやめてしまった。ファンの反応は「これだけ勝率が高いのになぜこんなに順位が低いのだ」という批判が大半。私のように、勝率順とほとんど同じランキングなど見るに値しないと考える人間は、どうやら少数派らしい。客商売であるメディアサイトは、多数派の客に媚びるランキングを今でもせっせと生産し続けている。

 専門家による「知識と経験」という名の主観で作られている(建前)専門家ランキングに対し、ギークランキングは色々なデータを決まった方法で処理し、出てきた結果をそのまま当てはめて作っている。基礎となるデータは基本的にリーグの出している公式のものが使われており、そこに主観の入る余地はない。
 主観が入らないということは、ランキングに対する説明がしやすいことを意味する。こういうデータを基にこういうやり方で計算したからこうなったと言えば、なぜそんな順位になったかも分かる。「勝率が高いのに云々」という批判に対して主観に基づくランキングだと説明が難しく、しばしば水掛け論になってしまいがちだが、ギークランキングなら数式を示せばいい。その数式で出したランキングが、どれだけ将来予想の役に立つかを経験則から立証すれば、なぜそんな数式を使うのかも説明できる。簡単だ。
 実際に「簡単だ」と思うのは、自分でそうした数式を作っているようなギークたちが中心。普通のファンの場合は、複雑な数式が出てきた時点で「自分は騙されている」という不信感が募るようだ。そのせいか、ギークランキングの大半は個人サイトに掲載されており、メーンストリームに顔を出すことは滅多にない。出てきても FOXがそうだったようにリアクションの大きさで排除されてしまうこともある(現在、Football OutsidersはランキングをFOXでなくAOLに載せている)。
 ギークランキング相互間で大きな差が出てくることも、普通のファンが不信感を募らせる一因になっている。上にも記した通り、ギークランキングでは各チームの順位のばらつきが大きい。標準偏差が最も大きかったWashington(5.66)の場合、高い評価だと7位、低い評価なら25位とえらい差が生じている。ギークたちにはそれぞれ言い分があるのだろうが、彼らが注目する指標が一致することはあり得ないし、その結果としてランキングのばらつきが大きくなるのはおそらく避けられない。主観で作るランキングなら横を睨みながらの調整も可能だが、ギークランキングはそうした融通が利かないのだ。
 結果としてギークランキングは勝率順(やそれに準じた専門家ランキング)と比べても、あるいはギークランキング相互を比べても、互いに不協和音を大量発生させるようなものになりがちである。予定調和が好きな人間にとってはこれは我慢ならない事態だろう。結果として大多数のファンはギークランキングを好まず、一部の好事家が自分で作ったり他人のを見て喜んだりしているにとどまる。

 話が長くなったので以下次回。

スポンサーサイト



コメント

非公開コメント

トラックバック