NFLの遺伝子型

 前回紹介した「格差の世界経済史」"http://www.amazon.co.jp/dp/4822250903"の中で使われている遺伝子型と表現型というのはうまい表現だ。実際、そうした面は格差問題以外にもみられるだろう。そこで具体例としてNFLのチーム成績を調べてみた。

 対象とするのは2002シーズン以降の各チームの勝率。これが「表現型」である。この表現型同士、つまり前シーズンの勝率と今シーズンの勝率の相関係数は+0.307になる。
 表現型はチーム本来の実力を示す「遺伝子型」にランダム要素が加わったものである。ランダム性を打ち消すには母数を増やす方法があり、要するに1シーズンの試合数が増えればそれだけランダム性が消えるはず。だがNFLでは1シーズン16試合で決まっている。そこで社会的流動性を調べるうえで親だけでなく祖父や曾祖父のデータを組み入れるように、比較するシーズン数を増やしてみる。
 nシーズンの勝率を、n-1及びn-2シーズンの合計勝率と比べてみよう。すると相関係数は+0.384となり、n-1のみの時に比べて大きく上昇する。試合数を増やすことでランダム要素が減った効果だろう。もちろん一方で複数シーズンにまたがればその間にチーム自体(つまり遺伝子型そのもの)が変化することによる影響も受けるはずだが、相関係数が上昇した点を見る限りランダム要素削減効果の方が大きいように思える。
 さらにシーズン数を増やそう。nシーズンとn-1からn-3までの累計勝率の相関係数は+0.395、n-1からn-4までとの相関係数は+0.399となる。過去5年の累計勝率だと+0.384だ。ここまで伸ばすと選手構成の変化などチームの遺伝子型そのものの変化による影響の方がランダム要素より大きくなってしまうようだ。
 結論として、2002シーズン以降のNFLにおいては過去3~4年の勝率が最も相関係数が高いということになった。つまり2015シーズンの成績を予想したければ12~14、あるいは11~14シーズンの勝率を見るのが一番いいのだ。
 12~14シーズンならAFCではDenver、New England、Indianapolis、Cincinnati、Baltimore、Pittsburghが、NFCならSeattle、Green BayとSan Francisco、Dallas、Carolina、Arizonaが上位に並ぶ。11~14シーズンならAFCはNew England、Denver、Cincinnati、Baltimore、Pittsburgh、Indianapolisと順番が入れ替わるだけで、NFCはGreen Bay、San Francisco、Seattle、New Orleans、Dallas、Arizonaと1チームだけ交代する。
 このデータはFOA2015で紹介したものと比べ、AFCは1チーム違うだけだが、NFCでは3~4チーム異なっている。NFCの方が流動性が高いと予想されているわけだ。

 とはいえ相関係数はせいぜい0.4弱。弱い相関にとどまっている(ちなみに相関の強さ弱さについてはこちら"http://tarotan.hatenablog.com/entry/2015/08/16/222137"が面白い)。過去の勝率は参考にはなるだろうが、決定的要因とまでは言えない。少なくとも社会的流動性よりはNFLチームの成績の方が流動性は高そうだ。
スポンサーサイト



コメント

非公開コメント

トラックバック