データが示す「史上最高の将軍」

 NFLネタでツイッターを見ていたら、まさかのナポレオンネタに遭遇"https://twitter.com/bburkeESPN/status/939201633011097602"。元ネタはこちら"https://towardsdatascience.com/napoleon-was-the-best-general-ever-and-the-math-proves-it-86efed303eeb"。データを基に歴史上の将軍たちをランキングしてみたという話で、結論は「ナポレオンこそ過去最良の将軍である、数学がそれを証明している」。
 使ったのはSABRmetricsで使われるWAR"https://www.fangraphs.com/library/misc/war/"の概念。ある選手が控えレベルの選手と比べてどのくらい勝ち星を上乗せしたかを示す指標"https://ja.wikipedia.org/wiki/WAR_(野球)"で、例えばMLBのWARランキングはこちら"http://www.espn.com/mlb/war/leaders"のようになっている。
 ただし「将軍WAR」の比較対象は控えレベルではなく平均値のようだ(控え将軍は平均的な成績になると想定している)。比較対象を平均ではなく控えにしているのは重要な意味がある。例えばFootball Outsidersであれば前者をDVOA、後者をDPARあるいはDYARとわざわざ別の指標にしてまとめているほど"http://www.footballoutsiders.com/info/glossary"。だがまあ歴史上の人物が対象なのでそこまで目くじらを立てる必要もないだろう。
 将軍WARの算出に当たってまずデータの収集が必要だが、ここでは安直にWikipediaを使ったそうだ。確かにWikipediaには個々の戦闘に関するデータをボックススコアのようにまとめている部分がある(例えばこちら"https://en.wikipedia.org/wiki/Battle_of_Sekigahara"の右側にあるボックス内のResult、Commanders and Leaders、Strengthなど)。
 続いて戦闘における戦闘員の数を兵種ごとにまとめ、将軍の戦術能力と数的な有利不利とを切り離すよう計算したという。結果、兵の数は地形や技術といった他のファクターに比べてかなり小さな影響しか及ぼさないことが分かったそうだ。ではどんなファクターが影響を及ぼしているのかが知りたくなるところだが、この分析では兵力以外は将軍の能力に帰しているようでそこまで詳細は分からない。
 以上の計算をしたうえで、後は個々の将軍の戦いを抜き出し、それぞれにWARを算出する。例えばナポレオンが勝利したボロディノの戦いについてだが、フランス軍がロシア軍より少し戦力が多かったため「控え将軍」でも51%で勝てたと考える。一方ナポレオンはこの戦いに勝利(つまり100%)を達成しているため、彼のWARは0.49(プラス49%)となる。負けたクトゥーゾフは-0.49だ。
 さてここでナポレオニックマニアとしては異論を述べたくなる。昔、指摘したことがある"https://blogs.yahoo.co.jp/desaixjp/11389961.html"のだが、ボロディノにおける兵力数は最近の研究ではむしろロシア側の方が多かったとされているのだ。ここがWikipediaの問題。誰でも編集できるため実際には最新研究を知らない素人が作っていることが多い。個々の戦闘に関するデータは、実は信頼度の低いものがかなり混ざっていると考えた方がいいだろう。
 もちろん全体の傾向を見る分にはそれなりに参考になるだろうし、そこから一般線形モデルを構築することもできると思う。兵力以外のファクターが実は重要であるという分析にも、それなりの説得力はあるだろう。でも個々の将軍のデータをWikipediaに基づいてランキングするのは、母数が多い(つまり参加した戦闘が多い)将軍たち以外はやめた方がいいように思う。信頼度が下がるからだ。
 幸いWARはプレイ回数の多い選手ほど数字が高く出るデータだ。だからランキングでもトップクラスに名前が出てくる面々は実際に優秀だったと考えていいだろう。そして実際に計算すると圧倒的なトップだったのがナポレオン。彼の将軍WARは+16.679であり、第2位であるカエサル(7.445)の倍以上の数字を叩き出している。43回もの戦闘を行い、38回勝って5回負けたという回数の多さが寄与しているという。勝った戦いのうち17回は数的不利をひっくり返したものであり、敗北は全て数的不利の時だったそうだ。
 リー将軍はナポレオンに次ぐ27回の戦闘を数えているそうだが、おそらく敗北回数がナポレオンよりも多いのだろう(数的不利も多かったと見られる)。アレクサンドロス大王は9戦全勝と勝率だけならずっと高いのだが、回数が少なすぎるためWARは低くなる。
 大半の将軍たちのWAR分布は0を中心とした正規分布となっており、その意味で統計的に扱うことが可能なデータだ。ナポレオンは平均から実に23標準偏差も突出したところにいるのだが、おそらくそれはモデルの問題ではなく彼自身の指揮才能に帰すべきものだろうとここでは結論づけている。逆に評判の割にWARが低いのは上にも述べたリー将軍(-1.89)。彼が優れた戦術家であるという評価に対しては批判的な指摘もある"https://www.washingtonpost.com/news/retropolis/wp/2017/05/19/the-truth-about-confederate-gen-robert-e-lee-he-wasnt-very-good-at-his-job/"が、WARはその説を支持している。
 同じように低評価となっているのが砂漠の狐だ。ロンメルのWARは-1.953とリー将軍のさらに下。彼もまた評判先行タイプの将軍なのだろう。パットンはプラスを維持してはいるものの、+0.9と凡庸な数字にとどまっている。最近の将軍たちの数字が低い理由としては「戦争自体の変化が多数の戦いに個々の将軍が参加することを妨げたため」というのがここの分析だ。
 第二次大戦後の将軍たちでは圧倒的にイスラエル勢が上位に顔を出している。ダヤンが+2.109で全体60位、シャロンが+2.171で58位といった具合だ。数的に不利な状態で多くの戦いを行い、それらに勝ってきたというWARを高める条件がそろっていたのが理由だろう。でも上位陣はやはり古い時代の将軍たちで、例えばハンニバルは+5.519で全体6位、アレクサンドロスは+4.391で10位となっている。

 ランキングの詳細はこちら"https://ethanarsht.github.io/military_rankings/"でチェック可能。驚いたことに全体4位にTakeda Shingen(+6.091)が顔を出しているほか、アレクサンドロスのすぐ下にOda Nobunaga(+4.229)がいたりする。一方、20世紀以降の人物で最も順位が高いのは全体9位のジューコフ(+4.596)。逆に最低評価を受けたのは第一次大戦中のドイツの将軍であるガルヴィッツ(-4.359)だった。
 残念ながらいくつかのデータが欠落していたことが後から分かったそうで、例えばジンギスカンやスブタイといった面々がどの位置にくるかはまだグラフに反映されていない。彼らがナポレオンほど多数の戦闘に参加したとは思えないのでトップが入れ替わる可能性は少ないと思うが、ではどのあたりに位置しているのかというのは確かに知りたいところである。
スポンサーサイト



コメント

No title

けんご
上杉謙信は70戦して2敗のみと良く言われますがこのデータだと戦闘回数が随分少ないですね。戦闘をどの様に定義しているのか気になります。

No title

desaixjp
データに使っているのがwikipediaなので、wikipediaに項目が立てられているものを戦闘と見なしているのでしょう。
おそらく上杉謙信以外にも、細かく調べた戦闘数より少ないデータしかwikipediaにまとめられていない将軍は大勢いると思います。
まあ所詮はwikipediaベース。細かいことを気にするより面白おかしく取り上げた方がいい話なのでしょう。
非公開コメント

トラックバック