生き抜くぜ21世紀

統計?機械学習?っぽいことを書く

検証!日本にとってベストだったコロンビア-ポーランドのスコアはなに?

はじめに

いやーワールドカップ楽しいですね〜

柴崎ヤバい。乾鬼。大迫ポストプレーすごすぎ。こんなに楽しいならワールドカップ3ヶ月に一回くらいやってほしいですね。

ところで、日本-セネガル戦直後のツイッターを見ているとこんな声がちらほらあがっていました。

私の長年のサッカー観戦経験で大体の場合はどっちが正しいのかすぐわかるんですけど、今回はめちゃめちゃ難しかったです。

一体日本にとって一番良い結果はコロンビア-ポーランドが0-0で引き分けることなのでしょうか?それともコロンビアが1-0でポーランドを下すことなのでしょうか?

※サッカーあんまり見ていない人or後世の人へ:以下のような状況下で日本にとって最適なコロンビア-ポーランド戦の結果を探る問題です

※日本は初戦コロンビアに2-1で勝って(死ぬほどびっくりした)二戦目セネガルに2-2で引き分けています(死ぬほど興奮した)

Country Points matches win draw lose 得点 失点 得失点差 反則ポイント
日本 4 2 1 1 0 4 3 +1 -3
セネガル 4 2 1 1 0 4 3 +1 -5
コロンビア 0 1 0 0 1 1 2 -1 -6
ポーランド 0 1 0 0 1 1 2 -1 -1

最強に迷った挙句スコアレスドローがベストかな?と思ってツイートしたら案の定知り合いの先輩からコロンビア1-0ポーランドがベストじゃね?とご意見を頂いてしまいました。

考えていてもキリがないので、適当にモデリングして残り試合を全パターン計算してどっちがベストだったのかを探ってみました。そんな記事です。

検証

前提

  • どのチームの得点も、平均1.4のポアソン分布に従う(後述)
  • 得点の上限は5点
  • 順位決定ルールはFIFA公式ルールブックに準拠(原典探したの褒めてほしい)
  • 終戦はどのチームもカードをもらわない

検証内容

  • コロンビア0-0ポーランドの場合と、コロンビア1-0ポーランドの場合の2ケースについて、どちらのほうが突破確率が高いのかを計算したよ

  • 0-0のケース

Country Points 得点 失点
日本 4 4 3
セネガル 4 4 3
コロンビア 1 1 2
ポーランド 1 1 2
  • 1-0のケース
Country Points 得点 失点
日本 4 4 3
セネガル 4 4 3
コロンビア 3 2 2
ポーランド 0 1 3
  • 具体的には各チームの取りうる点数は0点〜5点の6通りなので、6 ** 4 = 1296通りのパターンにおける日本の順位を全部計算してポアソン分布の同時確率的な確率で掛け算して以下の2点を計算したよ
    • 日本の期待順位
    • 日本のベスト16進出確率(日本が2位以上になる確率)

検証結果

コロンビア0-0ポーランドの場合

  • 日本の期待順位: 1.7404
  • 日本のベスト16進出確率: 82.68 %

コロンビア1-0ポーランドの場合

  • 日本の期待順位:1.7471
  • 日本のベスト16進出確率: 89.58 %

まとめ

  • 期待順位はあんま変わんないけど、ベスト16進出確率がコロンビア1-0ポーランドのほうが7%ほどよい
  • 先輩すいませんでした
  • 以下解説記事です。興味ある人だけ読んでください。上に書いてある内容ほどライトな内容にするつもりです。

解説

てかもう終わったことなんだからさっさといまの状況(コロンビア3-0ポーランド)での日本の突破確率を教えてよ

ごもっとも

  • 日本の期待順位: 1.7965
  • 日本のベスト16進出確率:84.64 %

なんと84.64%の確率で突破できます

結局、両者の違いはどこ?

計算結果だけ見てもようわからんので、コロンビア-ポーランドの試合結果によって日本のベスト16進出が左右されるケースを抜き出してみました

コロンビア0-0ポーランドのとき突破、コロンビア1-0ポーランドのとき敗退

やっぱり1点差負けのときの上がりやすさはスコアレスドローに軍配が上がりますね。

ポーランドの総得点が低いので日本を上回りづらいんですね〜

コロンビア1-0ポーランドのとき突破、コロンビア0-0ポーランドのとき敗退

やっぱりどんだけポーランドにボコされてもセネガルさんがコロンビアさんをボコしてくれればいいという究極の他力本願ができるのがいいですね。

この究極の他力本願ができるからコロンビア1-0ポーランドのほうがいいんですね〜

あと、コロンビアさんがセネガルを鬼ボコしてくれればワンチャンあるのもでかいですね

期待順位があまり変わらないのなんで?

  • 1位になる確率がコロンビア0-0ポーランドのほうがコロンビア1-0ポーランドより圧倒的に高いからです

    • 終戦日本引き分けコロンビア勝ちのケースが前者だと1位後者だと2位なのが主要因ですね
  • コロンビア0-0ポーランドのとき:1位の確率 47.92%

  • コロンビア1-0ポーランドのとき: 1位の確率 35.71%

そう!だからベルギー回避を本気で狙うならコロンビア0-0ポーランドだったんですよ!!

でもこの辺暗算してTwitterでつぶやける人ひとりもいないし人間の限界を感じますよね。計算機の勝利。

ゴール数がポアソン分布とか何いってんの

  • サッカーのゴール数はポアソン分布で表現できるらしいですのでそれに従いました

gri.jp

  • 平均ゴールはなんか今回のワールドカップ予選の1試合あたりのゴールが2.8だって見たんで1チーム当たり1.4と考えました

  • 実際、対戦しているチーム同士の得点確率は独立なのかって言うと微妙かとは思いますが今回は強い気持ちで独立と仮定してモデリングしました

おわりに

世の中には以下のような記事があり、85%は迷信!みたいに言われています

news.livedoor.com

クラスのスクールカースト高いっぽい奴らが85%の話題で盛り上がってるとするじゃないですか?

そんなとき、このブログを有効活用して「いや、得点が平均値1.4のポアソン分布に分布すると仮定して突破期待値計算すると84.64%って出てくるんだよ、だから意外と85%ってのは的を射た数字なんじゃないかなって思うぜ。まあおれのプログラミング能力ならこの程度の計算一晩で余裕だったけどな」とキメればめちゃめちゃキモがられてスクールカースト最底辺待ったなしなのでみなさんもぜひためしてみてください。以上です。