ATLAS at Anywhere (旧 ATLAS at Osaka)

パ・リーグはセ・リーグより強いのか

今はあまり見る機会がありませんが,子供の頃から野球が好きで,今もプロ野球の結果はチラホラ気にしたりしています。で,今さらなのですが,交流戦の結果を考えてみます。と言っても,世間でよくあるようになぜパ・リーグのほうが強いのかについて勝手に仮説を書くのではなく,本当にパ・リーグのほうが強いのか,統計的優位性がどれくらいあるのかを計算してみました。

ウィキペディアによると,パ・リーグがぼろ勝ちした印象のある今年の交流戦は,パ・リーグから見て61勝44敗(3引き分け)でした。引き分けは省いて勝率を計算すると,0.581+/-0.048です。勝ち負けの話しなので誤差は2項分布を使っています。我々がよく使う表現に従うと,1.7σの有意差です。これだと我々の世界では統計的に有意とは言い難いものがあります。1.7σでは,理論屋でもなかなか論文を書きません。まして,実験屋だったら有意とは思わず,もしかしたら何かあるかもしれないから,統計が増えてどうなるかは気にしておいたほうがいいかな,くらいに考える人が多いと思います。

というわけで,今年だけを振り返って,パ・リーグのほうが強いというのは,少なくとも統計上は厳しいものがありました。

じゃあ,交流戦が始まってからのトータルだとどうなるのか,それもウィキペディアの資料をもとに計算してみました。今まで,パ・リーグの865勝774敗で,その勝率は0.528+/-0.012。今度は2σ越えで,2.3σの統計的有意さです。うーん,これだと微妙です。2σ超えたら何かあるのではないかと考えたくなるのが人情です。やっぱりパ・リーグの方が強いのかなぁという印象になりますね。ちなみに,世間的には今年の結果を見てパ・リーグの方が強いという印象を受けた人が多いのではないかと思いますが,統計的な取り扱いをちゃんとやると,今年だけよりも通算成績のほうがパ・リーグの強さをより如実に示しています。

もし勝率が0.528のまま推移したとすると,3σに到達するには,つまり誤差が0.009まで小さくなるためには,引き分け抜きの試合数が5828試合必要です。これまでに1639試合ありましたから,残り4189試合。1年で今は108試合ありますから,ざっとあと39年ほど交流戦を続けると,3σの有意性でパ・リーグが強いことを示せます。どうでしょうか,統計的有意性を上げるのが難しい,大変だということが少し実感していただけたでしょうか。

ついでに,年間144試合やって順位を決めますが,それがどれくらい統計的に意味のあることなのかも計算してみました。仮に勝率5割とすると,72勝72敗ですので,勝率は0.500+/-0.042になります。誤差0.042を勝ち数(あるいは負け数)に直すと6勝(6敗)です。つまり,78勝66敗あるいは66勝78敗がプラスマイナス1σの範囲になります。6ゲームって大差な気がしますが,144試合終わった時点でも6ゲーム差では統計的有意差をもってどっちのチームが強いかは言えないのです。いやー,やっぱりプロ野球の世界は実力差は紙一重なのですね。

日常 | コメント:2 | トラックバック:0 |
<<訃報 | HOME | ビザ申請>>

この記事のコメント

単純な二項分布でいいのかというのは考えどころ。
各試合の結果は(例えば打席とかの)統計事象の積み重ねなのでそれぞれの試合結果に既に統計エラーはついているとも考えられます。
番狂わせが起こりやすい競技(サッカーとか野球)とそうでない競技(ラグビー、バスケ、テニスなど)ってありますよね。
2015-07-14 Tue 10:52 | URL | 中村@つくば [ 編集]
> 単純な二項分布でいいのかというのは考えどころ。

はい,考えました。プロ野球で,そのチームの平均の強さ(?)
からの乖離を与える要素で大きいのは,有力選手の故障と,
ピッチャーでしょう。なので,たとえば,期待値pが
ピッチャーによって変わる(相手も含めて)ので,
pの違う値の重ね合わせになってしまいます。ガウシアン
だったら再生性があるので気にしなくていいけど,
二項分布だとpが違う時は再生性ないよね。

これを一番気にしたけど,試行回数が多ければ
ポアソンあるいはガウシアンに近づくはずだから,
重ね合わせだと思ってしまおうか,と。
加えて,中村さんも言ってるように,統計事象の
積み重ねを見てるのだから,その結果としての
確率分布は二項分布でいいかと考えた。
あと,ピッチャーによる違いも,後で言うように
偶然性に比べたらそれほど大きな違いではないの
かもしれない。

> 各試合の結果は(例えば打席とかの)統計事象の積み重ねなのでそれぞれの試合結果に既に統計エラーはついているとも考えられます。

これはその通りだけど,その統計事象の積み重ねを見た
結果が二項分布になるのではないでしょうか。
検出効率だっておなじではないですか。
その二項分布がなぜそういう分布になるかを理解しようと
したら,個々の統計事象を理解しなければならないけど。

> 番狂わせが起こりやすい競技(サッカーとか野球)とそうでない競技(ラグビー、バスケ、テニスなど)ってありますよね。

これは,まさに,本文中に書いたことかな。
野球は人間が思ってるよりも遥かに差が小さいので
番狂わせと感じてしまう事象が多いってことなのでは
ないでしょうか。

番狂わせが多いか少ないかと感じる,あるいは,
結果として(真の実力に比べて)勝敗の差が
つきやすいか,つきにくいかの最大の原因は,
ゲームに占める偶然性の多寡ですよね。

中村さんは,私の言う「真の実力」を測ろう,
議論しようとしてるのかもしれないけど,
私が議論してるのは「真の実力」+偶然性の
結果として得られる勝敗から,その「勝ち」に
どれだけの統計的有意性があるか。
その違いがあるように思います。
2015-07-15 Wed 10:19 | URL | ExtraDimension [ 編集]

コメントの投稿















コメント非公開の場合はチェック

この記事のトラックバック

| HOME |