11
プププププププププププププププププ プププププププププププププ プププププププププププププププ 2014-07-02 ププププ

プロ野球チームのセントラルリーグの年間順位と総得失点の関係の相関係数と重相関係数による考察

Embed Size (px)

DESCRIPTION

プロ野球のセリーグの年間総得点、総失点と年間順位の関係を相関係数、重相関係数により関係を数量的に捉えるにはどうしたら良いかを考える。ここで示される考え方は、一般的な変数の間の数量的な把握をどうすれば良いかに適用することが出来る。

Citation preview

Page 1: プロ野球チームのセントラルリーグの年間順位と総得失点の関係の相関係数と重相関係数による考察

プロ野球チームのセントラルリーグの

年間順位と総得失点の関係の相関係数と重相関係数による考察

2014-07-02 下野寿之

Page 2: プロ野球チームのセントラルリーグの年間順位と総得失点の関係の相関係数と重相関係数による考察

参照したデータ :「日本プロ野球記録大百科 2004 」

1954 年 -61 年 , 69 年 -89 年 , 94 年 , 96 年の31 カ年は、プロ野球のセントラルリーグで6 球団が年間に 130 試合行っている。

これらの年の 6 球団の、以下の変数に着目した。

1. 年間順位 2. 年間の総得点 ( 各戦いの自チームの得点の総和 ) 3. 年間の総失点 ( 各戦いで対戦相手の得点の総和 )

[ 観点 ]◎ 優勝する球団は得点は大きく失点は小さいはず◎ そういう関係は “数量” の観点でどう理解できるか ?

Page 3: プロ野球チームのセントラルリーグの年間順位と総得失点の関係の相関係数と重相関係数による考察

年間総得点と年間順位の関係

相関係数は -0.419..年間の得点が多いほど順位は上がり優勝に近づく

Page 4: プロ野球チームのセントラルリーグの年間順位と総得失点の関係の相関係数と重相関係数による考察

年間総失点と年間順位の関係

相関係数は +0.471..年間の失点が少ないほど順位は上がり優勝に近づく

Page 5: プロ野球チームのセントラルリーグの年間順位と総得失点の関係の相関係数と重相関係数による考察

総得点 (x) と総失点 (y) の関係

相関係数は +0.423..( 得点と失点は正に相関する )

Page 6: プロ野球チームのセントラルリーグの年間順位と総得失点の関係の相関係数と重相関係数による考察

順位を総得点と総失点で重回帰

重相関係数は 0.828..◎ 目的変数 ( 順位 ) は 2 個の説明変数を用いることで 予測精度が上がった。◎ これらの数量の関係をどう理解したら良いだろうか ??

Page 7: プロ野球チームのセントラルリーグの年間順位と総得失点の関係の相関係数と重相関係数による考察

数量の関係をどう理解したら良いだろうか ??

• 実は、難しい数式を経由しなくても、重相関係数などは作図で求めることができる。

• 楕円を描く方法と、球面三角形を描く方法がある。• 重回帰の幾何的な表現により、把握が容易になる。

( この後で述べる方法を広く普及させたい !)

• 重回帰に関係するいろいろな現象の理解を俯瞰的に与えることが出来る。

• 既にある多変量に関係する理論を分かりやすく再構築する可能性がある。

• 新たな理論を導く可能性もある。

Page 8: プロ野球チームのセントラルリーグの年間順位と総得失点の関係の相関係数と重相関係数による考察

重相関係数は楕円の作図で求まる

説明変数間 ( 総得点と総失点 ) の相関係数 ρ に応じて、 x=±1,y=±1 に囲まれた正方形に 4 点 (±ρ, ±1), (±1, ±ρ) で内接する楕円を描く。そして、説明変数たちに対する目的変数 ( 年間順位 ) への相関係数の組 (ρ1,ρ2) に対応する点に打点する。図において 2 個の楕円の相似比が、重相関係数に等しい。 ( 原点から補助線を図のように引くか、同心・同方向・相似な楕円を打点を通るように描く。 )

決定係数は楕円の面積比となる。なお、高次元への拡張は容易。さらにある工夫をすることで偏相関係数を求めることも可能。

Page 9: プロ野球チームのセントラルリーグの年間順位と総得失点の関係の相関係数と重相関係数による考察

重相関係数は球面三角形の作図で考えることもできる

便宜上ここでは得点を -1 倍する。 3 変数 ( 順位、得点、失点 ) の間の相関係数が、球面三角形 X1X2Y の辺の長さ (65°,62°,(59+55)°) の cos( 余弦 ) に一致するようにする。球面三角形の頂点がそれぞれの変数に対応している。目的変数に対応する頂点から、対辺へ垂線を伸ばしたときの、垂線の長さ (34°) の cos が重相関係数に等しい。 ( なお、球面三角形の内角の cos は (3 個考えられる ) 偏相関係数と一致する。 )

ちなみに全体像はこうなる

Page 10: プロ野球チームのセントラルリーグの年間順位と総得失点の関係の相関係数と重相関係数による考察

まとめ• プロ野球の年間順位、総得点、総失点の数量的な関係を幾

何的に捉えることが可能となった。• 同様に野球やスポーツのさまざまな数量の関係を幾何的な

作図の概念で、把握して予測精度の考察も可能。• スポーツに限らない。

[ 数理的なこと ]• 重相関係数などの重回帰の結果は、楕円か球面三角形の作図で求まる。

( 偏回帰係数も標準化偏回帰係数もこの方法をさらに少し工夫すると求まる。 )

• 説明変数 3 個以上への拡張も容易。• 重回帰に関係するいろいろな現象の理解を俯瞰的に与えると考えられる。• ( 共分散構造分析でどんな時に標準化偏回帰係数の絶対値が 1 を超える時が

あるのか、欠測などで相関行列の正定値値がどのように崩れるか俯瞰できる。 )

Page 11: プロ野球チームのセントラルリーグの年間順位と総得失点の関係の相関係数と重相関係数による考察

補足• 相関係数それ自体も、楕円と対応させて考えることが可能。

( 相関係数 ρ に応じて、 x=±1,y=±1 に囲まれた正方形に 4 点 (±ρ, ±1), (±1, ±ρ) で内接する楕円 )

• どうやら、外れ値を含まないという条件下で、相関係数はとてもロバストのようだ(単調関数による変数変換 (歪み ) を加えてもほとんど相関係数に影響を与えることは少ない ) 。

• 理論的考察を加えることで、単純だが未知の知見を数多く得られる可能性を大いに秘めている。

2次元正規分布で相関係数が 0.4, 0.5のそれぞれの場合に 5000 点抽出した様子