2017/07/06

はじめまして。ライターの湯浅です。現在、大学院でデジタルジャーナリズムを学んでいます。
私はスポーツ全般を鑑賞することが好きなのですが、特に昔から野球が好きでした。みなさんにとって、今年のプロ野球はどんな1年でしたか?
セ・リーグは今年も巨人がリーグ優勝を成し遂げました。しかし、クライマックスシリーズ(CS)では阪神が巨人相手に4連勝。阪神は交流戦において12球団中11位という結果を残していたため、前半戦からはまったく予想だにしない日本シリーズ進出です。
パ・リーグはソフトバンクがリーグ優勝でした。振り返ってみると、去年Aクラスだった楽天、西武、ロッテがBクラスに。Bクラスだったオリックス、ソフトバンク、日ハムがAクラスを奪還するという史上初めてのシーズンとなりました。
日本シリーズもソフトバンクが対戦成績を4勝1敗と、呆気無く阪神を破って、日本一を遂げました。ちなみに私は西武ファンなので、ぐぬぬ…という苦虫を噛み潰したような思いをした1年でした。
*本記事は「XICA-Labs データ・統計分析研究所」からの寄稿記事を、ビッグデータマガジンで一部編集してご紹介しております。
■肌感覚として感じた年俸格差
ある日のこと、各球団の年俸をぽかーんと眺めていました。そこで「一番年俸が高い選手はかなり高額な年俸をもらっていて、年俸が低い選手と比べるとかなりの年俸格差があるのではないだろうか」ということを思いました。これはきちんとデータを見てみようと決心し、12球団の選手の年俸を分析してみました。
今回のデータはプロ野球データFreak様の年俸データを参考にしました(一部途中加入選手などはスポーツ紙などから年俸を確認した上で反映)。ちなみに契約更改時にテレビなどの媒体で放送されている金額は推定であります。
■浮き彫りになる差
まず始めに、全球団の選手の年俸を分布し、平均値と中央値の説明を加えながら、セ・パ両リーグの平均値と中央値はどこに位置するのかを見てみましょう。
平均値とは観測した値を全て足して、観測数nで割ったものです。例えば、セ・リーグには389名の選手がいます。その年俸合計は約153億円になります。この平均値は3926万円になります。
今度は中央値です。中央値とは、下から並べたときに、ちょうど中央に来る値のことをいいます。これを同じようにセ・リーグで計算してみますと中央値は1200万円となります。
同じようにパ・リーグもやってみましょう。パ・リーグは選手の人数合計が439名で、全て足した年俸合計は約167億円になります。平均値は3803万円になります。中央値は1500万円となります。
全12球団の平均と中央値を算出すると、平均値は3861万円、中央値は1400万円になります。
セ・パ全選手の年俸と全球団の平均と中央値をグラフで表すと以下のようなグラフになります。

このグラフからだけでも上の選手と下の選手間での年俸格差が見て取れ、いかに偏りが多いかがよく分かりますね。では、具体的に各球団でどのぐらい差があるかをみていきましょう。
■どの球団も平均の給与額は一番年俸が高い選手の20%にも及ばず
より細かい分析してみました。
一番年俸が高い選手を100%とした場合の平均と中央値の分布

球団で一番年俸が高い選手を100%とした際、平均値は9.3%〜17.2%にしか及びません。
中央値をみてみましょう。さきほどと同じように球団で一番年俸が高い選手と比較をすると、平均値からさらに下がり、各球団で一番年俸が高い選手を100%とした際の2.4%〜8.6%にしかなりませんでした。
巨人を例にしてみましょう。阿部慎之助選手が球団で一番年俸が高い選手なので、阿部選手の6億円を100%とします。巨人(合計80人)の選手の平均年俸は5912万円になります。これは6億円の9.85%です。次に中央値です。巨人の中央値は1450万円なので、これは阿部選手の2.42%にしか及びません。球団で一番年俸が高い選手から見ると、年俸格差が起きていることが読み取れます。
年俸格差が起きていることがわかったところで、今度は突出して年俸が高い選手がいる場合の傾向に関して仮説を立てて探ってみました。その仮説は、一番年俸が高い選手は球団の半数の選手の合計を越えるというものです。その検証を行ってみました。
わかりやすくするために、再び例をあげてみましょう。
巨人における中央値以下の選手の年俸合計は約2億7000万円です。球団で一番年俸が高い選手は前にも登場した阿部慎之助選手で6億円です。つまり、阿部選手個人の方が上ということになります。(阿部選手の6億円は日本球界の中では異常値な数字であることは間違いないでしょう。一番最初に示した分布でもそれが明確に示されています。)
逆のパターンです。ロッテは中央値以下の選手年俸合計は約3億1000万円。球団で一番年俸が高い選手は涌井秀章選手で、2億2000万円です。つまり、個人が下ということになります。
結果をまとめてみると


個人が上:巨人、阪神、中日、ソフトバンク、西武、楽天
個人が下:広島、横浜、ヤクルト、オリックス、日ハム、ロッテ
になりました。
偶然ですが、綺麗に6:6でわかれています。上と下のチームの傾向を検証したところ、年俸の中央値が高いチームから中央値が低いチームへと順序付けられ、中央値が高いチームは個人が下、逆に中央値が低いチームは個人が上になるという傾向が明らかになりました。
これは、非常に単純で中央値が高いチームは中央値以下の選手をまとめて足すと大きな数字になり、尚かつ年俸が一番高い選手が3億円以下の低額な年俸を提示している場合が多いので個人が下になりやすくなります。逆に、中央値が低いとそれをまとめて足しても大きな数字にはなりにくいものの、年俸が一番高い選手に3億円以上の高額な年俸を提示している場合が多いので個人が上になりやすいという結果に帰結します。
■一番年俸が高い選手は球団の合計年俸の何%を占めているのか?
平均値は一番年俸が高い選手の20%にも及ばないということを書きましたが、では、球団で一番年俸が高い選手は球団の合計年俸の何%を占めているのでしょうか?
結果は、8.55%(ヤクルト)〜15.26%(西武)でした。ヤクルトは球団合計が約23億円で、トップはバレンティン選手で2億円。西武も球団合計が約23億円ですが、トップは中村剛也選手で3億5000万円なので、大きく開きました。


ここまでみてきた平均と中央値から考えると、トップ選手たちは1人で平均と中央値の%に肉薄するような数字が出てきていますね。
いかがだったでしょうか?皆さんが大方予想されていた通りであったかもしれないですね。しかし、ここまで格差があることまで想像できましたか?改めてビジュアライゼーションして、見直してみると自分が想像していたよりも一番年俸が高い選手と平均と中央値を比較した場合の結果が離れていることに私自身驚きました。また、改めて、平均はケースによって「真ん中にくる値」ではないということを肝に銘じ、惑わされないようにしないといけませんね。
記述統計だけで、だれでも知っているデータの整理の仕方でプロ野球年俸データを整理してみました。今回はこのような切り口で紹介しましたが、もちろんこれ以外にも違う切り口はたくさんあります。
今年の冬もまた契約更改は行われます。ぜひ、今回の記事を参考にしながら、契約更改のニュースを見ていただくとより違った見方ができるやもしれません。
【寄稿サイト情報】
統計解析の専門知識を必要とせず重回帰分析を行うことができる、統計分析webサービス「xica adelie (サイカ アデリー)」を開発・提供する株式会社サイカ協力のもと、ビッグデータマガジンでは統計に関する情報を同社運営サイト「XICA-Labs」より提供しております。