<通常、景気の悪いときには失業率が上昇し、平均時給は低下する──しかし、2020年4月に米国労働省が公表した雇用統計では、いずれも上昇するというイレギュラーが起こった。この現象を、統計学のトリックを使って読み解く> 「感染者数は指数関数的に増加している」「実効再生産数が1を上回った」──新型コロナウイルス感染症をめぐる日々の報道により、これまでの日常生活で聞かれなかった専門用語や情報を耳にする機会が増えた。 指数関数(y=aのx乗)のように1つの変数(x)に対してもう1つの変数(y)が飛躍的に変化していくことを「指数関数的」と表現するが、コロナ感染者数の増加は理論的には指数関数で表すことができるためこのように表現される。また、1人の感染者が平均して何人に感染を広げるかを示す数値のことを「実効再生産数」といい、感染者数増加の勢いを決める重要な数値である。そうした言葉の背後には感染拡大の勢いを予測するための数式があり、それをもとにして専門家たちが対策を講じている。 感染症対策の例に限らず、現代社会のあらゆる事象を数学思考で考えることができる。 テクノロジーの発達は膨大なデータの収集とその分析を可能にしたが、データや分析結果をどう解釈しビジネスへ活用するかの判断は今なお人に委ねられている部分だ。今後AI技術が発展してもビジネスの世界での数学理解の必要性は変わらないどころか、ますます重要になると言っても過言ではない。 『数学独習法』(講談社現代新書)を上梓した冨島佑允氏は、大多数のビジネスマンに必要なのは全体感の理解であって、複雑な方程式を解く力や計算能力ではないと述べる。 金融の世界で数学を駆使してビッグデータを扱う著者に、数学嫌いで避けてきた文系編集者が何度もわかるまで聞いてつくったのが、大人のための数学入門書である本書だ。この本で紹介される4つの分野(代数学、幾何学、微積分学、統計学)から、物事の傾向を大きな視点でとらえるために必要な統計学について一部抜粋し、掲載する。 (編集部注:記事化にあたって、一部本文に変更を加えています) ◇ ◇ ◇ 統計学で世の中を掘り下げる 平均年収、平均労働時間、平均寿命など、いろいろなものの平均値が新聞などで取り上げられ、社会の動向を表す目安の数字として扱われています。平均値は簡単なようでいて意外と奥が深いため、平均値についての思考を掘り下げれば、世の中の出来事をより深く理解することにつながります。 例として、新型コロナウイルスの感染拡大によって起きた不思議な現象について紹介したいと思います。 『数学独習法』(講談社現代新書)259ページより 図5-8にあるように、米国労働省が毎月公表している雇用統計では、米国での感染拡大を受けて2020年4月に失業率が急上昇しました。一方、労働者の平均時給の前月比増減率を見てみると、こちらも4月に急上昇しています。通常、景気の悪いときは失業率が上昇する一方で平均時給は低下し、景気の良いときは逆のことが起きるのですが、このケースはそのどちらにも当てはまらず、失業率と平均時給が共に上昇しています。何が起きていたと思いますか? ===== この統計の動きには、平均値のトリックが隠されています。分かりやすくするために、労働者がA~Eさんの5人だけしかいない状況で考えてみましょう。平均値は、「データをすべて足したものをデータの個数(=統計学ではサンプルサイズと呼ぶ)で割った値」です。よって、A~Eさんの時給が表5-9の通りとすれば、平均時給は、全員分の時給を足して人数で割れば出てきます。つまり、次の計算により平均時給は2740円であることが分かります。 それでは、Aさん、Bさんが解雇されて失業中の場合、平均時給はどうなるでしょうか? AさんとBさんはそもそも働いていないので、「労働者の平均時給」の計算からは除外されます。その結果、時給の高いC~Eさんだけで平均を取ることになるので、平均時給は4167円と大幅に上昇します。 『数学独習法』(講談社現代新書)260ページより これと同じことが、2020年4月の米国で起きていました。新型コロナウイルスの急速な感染拡大によって社会活動が大幅に制限されるなか、ホワイトカラーは在宅勤務への移行が進みましたが、接客が必須なレストラン従業員など低賃金の労働者は大量解雇されました。職を失うことで低賃金の労働者が平均値の計算から外れたため、平均時給が伸びたのです。低賃金の労働者がかつてない規模で大量解雇されたことにより、失業率と平均時給の急上昇が同時に起こったのでした。このように、統計学が脳にインストールされていれば、数字の裏に隠れた世の中の動きをとらえることができます。そして、政府やマスコミの出す数字を自ら検証することもできるのです。 平均は本当に"平均的な姿"なのか ただし、平均値は万能ではないという点も知っておく必要があります。例として、よくニュース等で話題になる労働者の所得について取り上げたいと思います。所得とは、収入から経費を引いた数字(サラリーマンの場合は、みなし経費が"給与所得控除"という名目で引かれる)のことで、つまりは税金を払う前の儲けのことです。単純に考えると、全国民の平均所得が「最も典型的な労働者の所得水準」を表しているような気がしますが、本当にそうでしょうか? 『数学独習法』(講談社現代新書)262ページより 図5-10は、日本の労働者の所得分布を表しています。より具体的には、所得を水準によって区切ったときに、それぞれの水準に属する労働者の人数を棒の長さで表したものです。このように、データを区間ごとに区切り、各区間に入るデータの個数を棒の長さで表したグラフをヒストグラムと呼びます。図5-10は日本における所得のヒストグラムです。 ヒストグラムを見ると、年間所得200万円以上~300万円未満が最も人数が多いことが分かります。このように、ヒストグラムにおいて最も頻度が高い区間のことを最頻値(さいひんち)と呼びます。 最も出現頻度が高い値なので最頻値です。つまり、日本の労働者で最も多いのは所得200万円台ということになります。一方、所得の平均値はそれより高い552.3万円となっています。 ===== 所得の平均値が最頻値より高いのは、所得が高めの人たちが平均値を引き上げているためです。所得水準が非常に高い人も一定数いるので、右に裾が長い分布となります。もし分布の形が左右対称なら、平均値は分布のちょうど真ん中に来るので、典型的な労働者の姿を表していると言うことができるでしょう。しかし、実際は分布が左右非対称であり、労働者の61.1%が平均所得以下となっています。つまり、平均値が典型的な労働者の所得水準を表しているとは必ずしも言えないのです。 所得分布のように左右非対称な分布について考えるときは、データの水準感を表すために、平均値以外の数値を参考にすることがあります。1つは先ほど出てきた最頻値で、もう1つは中央値です。中央値とは、データを小さい順に並べたとき、ちょうど真ん中に来る値のことです。例えば、表5-9だと、時給が低い順にAさん、Bさん、Cさん、Dさん、Eさんと並んでいます。このとき、Cさんは上から数えても3番目、下から数えても3番目なので、ちょうど真ん中にいますね。つまり、Cさんの時給1000円が中央値に相当します。サンプルサイズが大きくなった場合も同様で、例えば1001人いれば501番目の人の時給が中央値です。ちなみに、データが偶数個のときはちょうど真ん中の値というものがないので、前後の平均を使います。例えば、データが4個の場合は2番目と3番目のデータの平均を中央値とします。 中央値の良いところは、極端なデータが混ざっていても、その影響を受けにくいところです。例えば、表5-9の場合、平均値は時給が飛び抜けて高いEさんのデータに引っ張られて2740円になりますが、中央値は1000円(Cさんの時給)です。このようなケースでは、Eさんは別格として、その他のA~Dさんが平均的な水準と考えた方が妥当そうですね。中央値は、そういった実感に近い結果を返してくれます。データの中に混ざった極端な数値のことを外れ値(はずれち)と呼びますが、Eさんのデータは外れ値と考えて良さそうですね。中央値は、外れ値の影響を受けにくいという利点があります。 平均値が最もよく使われる指標ではありますが、状況に応じて中央値や最頻値なども見ながらバランスの良い判断に役立てていきます。 このように、統計学を使えばデータからいろいろな知見を引き出すことができます。その基本となる考え方は「グラフ化」です。データの分布を視覚化することで特徴をとらえ、必要に応じて平均値、中央値、最頻値などの統計量を算出してみることでデータへの理解を深めていくことができます。 [著者]冨島佑允 京都大学理学部卒業、東京大学大学院理学系研究科修了(素粒子物理学専攻)。修士(理学)、MBA in Finance(一橋大学)、CFA協会認定証券アナリスト。大学院在籍時は欧州原子核研究機構(CERN)で研究員として世界最大の素粒子実験プロジェクトに従事。修了後はメガバンクでクオンツ(金融に関する数理分析の専門職)として信用デリバティブや日本国債・日本株の運用を担当、ニューヨークのヘッジファンドを経て、2016年より保険会社の運用部門。著書に『「大数の法則」がわかれば、世の中のすべてがわかる! 』(ウェッジ)、『この世界は誰が創造したのか シミュレーション仮説入門』(河出書房新社)、『投資と金融がわかりたい人のためのファイナンス理論入門 プライシング・ポートフォリオ・リスク管理』(CCCメディアハウス)、『日常にひそむ うつくしい数学』(朝日新聞出版)がある。 『数学独習法』 冨島佑允 著 講談社現代新書 (※画像をクリックするとアマゾンに飛びます)