ローレンツ曲線とジニ係数~均等度合いを示す指標

ジニ係数とは,データの不平等さの具合を見る指標である。

00 以上 11 以下の実数をとり,00 に近ければ近いほど,分布が均一であることを示す。

この記事では,経済学や社会学で用いられる**ジニ係数(ジニ指数)**の定義と求め方を解説します。

収入の例

例えば次のデータを考えましょう(あらかじめデータは下から並べてあります)。AA さんから YY さんまで25人分の月収を表しています。

ABCDE月収(万)1517192424FGHIJ月収(万)2729303234KLMNO月収(万)3537394142PQRST月収(万)4345475054UVWXY月収(万)5557626775 \begin{array}{c|ccccc} \text{人} & A & B & C & D & E \\ \text{月収(万)} & 15 & 17 & 19 & 24 & 24\\ \hline \text{人} & F & G & H & I & J\\ \text{月収(万)} & 27 & 29 & 30 & 32 & 34\\ \hline \text{人} & K & L & M & N & O \\ \text{月収(万)} & 35 & 37 & 39 & 41 & 42\\ \hline \text{人} & P & Q & R & S & T\\ \text{月収(万)} & 43 & 45 & 47 & 50 & 54\\ \hline \text{人} & U & V & W & X & Y\\ \text{月収(万)} & 55 & 57 & 62 & 67 & 75 \end{array}

月収の総和は 10001000 万です。このデータから,ローレンツ曲線と呼ばれる曲線を描いていきます。

小さい順から見ていって,

  • 最初の1人(全体の4%)で月収の総和のうち1.5%(1000万のうちの15万)を占める
    (0.04,0.015)(0.04,0.015)をプロットする
  • 最初の2人(全体の8%)で月収の総和のうち3.2%(1000万のうちの32万)を占める
    (0.08,0.032)(0.08,0.032)をプロットする

というような折れ線グラフがローレンツ曲線です。

pic_lo

※ なめらかに見えますが,解像度の問題です。細かく見ると折れ線のグラフとなります。

ジニ係数の定義

ジニ係数とは,「y=xy=x」と「ローレンツ曲線」で囲まれた部分の面積の2倍のこと。

pic_gini

y=xy=x のことを均等配分線と言います。

収入の例でジニ係数を計算してみましょう。次のように,ローレンツ曲線の下側部分を台形に分けて考えます。

pic

これらの面積を足していけば全体の面積が分かります。 0+0.0152×125+0.015+0.0322×125++0.925+12×125 \dfrac{0+0.015}{2} \times \dfrac{1}{25} + \dfrac{0.015+0.032}{2} \times \dfrac{1}{25} + \cdots + \dfrac{0.925 + 1}{2} \times \dfrac{1}{25} を計算すると,おおよそ 0.370320.37032 となります。ゆえにジニ係数はおおよそ (0.50.37032)×2=0.25936 (0.5-0.37032)\times 2=0.25936 となります。

ジニ係数の性質

もしデータがどの階級にも集中することなく分布しているとしたら,ローレンツ曲線は次のように直線状になります。

pic_just

この直線 y=xy=x のことを均等配分線といいます。完全に平等な場合,ローレンツ曲線と均等配分線は一致します。すなわち,面積は0なのでジニ係数は0になります。

データに偏りがある場合,ローレンツ曲線は下に凹みます。

日本・世界のジニ係数

ジニ係数は,所得に対して計算され,所得の偏りの指標として用いられることが多いです。

日本のジニ係数

日本におけるジニ係数を見ていきましょう。

数年の一度,厚生労働省が所得再分配調査を行っており,同時にジニ係数の公開も行われています。→ 所得再分配調査(厚生労働省)

これによると,令和3年(2021年)の純粋な収入に対するジニ係数は 0.57000.5700 でした。税金などを通した社会保障の結果,ジニ係数は 0.38130.3813 まで改善されているようです。 一般に,ジニ係数が 0.50.5 を超えると格差が大きいとされるため,社会保障を通した再分配が非常に意味のあるものだと分かりますね。

厚生労働省以外にもジニ係数を計算している機関は国内外問わず存在します。機関によって,サンプルの選び方が一部変わりますので,ジニ係数も軽微に変わります。しかし,どの集計においても日本のジニ係数は 0.30.3 台となっています。

世界のジニ係数

OECDが各国のジニ係数を集計しています。→ OECD:Income distribution database

この集計では,2021年の日本のジニ係数が 0.3380.338 となっています。同年のアメリカは 0.3750.375 と日本より若干格差が大きいようです。

OECDの調査対象国でジニ係数が大きい国としてはコスタリカ(2021年 0.4870.487)や南アフリカ(2017年 0.6180.618)などがあります。

より厳密な説明

ここまで,例をもとに大雑把な説明をしてきました。以下では,もう少し正確に各用語を述べておきます。

度数

  • 累積相対度数とは,値が低い方から順にデータを並べたとき,全体のうち何%がそこまでに含まれているかを表します。

  • 累積配分比率とは,値が低い方から順に並べたとき,サンプルが全体の値のうち何%を得ているかを表します。

  • 例えば,「収入が下位30%の人の収入の合計が,全体の収入の10%である」場合,「累積相対度数 0.30.3 における累積配分比率は 0.10.1」です。

ローレンツ曲線

ローレンツ曲線とは

ローレンツ曲線とは,与えられたデータについて

  • 横軸:累積相対度数
  • 縦軸:累積配分比率

をプロットしたグラフである。

ローレンツ曲線は,与えられたデータに対して,下から nn %以下が全体のうち何%か表した曲線です。

ジニ係数

定義

ジニ係数とは,均等配分線とローレンツ曲線で囲まれた部分の面積の2倍である。

同値な言い換えとして均等配分線の右下部分の面積(=0.5=0.5)均等配分線とローレンツ曲線で囲まれた部分の面積の比としてもよい。

なお,収入の例を考えましたが,収入以外のデータでもジニ係数は同様に計算できます。

友人にお小遣いやバイト代を聞いてジニ係数を計算してみるのも面白いでしょう。