ローレンツ曲線とジニ係数~均等度合いを示す指標

定理

ジニ係数とは,データの不平等さの具合を見る指標である。

00 から 11 の実数を取り,00 に近ければ近いほど,分布が均一であることを示す。

この記事では,経済学や社会学で用いられるジニ係数(ジニ指数)の定義と求め方を解説します。

ローレンツ曲線

定義

値(収入など)を取るデータを考える。

ローレンツ曲線とは,与えられたデータについて

  • 横軸:累積相対度数
  • 縦軸:累積配分比率

をプロットしたグラフである。

ローレンツ曲線は,与えられたデータに対して,下から nn %以下が全体のうち何%か表した曲線です。

度数

値を取るデータ(収入など)を考えます。

累積相対度数とは,値が低い方から順にデータを並べたとき,全体のうち何%がそこまでに含まれているかを表します。

例えば,「収入が下位30%までの人」の累積度数は 0.30.3 です。

累積配分比率とは,値が低い方から順に並べたとき,サンプルが全体の値のうち何%を得ているかを表します。

例えば,「収入が下位30%の人の収入の合計が,全体の収入の10%である」場合,累積配分比率は 0.10.1 です。

例えば次のデータを考えましょう。(あらかじめデータは下から並べてあります)

ABCDE月収(万)1517192424FGHIJ月収(万)2729303234KLMNO月収(万)3537394142PQRST月収(万)4345475054UVWXY月収(万)5557626775 \begin{array}{c|ccccc} \text{人} & A & B & C & D & E \\ \text{月収(万)} & 15 & 17 & 19 & 24 & 24\\ \hline \text{人} & F & G & H & I & J\\ \text{月収(万)} & 27 & 29 & 30 & 32 & 34\\ \hline \text{人} & K & L & M & N & O \\ \text{月収(万)} & 35 & 37 & 39 & 41 & 42\\ \hline \text{人} & P & Q & R & S & T\\ \text{月収(万)} & 43 & 45 & 47 & 50 & 54\\ \hline \text{人} & U & V & W & X & Y\\ \text{月収(万)} & 55 & 57 & 62 & 67 & 75 \end{array}

月収の和は 10001000 万です。よって,累積配分比率は 0.0150.0320.0510.0750.0990.1260.1550.1850.2170.2510.2860.3230.3620.4030.4450.4880.5330.580.630.6840.7390.7960.8580.9251 \begin{array}{ccccc} 0.015 & 0.032 & 0.051 & 0.075 & 0.099\\ 0.126 & 0.155 & 0.185 & 0.217 & 0.251\\ 0.286 & 0.323 & 0.362 & 0.403 & 0.445\\ 0.488 & 0.533 & 0.58 & 0.63 & 0.684\\ 0.739 & 0.796 & 0.858 & 0.925 & 1 \end{array} となります。

(0,0),(0.04,0.015),(0.08,0.032),,(1,1) (0,0) , (0.04,0.015) , (0.08 , 0.032) , \cdots , (1,1) とプロットして,これらを折れ線でつないだものが今回のローレンツ曲線となります。

具体的には次のようになります。

pic_lo

※ 滑らかに見えていますが,解像度の問題です。細かく見ると折れ線のグラフとなります。

ジニ係数

定義

ジニ係数とは,均等配分線の面積均等配分線とローレンツ曲線で囲まれた部分の面積の比である。

同値な言い換えとして均等配分線とローレンツ曲線で囲まれた部分の面積の2倍としてもよい。

イメージ

もしデータがどの階級に集中することなく分布しているとしたら,ローレンツ曲線は次のように直線状になります。

pic_just

これを均等配分線といいます。

もしデータに偏りがある場合,ローレンツ曲線は下に凹みます。

凹みの面積を通してデータの偏りを数値かしてみましょう。

今回は,完全に偏りがない場合に 00偏りが大きければ大きいほど 11 に近づくように定めることにしましょう。

均等配分線の面積と,均等配分線とローレンツ曲線の間の面積の比とすれば,求めていた数値になります。

特に,均等配分線の成す面積は 12\dfrac{1}{2} であるため,均等配分線とローレンツ曲線の間の面積(下図斜線部の面積)を SS とすると,ジニ係数は 2S2S で表されます。

pic_gini

ローレンツ曲線が L(t)L(t)tt は累積相対度数)で表されるとすると 1201L(t)dt 1 - 2 \int_0^1 L(t) dt と書くこともできます。

ジニ係数は,所得に対して計算され,所得の偏りの指標として用いられることが多いです。

前述した例で計算してみましょう。

ABCDE月収(万)1517192424FGHIJ月収(万)2729303234KLMNO月収(万)3537394142PQRST月収(万)4345475054UVWXY月収(万)5557626775 \begin{array}{c|ccccc} \text{人} & A & B & C & D & E \\ \text{月収(万)} & 15 & 17 & 19 & 24 & 24\\ \hline \text{人} & F & G & H & I & J\\ \text{月収(万)} & 27 & 29 & 30 & 32 & 34\\ \hline \text{人} & K & L & M & N & O \\ \text{月収(万)} & 35 & 37 & 39 & 41 & 42\\ \hline \text{人} & P & Q & R & S & T\\ \text{月収(万)} & 43 & 45 & 47 & 50 & 54\\ \hline \text{人} & U & V & W & X & Y\\ \text{月収(万)} & 55 & 57 & 62 & 67 & 75 \end{array} において,ジニ係数を計算しましょう。

pic_lo

ローレンツ曲線が成す面積を計算します。今回の場合,ローレンツ曲線は折れ線です。そのため,次のように台形に分かれています。

pic

これらの面積を足していけば全体の面積が分かります。 0+0.0152×125+0.015+0.0322×125++0.925+12×125 \dfrac{0+0.015}{2} \times \dfrac{1}{25} + \dfrac{0.015+0.032}{2} \times \dfrac{1}{25} + \cdots + \dfrac{0.925 + 1}{2} \times \dfrac{1}{25} を計算すると,おおよそ 0.370320.37032 となります。ゆえにジニ係数はおおよそ 0.25936 0.25936 となります。

日本・世界のジニ係数

日本のジニ係数

日本におけるジニ係数を見ていきましょう。

数年の一度,厚生労働省が所得再分配調査を行っており,同時にジニ係数の公開も行われています。→ 所得再分配調査(厚生労働省)

これによると,令和3年(2021年)の純粋な収入に対するジニ係数は 0.57000.5700 でした。税金などを通した社会保障の結果,ジニ係数は 0.38130.3813 まで改善されているようです。 一般に,ジニ係数が 0.50.5 を超えると格差が大きいとされるため,社会保障を通した再分配が非常に意味のあるものだと分かりますね。

厚生労働省以外にもジニ係数を計算している機関は国内外問わず存在します。機関によって,サンプルの選び方が一部変わりますので,ジニ係数も軽微に変わります。しかし,どの集計においても日本のジニ係数は 0.30.3 台となっています。

世界のジニ係数

OECDが各国のジニ係数を集計しています。→ OECD:Income distribution database

この集計では,2021年の日本のジニ係数が 0.3380.338 となっています。同年のアメリカは 0.3750.375 と日本より若干格差が大きいようです。

OECDの調査対象国でジニ係数が大きい国としてはコスタリカ(2021年 0.4870.487)や南アフリカ(2017年 0.6180.618)などがあります。

友人にお小遣いやバイト代を聞いてジニ係数を計算してみるのも面白いでしょう。