【統計】ローレンツ曲線とジニ係数とは何か?分かりやすく解説

統計
スポンサーリンク

ブログランキング・にほんブログ村へ

ローレンツ曲線とジニ係数とは

偏り(=集中度あるいは格差)を表すためのグラフが「ローレンツ曲線」で、
そのような不平等さを、数値で表したのが「ジニ係数」です。

ローレンツ曲線

ローレンツ曲線は、度数と値の累積相対度数の関係をプロットすることで、
作成することができます。

ここでは例として、架空の500世帯の月収について作成してみます。
作成手順は、以下のとおりです。

①世帯を月収の低い順に並べる
②世帯をいくつかの階級に分ける (ここでは5つ)
③度数と値の累積相対度数を求める
④プロットする (横軸:度数 (世帯数)、縦軸:値 (月収))

【補足】
値 (月収) の累積相対度数の求め方は、
まず全世帯分 (500世帯) の収入を計算します。
(20×100+20×100+20×100+20×100+20×100=10,000万円)

その中で、各階級が占める収入を考えていきます。
(1つ目の階級なら、20×100=2000万を占めるため、 2000÷10,000=0.2)

後は、通常の累積相対度数の求め方と同じです。
(世帯数が均等だと分かりづらいので、補足しました。)

この例は、全ての世帯の月収を20万円としました。
従って、全階級の平均月収も20万になり、階級が上がるにつれ
均等な上昇を見せています。

このように、均等なデータだと、
ローレンツ曲線は、45°一直線のグラフになります。

 

次は、偏りのあるデータをグラフ化してみます。

偏りのあるデータをグラフ化すると、
45°の直線 (黒色点線:「完全平等線」という) から歪みました。

この例ですと、収入の低い方から20%の世帯数 (100世帯) を抽出しても、
月収は全体の8%分しか抽出されていないということです。

(偏ってますねぇ)

ローレンツ曲線は、完全平等線から歪めば歪むほど、
値 (月収) に偏りがあると判断できます。

ジニ係数

ジニ係数は、ローレンツ曲線で表される偏りを、数値で表すもので、
以下の式で求まります。

ジニ係数=(完全平等線とローレンツ曲線で囲んだ面積(赤色))×2

日本統計学会作成の「統計検定2級対応 統計学基礎」によると、
「ジニ係数=(正方形に対する赤色面積の”割合”)×2」となっていますが、
正方形の面積は「1」なので、単純に「赤色面積の2倍」で覚えた方が楽ですね。

ジニ係数は、0~1の値を取り、
0は完全に均等である状態で、1は全くの不均等な状態です。

今回の例だと、以下のような場合です。
 0:全世帯の月収が同じ。(最初に説明したローレンツ曲線のグラフ)
 1:400世帯超の月収が0円で、一部世帯のみ月収がある。(世紀末)

なお、ジニ係数は、面積 (細かく言うと面積の「割合」) より求まるため、
ジニ係数が同じであっても、ローレンツ曲線の形状まで同じとは限りません。

まとめ

偏り(=集中度あるいは格差)を表すためのグラフが「ローレンツ曲線」で、
そのような不平等さを、数値で表したのが「ジニ係数」でした。

ローレンツ曲線は、度数と値の累積相対度数を求めて、
それをプロットすることで作成できます。

ジニ係数は、「(完全平等線とローレンツ曲線で囲んだ面積(赤色))×2」で
求めることができます。

スポンサーリンク
スポンサーリンク

ブログランキング・にほんブログ村へ

統計

コメント