データの「普通」を表現する値を「代表値」と言います。
ここでは、有名な代表値である「平均値」「中央値」「最頻値」について解説します。
平均値
「平均値」は、データを平らに均した値です。
一般的な平均値は、数値データの合計値を、データの個数で割ることで、求まります。
例えば、データが「2、2、3、4、5、8」の平均値は、「4」です。
この一般的な平均については、「算術平均 ( 相加平均 )」と呼ばれます。
「算術平均」以外にも「平均」は存在するので、用途により使い分けが必要です。
以下の関連記事では、「算術平均」以外の「平均」の一部を紹介します。
中央値
「中央値」は、データを小さい順に並べた時に、ちょうど真ん中に来る値です。
データの数が偶数の場合は、真ん中の値が2つになってしまいますが、
その場合の中央値は、真ん中の2つの値の平均 ( 算術平均 )になります。
例えば、データが「2、2、3、4、5、8」の中央値は、「3.5」です。
その他の特徴や、平均値との使い分けについては、以下の関連記事にまとめました。
最頻値
「最頻値」は、最も頻繁に出てくるデータです。
他の代表値とは異なり、頻度に着目するため、数値のデータでなくても対応できます。
また、最も頻繁に出てきたデータが複数ある場合、それら全てが最頻値に該当します。
例えば、データが「2、2、3、4、5、8」の最頻値は、「2」であり、
データが「あ、あ、い、う、う、え、お」の最頻値は、「あ」と「う」です。
現実に、どのような用途があるのかについては、以下の記事で考えています。
おわりに
データの「普通」を表現する「代表値」について、平均値、中央値、最頻値を解説しました。
これらそれぞれに特徴があるため、しっかりと使い分ける必要があります。
データ自体にどのような特徴があるのか把握して、適切な代表値を選択してあげましょう。
それでは、最後までありがとうございました!
コメント