最頻値とは
最頻値は、読んで字のごとく、「最も頻繁にみられる値」です。
頻度に着目するため、数値のデータでなくても対応できます。
例えば、クラスのテストの得点が、次のような場合
60点、65点、70点、70点、70点、75点、75点、80点、80点、90点
最も頻繁にみられる「70点」が最頻値となります。
また、データによっては、最頻値が一つに定まらないことがあります。
60点、65点、70点、70点、70点、75点、75点、75点、80点、90点
この場合は、「70点」と「75点」が最頻値となります。
なお、データが数値ではない場合も同様です。
「あ、あ、い、う、う、え、お」の最頻値は、「あ」と「う」となります。
用途に関する考察
データから「普通の値」を決定するために、有名な3つの代表値があります。
それは、「平均値」、「中央値」、そして「最頻値」です。
「平均値」については、日常でもよく使われ、
「中央値」については、下記の記事より、用途のイメージもつくかと思います。
以下、私なりに「最頻値」の用途を考えましたので、参考にしてください。
名字の最頻値
「最頻値」は、データが数値でなくても使える特長があります。
とある学校の在学生の名字を集計したところ、
「田中」という名字が一番多いことが分かりました。
従って、在学生における、名字の最頻値は「田中」といえます。
このように、データが数値でない場合が、
代表的な最頻値の活躍の場となります。
( 平均値、中央値が使えないので、「消去法的に」ですが… )
バスの到着時間
「最頻値」は、他の代表値と違い、値ではなく、回数に着目しています。
バスの到着時刻について調査した結果、時刻表との誤差は次のようになりました。
この場合は、最頻値より、「よく5分遅れて到着するバス」と言っても良さそうです。
中央値も同じく「+5」となりますが、
頻度に着目するという点で、最頻値が適していると言えます。
イカサマ用のサイコロ
とあるサイコロを100回投げたところ、次のような出目の回数になりました。
どうやら、イカサマ用のサイコロらしいです。
この場合、次の出目の予想は、最頻値より「6」とするのが良いでしょう。
まとめ
最頻値は、「最も頻繁にみられる値」のことを言います。
対象のデータが数値ではない場合や、
頻度に着目した代表値を検討したい場合は、最頻値が適していると言えます。
最後までありがとうございました!
コメント