【統計】最頻値とは何か?用途も考えてみた

統計

最頻値とは

最頻値は、読んで字のごとく、「最も頻繁にみられる値」です。

頻度に着目するため、数値のデータでなくても対応できます。
 

例えば、クラスのテストの得点が、次のような場合

60点、65点、70点、70点、70点、75点、75点、80点、80点、90点

最も頻繁にみられる「70点」が最頻値となります。
 

また、データによっては、最頻値が一つに定まらないことがあります。

60点、65点、70点、70点、70点、75点、75点、75点、80点、90点

この場合は、「70点」と「75点」が最頻値となります。
 

なお、データが数値ではない場合も同様です。

「あ、あ、い、う、う、え、お」の最頻値は、「あ」と「う」となります。

用途に関する考察

データから「普通の値」を決定するために、有名な3つの代表値があります。

それは、「平均値」、「中央値」、そして「最頻値」です。
 

「平均値」については、日常でもよく使われ、

「中央値」については、下記の記事より、用途のイメージもつくかと思います。

 
以下、私なりに「最頻値」の用途を考えましたので、参考にしてください。

名字の最頻値

「最頻値」は、データが数値でなくても使える特長があります。
 

とある学校の在学生の名字を集計したところ、

「田中」という名字が一番多いことが分かりました。

従って、在学生における、名字の最頻値は「田中」といえます。
 

このように、データが数値でない場合が、

代表的な最頻値の活躍の場となります。

( 平均値、中央値が使えないので、「消去法的に」ですが… )

バスの到着時間

「最頻値」は、他の代表値と違い、値ではなく、回数に着目しています。
 

バスの到着時刻について調査した結果、時刻表との誤差は次のようになりました。

この場合は、最頻値より、「よく5分遅れて到着するバス」と言っても良さそうです。

中央値も同じく「+5」となりますが、

頻度に着目するという点で、最頻値が適していると言えます。

イカサマ用のサイコロ

とあるサイコロを100回投げたところ、次のような出目の回数になりました。

どうやら、イカサマ用のサイコロらしいです。

この場合、次の出目の予想は、最頻値より「6」とするのが良いでしょう。

まとめ

最頻値は、「最も頻繁にみられる値」のことを言います。

対象のデータが数値ではない場合や、

頻度に着目した代表値を検討したい場合は、最頻値が適していると言えます。
 

最後までありがとうございました!

統計
株牧場へ1億円の投資を目指す物語

コメント

タイトルとURLをコピーしました