データの秘密を解き明かす!ヒストグラムと度数分布入門【ChatGPT統計解析】
カテゴリー別度数分布やヒストグラムは、異なるカテゴリーに分けられた対象者の人数を合計し、それを全体の人数で割ることでパーセンテージ形式で表示されます。この方法により、データの分布が明らかになります。このプロセスは、名義尺度、順序尺度、そして数量データの3つの異なるデータ型に適用されますが、それぞれの型には特有の作成方法があります。名義尺度では、カテゴリー間に順序がないため、分布の形が定まらず、度数分布とはあまり呼ばれません。順序尺度では、カテゴリーに順序があるため、分布の形が一意に定まります。数量データでは、データを同じ幅のカテゴリーに分けて度数分布を作成し、これをヒストグラムで表現します。これにより、特定のデータ範囲の特徴がより明確になります。
▼▼▼▼▼▼▼▼
チャンネル登録はこちら
カテゴリー別度数分布・ヒストグラムの作り方
対象者をいくつかの異なるカテゴリーにくくって、それぞれに含まれる人数を足しあげます。
その人数を合計人数で割り算し、パーセントで表すことにします。
すると、カテゴリー別度数の分布が得られます。
もっとも、わざわざパーセントにしないで人数のままでも、分布は分布です。
ここで、度数というのは上の人数またはそのパーセントのことです。
この度数分布には、もとのデータの型(尺度型)によって、次のような違いがあります。
名義尺度の場合
たとえば、対象者を職業というカテゴリーによって分類して、それぞれの人数をかぞえあげれば、職業による度数分布となります。
分布はある形をとるのですが、残念ながら名義尺度はカテゴリー間の順序が決まっていないので、分布の形も定まりません。
したがって、名義尺度の場合には、あまり度数分布とは言わないようです。
カテゴリーを入れ替えれば、分布型も変化します。
もしあえて度数分布というのであれば、度数の多い順にカテゴリーを入れ替えて図示することが考えられます。
順序尺度の場合
各企業にとって世間から自社がどのようなイメージで受け取られているか、おおいに関心のあるところです。
この企業イメージは、対象者個人ごとに次のような回答シートに記入してもらって、その結果をカテゴリーごとに数えあげることで測定されます。
<あなたの感じに合った位置の□にチェックを入れて下さい>
非常に やや ふつう やや 非常に
一流の □ □ □ □ □
広告が多い □ □ □ □ □
親しみがある □ □ □ □ □
この結果は度数分布として、棒グラフで表すこともできます。
ただし、カテゴリーの順序は決まっていますから、分布の形も一意に定まります。
これを度数の大きさの順に入れ替えたりしてはいけません。
この例では1項目のカテゴリー数が5です。
これを段階数ともいいますが、この段階数があまり多くないときは、帯グラフであらわすことも多いです。
帯グラフは隣同士をまとめるので、視覚的に訴えやすい、イメージを総合的に読み取りやすい、などのメリットがあります。
数量データの場合
個人ごとの1日喫煙本数を、同じ幅のカテゴリーに分けて人数をかぞえれば、喫煙本数の度数分布が得られます。
なお、数量をカテゴリーに分けたときは、とくにカテゴリーを「クラス」という用語で言い換えられます。
ヒストグラムにすることにより、喫煙量のどのクラスの人が多いか、それよりクラスが下または上にいくと、喫煙者がどのように減少していくか、などがよくわかります。
関連リンク