Python・R・エクセルによるデータサイエンス | 統計解析講義

統計学における度数分布の作り方【統計解析講義基礎】 | 統計解析 - Python・R・エクセルを使った講義で最速マスター

統計学における度数分布の作り方【統計解析講義基礎】

統計学における度数分布の作り方【統計解析講義基礎】


統計学における度数分布の作り方【統計解析講義基礎】

 

対象者をいくつかの異なるカテゴリーにくくって、それぞれに含まれる人数を足しあげます。

 

その人数を合計人数で割り算し、パーセントで表すことにします。

 

すると、カテゴリー別度数の分布が得られます。

 

もっとも、わざわざパーセントにしないで人数のままでも、分布は分布です。

 

ここで、度数というのは上の人数またはそのパーセントのことです。

 

この度数分布には、もとのデータの型(尺度型)によって、次のような違いがあります。

 

名義尺度の場合

 

たとえば、対象者を職業というカテゴリーによって分類して、それぞれの人数をかぞえあげれば、職業による度数分布となります。

 

分布はある形をとるのですが、残念ながら名義尺度はカテゴリー間の順序が決まっていないので、分布の形も定まりません。

 

したがって、名義尺度の場合には、あまり度数分布とは言わないようです。

 

カテゴリーを入れ替えれば、分布型も変化します。

 

もしあえて度数分布というのであれば、度数の多い順にカテゴリーを入れ替えて図示することが考えられます。

 

順序尺度の場合

 

各企業にとって世間から自社がどのようなイメージで受け取られているか、おおいに関心のあるところです。

 

この企業イメージは、対象者個人ごとに次のような回答シートに記入してもらって、その結果をカテゴリーごとに数えあげることで測定されます。

 

<あなたの感じに合った位置の□にチェックを入れて下さい>

 

         非常に   やや    ふつう   やや    非常に
一流の      □     □     □     □     □
広告が多い   □     □     □     □     □
親しみがある  □     □     □     □     □

 

この結果は度数分布として、棒グラフで表すこともできます。

 

ただし、カテゴリーの順序は決まっていますから、分布の形も一意に定まります。

 

これを度数の大きさの順に入れ替えたりしてはいけません。

 

この例では1項目のカテゴリー数が5です。

 

これを段階数ともいいますが、この段階数があまり多くないときは、帯グラフであらわすことも多いです。

 

帯グラフは隣同士をまとめるので、視覚的に訴えやすい、イメージを総合的に読み取りやすい、などのメリットがあります。

 

数量データの場合

 

個人ごとの1日喫煙本数を、同じ幅のカテゴリーに分けて人数をかぞえれば、喫煙本数の度数分布が得られます。

 

なお、数量をカテゴリーに分けたときは、とくにカテゴリーを「クラス」という用語で言い換えられます。

 

度数分布をグラフにしたものをヒストグラムといいます。

 

ヒストグラムにすることにより、喫煙量のどのクラスの人が多いか、それよりクラスが下または上にいくと、喫煙者がどのように減少していくか、などがよくわかります。

セミナー詳細こちら                    解析ご相談こちら


 

 

統計学における度数分布の作り方【統計解析講義基礎】

統計学における度数分布の作り方【統計解析講義基礎】

統計学における度数分布の作り方【統計解析講義基礎】