« 2017年6月 | トップページ

2018年7月の2件の記事

2018.07.23

(社会統計学3)データの基礎集計(2)

 

放送大学の番組から学んでいる話です。


社会統計学入門
3 データの基礎集計(2)

 最頻値、中央値、平均値については、よく耳にします。
 ですが、分布の散らばりを表す以下の2つあたりから、あまり耳しませんよね。

多様性指数:D
 1から、i番目のカテゴリーの比率の2乗を引いたものを全て足し合わせる。
 それにより、1つのカテゴリーに全ての度数が集中した時に0(最小)になり、全てのカテゴリーの度数が均等な場合に最大になる。

質的変動指数:IQV=(K/K-1)×D
 Dの式を多少変えることで、最大値が1、最小値が0になるようにしたもの。
 また、連続変数の散らばりを表すのに最もよく用いられる統計量が「分散」と「標準偏差:Sy」です。

※計算上、2乗して足し合わせないと、平均からみてプラス側とマイナス側とで合計0となってしまうので、2乗して足し合わせるのです。

 テキストは「パーセンタイル」を経て、z得点(標準得点)となります。

z=(YiーYの平均)÷Sy

 z得点に変換した得点はどんなものでも平均値は0、標準偏差は1となる(ように変換されている)
 元の値をz得点に変換することを「標準化」と言います。

記事がディベートの普及に繋がるように
人気ブログランキング』に参加しています。

人気ブログランキングへ
↑是非クリックを↑
今回の記事が良かったなら
にほんブログ村 教育ブログ 中高一貫教育へ
↑バナーをクリックして下さいm(_ _)m

続きを読む "(社会統計学3)データの基礎集計(2)"

| | コメント (0) | トラックバック (0)

2018.07.22

(身近な統計3)データのばらつきの記述 (量的データ)

この夏休み、2012年からビデオに溜めっぱなしだった「放送大学もどき」シリーズを進めます!(断捨離の一環です!)


身近な統計
3.データのばらつきの記述 (質的データ)

 扱った内容です。

1.量的データのばらつきの要約
 度数分布表を用いる。

2.階級と度数分布表
 様々な数値があるので、階級分けをすると、傾向が読み取れる(全体の傾向&中心傾向)
 →「ヒストグラム」の作成

3.グラフによる要約~ヒストグラム
 階級の幅によって、グラフの形状(データの見え方)が変わってくる。
 階級幅が小さいと“歯抜け”のグラフになる。
 エクセルなどを使うと、階級幅が用意に変えられるので、傾向が掴めるように適切な階級幅になるよう試行する。
 ※番組後半に「人口ピラミッド」や「セ・リーグとパ・リーグの打者の打率分布」が。

4.ヒストグラムの読み方

 (A)短鋒性(同質)
 (B)多峰性(異質な集団の混在の可能性)
  (↑松坂大輔やダルビッシュの1級ずつの球速データ(年ごと)、偽札の判別))
 (C)非対称
  ※データのばらつきがある時など、等間隔ではないヒストグラムもあるんですね!
 (D)外れ値(outlier:アウトライヤー)のあるもの
  外れ値によって平均等が引っ張られてズレてしまう!要注意!
 ※2000年のパ・リーグ打者の打率分布には、イチローの打率の外れ値が!

※.(番組最後に)エクセルでヒストグラムを作る

 エクセルデータをまとめる手法『ピボットテーブル』と『ピボットグラフ』
 百聞は一見にしかずですね!使い方、少し掴めました!
 「データの書式設定」で見やすいグラフに!
記事がディベートの普及に繋がるように
人気ブログランキング』に参加しています。

人気ブログランキングへ
↑是非クリックを↑
今回の記事が良かったなら
にほんブログ村 教育ブログ 中高一貫教育へ
↑バナーをクリックして下さいm(_ _)m

続きを読む "(身近な統計3)データのばらつきの記述 (量的データ)"

| | コメント (0) | トラックバック (0)

« 2017年6月 | トップページ