(身近な統計3)データのばらつきの記述 (量的データ)
この夏休み、2012年からビデオに溜めっぱなしだった「放送大学もどき」シリーズを進めます!(断捨離の一環です!)
身近な統計
3.データのばらつきの記述 (質的データ)
扱った内容です。
1.量的データのばらつきの要約
度数分布表を用いる。
2.階級と度数分布表
様々な数値があるので、階級分けをすると、傾向が読み取れる(全体の傾向&中心傾向)
→「ヒストグラム」の作成
3.グラフによる要約~ヒストグラム
階級の幅によって、グラフの形状(データの見え方)が変わってくる。
階級幅が小さいと“歯抜け”のグラフになる。
エクセルなどを使うと、階級幅が用意に変えられるので、傾向が掴めるように適切な階級幅になるよう試行する。
※番組後半に「人口ピラミッド」や「セ・リーグとパ・リーグの打者の打率分布」が。
4.ヒストグラムの読み方
(A)短鋒性(同質)
(B)多峰性(異質な集団の混在の可能性)
(↑松坂大輔やダルビッシュの1級ずつの球速データ(年ごと)、偽札の判別))
(C)非対称
※データのばらつきがある時など、等間隔ではないヒストグラムもあるんですね!
(D)外れ値(outlier:アウトライヤー)のあるもの
外れ値によって平均等が引っ張られてズレてしまう!要注意!
※2000年のパ・リーグ打者の打率分布には、イチローの打率の外れ値が!
※.(番組最後に)エクセルでヒストグラムを作る
エクセルデータをまとめる手法『ピボットテーブル』と『ピボットグラフ』!
百聞は一見にしかずですね!使い方、少し掴めました!
百聞は一見にしかずですね!使い方、少し掴めました!
「データの書式設定」で見やすいグラフに!
『人気ブログランキング』に参加しています。 ![]() ↑是非クリックを↑ |
![]() ↑バナーをクリックして下さいm(_ _)m |
テキスト外:「シリーズ:統計と社会との接点」
国民健康保険とレセプトデータ(診療報酬明細書)の活用
・割合の少ない(当時1割)後期高齢者の医療費の割合が高い!(当時3割)
お年寄りの医療費が全体を押し上げている。
・一人あたりの医療費も、後期高齢者の年齢は働き盛りの方の10倍!(当時)
⇒早めに対策を!
お年寄りの医療費をどうすれば抑えられるか?原因は?と探る。
→各県のデータから、一人あたりの医療費と入院日数に相関が!
⇒お年寄りの入院日数を減らす施策は何かないか?と考える
⇒(他のデータもあり、)お年寄りに元気で社会参加してもらう施策も!
・紙データの電子化が大事!
| 固定リンク
この記事へのコメントは終了しました。
コメント