So-net無料ブログ作成
  • ブログをはじめる
  • ログイン

サンプリングって何だろう [読書メモ2018]

『サンプリングって何だろう』 廣瀬雅代 2018/03

サンプリングって何だろう――統計を使って全体を知る方法 (岩波科学ライブラリー)

著者は統計数理研究所データ科学研究系助教。 データサンプリングの手法や特徴を紹介する本。

 中心極限定理は、「サンプルサイズn個が十分大きければ、得られる推定値の分布を左右対称な山の形(正規分布)にみなせる」ということを保証する定理。
 調査目的にかなった調査対象を設定することは、社会調査を実施するうえでとても重要。 代表的な全数調査としては「国勢調査」。こうした国家事業でない限り、大規模な全数調査はほぼ行われていない。
 「サンプル数」とは”サンプル(集団)自体の数”を指す。一方、サンプルサイズとは、1つのサンプルの中に”サンプルを構成する要素が何個あるか”を表す用語であり、両者は互いに異なる意味を持つ。
 単純無作為抽出法の難点:単純無作為抽出をするためには、日本人全員の情報が網羅されたサンプリング台帳が必要だが、現状そうしたものは存在しない。
 多段抽出法は、サンプリング対象の単位が最初から「個人」になることはない。全国調査の場合「市町村区」といった地域区分が第1次抽出単位。第2次抽出単位は「投票区」、「学区」、「丁目」など。ここで選ばれた地点から「個人」が抽出される。 サンプリング台帳は、2段目で選ばれた地点のものだけがあればいい。
 層化抽出法:人口や産業構造などの情報を用いた母集団の層化(分類)。たとえば、「大都市」「中小都市」「郡部」。
 最近では、科学的根拠に基づいて政策を決定・推進しようという、「エビデンス・ベースト」の取組みが注目されており、必要なデータを集めるために社会調査への需要が高まっている。
 野生生物の個体数を調べるとき、そこにいる生物を観察できずに見落としてしまうことを「偽陰性」と呼ぶ。
 固体の検出率を見積もって個体数を推定する方法の1つが「捕獲再捕獲法」。 1回目に捕獲した個体に標識をつけて放し、再捕獲の際に含まれる割合(検出率)を調べる。この割合は、捕獲数/全体数にほぼ等しいとして全体数を推定する(リンカーン・ペテルセン推定量)。


スポンサーリンク


nice!(1)  コメント(0) 
共通テーマ:

nice! 1

コメント 0

コメントを書く

お名前:
URL:
コメント:
画像認証:
下の画像に表示されている文字を入力してください。