Skip to content

Instantly share code, notes, and snippets.

@yuu-ito
Last active December 19, 2017 13:37
Show Gist options
  • Save yuu-ito/9525185 to your computer and use it in GitHub Desktop.
Save yuu-ito/9525185 to your computer and use it in GitHub Desktop.

標本数の決め方について調べてみる。

参考

 ただし,Nは母集団の大きさ
     nは標本の大きさ
     Pは母比率の予想値
     eは信頼度 95 %での標本誤差の許容値
  • R で関数を書いてみる。
getSampleNum<-function(N=1200000,
                       P=0.1,
                       e=0.02){
  N/(1+(N-1)*e^2/(1.96^2*P*(1-P)))
}

getSampleNum(N=100)     # -->  89.7235
getSampleNum(N=1000)    # --> 463.8717
getSampleNum(N=10000)   # --> 795.6654
getSampleNum(N=100000)  # --> 856.9613
getSampleNum(N=1000000) # --> 863.6144
  • 引用
標本の大きさの決定には,

 ① 母集団の大きさはあまり関係がなく
 ② 標本誤差の大きさが決定的な影響を与えており
 ③ 標本誤差を半分にするには標本を約4倍にすべきことである。

標本の大きさに影響を与えるもう一つの要因は予想される母比率(母分散)の大きさである。
標本の大きさが等しければ予想母比率が 50 %であるとき標本誤差は最も大きくなる。
  • 数式だと、母比率ってのがサンプル数に大きく影響する。
    • 母平均と母分散は今までの調査だったりで得られたデータを元に設定するとのこと。

あとで調べる。

@suin
Copy link

suin commented Apr 12, 2017

Ruby版の関数

def getSampleNum(n=1200000, p=0.1, e=0.02)
	n / (1 + (n-1) * e ** 2 / (1.96 ** 2 * p * (1 - p)))
end

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment