如何确定抽样的样本数量

article/2025/3/15 8:50:04

总体为9200人,预设的整体置信度为95%,最大容许误差为正负5%,求样本容量

网上搜到的第一个有价值的内容如下:

题目

某公司对60000人中的吸烟比例做调查,置信度为95%的情况下,若要使误差保持在4%以内,需要的最小样本容量是
这里并没有告诉总体的方差(标准差)和样本方差(标准差),那到底应该怎样做呢?
还有第二问:
已知比例在10%-20%,要使误差保持在5%以内,求需要的最小样本容量?

优质解答

第一问:
当方差未知的情况下,通常取最大值.已知方差S的平方(这里打不出平方,就用文字表示了)=p*(1-p),当p=0.5的时候,S的平方值最大,等于0.25,即取方差为0.25.所以,样本量n=(Z的平方*S的平方)/E的平方,带入数值(置信度为95%时,Z=1.96,)得:n=(1.96*1.96*0.25)/(0.04*0.04)=600.25,即最小样本量为601.
第二问:
据题意,当比例为10%时,方差最小,方差S的平方=0.1*(1-0.1)=0.09,此时,所需样本量最小,
带入数值得:n=(1.96*1.96*0.09)/0.05*0.05)=138.3,即最小样本量为139.
同理,当取20%时,最小样本量为246,明显139

上文中使用的抽样数量计算公式如下。

,但是在实际使用中西格玛的平方往往是未知的,因此上文中用p(1-p)代替

n: 为样本量;
\fn_jvn \120dpi {\sigma}^2:方差,抽样个体值和整体均值之间的偏离程度,抽样数值分布越分散方差越大,需要的采样量越多;
E: 为抽样误差(可以根据均值的百分比设定),由于是倒数平方关系,抽样误差减小为1/2,抽样量需要增加为4倍; 
\fn_jvn \120dpi ^{z_{\alpha/2}}: 为可靠性系数,即置信度,置信度为95%时,\fn_jvn \120dpi ^{z_{\alpha/2}}=1.96,置信度为90%时,\fn_jvn \120dpi ^{z_{\alpha/2}}=1.645,置信度越高需要的样本量越多;95%置信度比90%置信度需要的采样量多40%;

随后又搜索到一篇有价值的参考资料:

http://blog.sina.com.cn/s/blog_a032adb90101fp1p.html

但是,如果按照上述文章中的方法进行计算,都没有用到总体数量9200这个条件,感觉不对,所以继续搜索

最终发现,上述各篇文章都是应用的总体无限的的抽样公式,如果总体有限,则应按照如下方法计算:

作者:知乎用户
链接:https://www.zhihu.com/question/23017185/answer/23871782
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

具体到某个研究要多少样本,就要根据误差和置信度去计算了。具体计算公式是:n=1.96^2*P(1-P)/E^2. 其中E是误差,P是估计的总体比例,1.96是置信度为95%的标准值

---------补充----------

感谢

@Detian Deng

补充!最近在做一些人口属性方面的统计工作,主要涉及到的是性别比例,对统计学上的相关知识也是现学现用,所以也想探讨一些问题:

 

1. 在大样本抽样中,样本比例p的抽样分布可以按照正态分布逼近。在我的之前的回答中,n=1.96^2*P(1-P)/E^2 其实只是有放回抽样情况下对样本量的计算,因为此时样本比例p服从期望E(p)=P,方差V(p)=P(1-P)/n 的正态分布,根据区间估计,有E=1.96*V(p)^2,以此可以求得n。而在无放回抽样中,样本比例p的方差是V(p)=(N-n/N-1)P(1-P)/n,同样的求解方式,样本量n=1.96^2*P(1-P)/(E^2+1.96^2*P(1-P)/N),但此时,样本量n的大小就与总体量N有关了。是这样吧?

2. 无论是区间估计,还是求样本量,中间都用到了总体比例P。但是明明求这个总体比例P是我们抽样的目的,所以在我们求n和置信区间时,涉及到P我们往往都用一个以往统计的总体比例值作为参考。因此,从这些公式中可以发现,我们对总体比例的估计,是根据1)以往统计的总体比例;2)抽样样本的比例。是这样吧?

以上内容来自于知乎的如下问题:

https://www.zhihu.com/question/23017185

按照上述方式计算的结果是368.76,;按照无限总体计算的结果是384.16.

另外,还发现了一个计算抽样数量的网址,可以在线计算:

https://www.surveysystem.com/sscalc.htm

其中的confidence interval填写容许误差的一半(不要百分号),例如,本题中容许误差为正负5%,所以,confidence interval填5。这个网站计算出的结果是369,与我们的计算结果一致

 


http://chatgpt.dhexx.cn/article/BRNp6NT8.shtml

相关文章

样本容量的确定

• 样本容量: 样本中个体的数目或组成抽样总体的单位数。 • 必要样本容量 : 亦称必要样本单位数,是指满足调查目的要求的情况下,至少需要选择的样本单位数。 一、估计总体均值时样本容量的确定 1.重复抽样 一旦确定了置信水平&…

Topic 5. 样本量确定及分割

每次做方案设计的时候,都会涉及到一个尖锐的问题,客户会问我得用多少的样本量才能发文章,这个嘛,事情从理论上回答还是有依据的,但是从实际出发永远都是 “理想很丰满,现实很骨感!” 。不过还是…

参数估计-两个参数总体区间估计、样本量确定(三)

2019独角兽企业重金招聘Python工程师标准>>> 一、两个总体均值之差的区间估计 1、大样本估计 两个总体为正态分布,或两个总体不服正态分布但两个样本都为大样本,根据抽样分布知识可知 两个样本均值只差 服从期望为(μ1-μ2)、方差为( )的正态分布,转化为标准…

ABtest如何确定样本量?

如何计算样本量 商业分析的面试,很少会让面试者直接默写公式并进行计算。为啥?一,面试官八成自己也不记得公式。二,真实工作都是用网上的计算器,一键呵成,无需手算。 网上随手找的的sample size计算器 那么…

Topic 5. SCI 文章之样本量确定及分割

**每次做方案设计的时候,都会涉及到一个尖锐的问题,客户会问我得用多少的样本量才能发文章,这个嘛,事情从理论上回答还是有依据的,但是从实际出发永远都是 “理想很丰满,现实很骨感!” 。不过还…

AB实验样本量确定

文章目录 1. 统计功效与关键概念2. Z检验样本量确定2.1 统计功效公式推导2.2 样本量计算公式2.3 求解样本量 3. 卡方检验样本量确定3.1 求解样本量 4. 简要总结Reference 在数据分析过程中, 一个完整的闭环是从数据中得到洞察,根据洞察得到某种假设&…

临床试验中样本量确定的统计学考虑

样本量确定(sample size determination),又称样本量估计(sample size estimation),是指为满足统计的准确性和可靠性(I类错误的控制和检验效能的保证)计算出所需的样本量,它是临床试验设计中一个极为重要的环节,直接关系到研究结论…

在前端中的缓存

http缓存 http缓存基本认识 http缓存分为强缓存和协商缓存 1、浏览器在加载资源时,先根据这个资源的一些http header判断它是否命中强缓存,强缓存如果命中,浏览器直接从自己的缓存中读取资源,不会发请求到服务器。比如某个css文…

前端缓存方案

前端几种本地缓存机制_蜗牛小前的博客-CSDN博客_前端本地缓存在漫长的前端开发过程中,我们常用的几种本地缓存机制:Cookie,LocalStorge,SessionStorge 1.Cookie的特点1)cookie的大小受限制,cookie大小被限制在4KB,不能…

【前端】深入浅出缓存原理

缓存的基本原理 对于前端来说,缓存主要分为浏览器缓存(比如 localStorage、sessionStorage、cookie等等)以及http缓存,也是本文主要讲述的。 当然叫法也不一样,比如客户端缓存大概包括浏览器缓存和http缓存 所谓htt…

前端浏览器缓存机制

目录 1 缓存定义及其优点2 强缓存2.1 expires 和 Cache-Control 3 协商缓存4 浏览器缓存位置 1 缓存定义及其优点 什么是缓存? 当我们第一次访问网站的时候,电脑会把网站上的图片和数据下载到电脑上,当我们再次访问的时候,网站就会…

前端缓存机制

目录 前言 目的 缓存过程分析 强制缓存(强缓存) 强制缓存的缓存规则 浏览器的缓存存放在哪里 协商缓存 更新缓存 合理应用缓存 前言 对于浏览器缓存,每个前端开发者应该都不会陌生,同时它也是我们在日常开发中存在的一个…

前端缓存【web缓存】

前端缓存--http缓存 web缓存http缓存定义优点缺点http缓存类型 强缓存Expires实现的强缓存Cache-control实现的强缓存 协商缓存last-modified实现的协商缓存ETag实现的协商缓存缺点 设置缓存文件缓存(html、js、css、png)总结 web缓存 web缓存主要指:浏…

前端缓存(HTTP缓存、浏览器缓存)浅析

前端缓存 文章目录 前端缓存缓存分类1、http缓存(1)强缓存(本地缓存)启发式缓存 (2)协商缓存(弱缓存) 2、浏览器缓存 其他响应头和请求头参数刷新正常重新加载硬性重新加载清空缓存并硬性重新加载 调试缓存 缓存分类 1、http缓存 …

前端缓存最佳实践

点击上方“前端开发博客”,选择“设为星标” 回复“2”加入前端群 作者:黑金团队https://juejin.cn/post/6844903737538920462 前言 缓存,这是一个老生常谈的话题,也常被作为前端面试的一个知识点。本文,重点在与探讨在…

技术点:前端缓存分类及使用

前端缓存 什么是 web 缓存(前端缓存) web 缓存主要指的是两部分:浏览器缓存和 http 缓存 浏览器缓存:比如,localStorage,sessionStorage,cookie 等等。这些功能主要用于缓存一些必要的数据,比如用户信息。比如需要携…

前端缓存详解

目录 前言 一、按缓存位置分类 HTTP状态码及区别 几种状态的执行顺序 Memory Cache Disk Cache Service Worker 请求网络 二、HTTP 缓存 HTTP 缓存分类 强缓存原理 协商缓存原理 更新和废弃缓存 三、缓存小结 四、缓存的优点 五、浏览器缓存策略 五、缓存的应…

一文!彻底弄懂前端缓存

前端缓存 前端缓存,这是一个老生常谈的话题,也常被作为前端面试的一个知识点。今天我们再来总结一下。 分类 前端缓存分为强缓存和协商缓存两种。 强缓存 强缓存主要使用Expires、Cache-Control 两个头字段,两者同时存在Cache-Control 优先级…

【前端页面缓存技术方案】

前端页面缓存技术方案 关于页面缓存数据的纯前端技术方案背景项目存在的现有方案思考🤔其他技术调研react-activationreact-router-cache-route 结论 关于页面缓存数据的纯前端技术方案 背景 为了优化用户的体验,可能会遇到这样的需求:在列…

前端常用缓存技术

http://www.cnblogs.com/belove8013/p/8134067.html 今天刚上班就听到群里的几位大佬在讨论所开发的系统需要重复的登录的恶心之处,听各位大佬争辩的同时,想到了自己以前整理过的缓存技术,算是比较全面的,当然了只是帮助自己理解的…