数据假设检验是数理统计学中根据一定假设条件由样本推断总体的一种方法。
那我们啥时候会用到假设检验呢?
大多数情况下,我们无法分辨事物的真伪或者某种说法是否正确,这时就需要进行假设,然后对我们的假设进行检验。
比如,我们想知道被告人是不是有罪,就可以通过假设检验进行判断。
基本思路包括4步逻辑:
问题是什么?→证据是什么?→判断标准是什么?作出结论。
首先,我们要明确问题是什么。
问题:检验被告人是否有罪。
根据这个问题,我们可以提出两个互为相反的假设:
零假设:被告人没有罪。
备选假设:被告人有罪。
有了假设,接下来需要明确证据是什么。
根据中心极限定理,足够多合理的样本可以代表总体,所以我们要找到合理的样本数据来做证据。
然后,进一步明确判断标准,绝不能冤枉一个好人,但也不可放过一个坏人。
因为我们定的零假设是:被告人没有罪。所以这里定的标准是,如果被告人没有罪的概率<=5%,那么就直接否定了零假设,也就是被告人没有罪不成立。
这里听着不太顺,被告人没有罪的概率<=5%,其实就是被告人有罪的概率大于95%,所以被告人有很大可能性有罪,因此把零假设否定了。
这里用于做出决策的标准5%,在假设检验里叫做“显著水平”,用符号α(Alpha)表示,是一个概率值。
最后,被告人到底有没有罪呢?
根据样本证据计算出的p值与判断标准α比较下就可以了:
如果p< =α,那么拒绝零假设,也就是备选假设成立;
如果p>α,那么零假设成立。
这就是数据假设检验的基本思路,是我们探索数据