统计学基础(三)
假设检验
Table of Contents
定义:在日常生活中我们常常需要做出决策,而我们在做决策时一定要预估事件可能发生的结果及概率。假设检验就是一种判断某个事件发生的可能性时使用的科学方法,它常常是先提出一个假设,即原假设;与之对应的是备择假设。假设检验的作用就是判断原假设成立的概率有多大。
1. 假设检验的步骤:
确定要进行检验的假设
确定原假设 H0 ,除非有充分证据进行反驳,否则就接受原假设的断言
确定备选假设 H1 ,即与原假设对立的断言
进行假设检验时,假定原假设为真;如果有足够的证据反驳原假设,则拒绝原假设,接受备选假设
2. 选择检验统计量
(用于对假设进行检验的统计量,是与该检验关系最为密切的统计量)
选择标准:根据原假设 H0 来选择检验统计量
3. 确定用于做决策的拒绝域
拒绝域定义:假设检验的拒绝域是一组数值,这组数值给出反驳原假设的最极端证据。即我妈们指定一个拒绝域,就可以合理的拒绝原假设
我们把拒绝域的分界点称为“c”——临界值。
为了求出拒绝域,需要先定显著性水平!(一旦确定了显著性水平,就无法改变)
显著性水平(以百分数表示):度量的是一种愿望,即希望在样本结果的不可能程度达到多大时,就拒绝原假设 H0
显著性水平通常用希腊字母 α 表示。α 越小,为了拒绝H0,样本需要达到的不可能程度越高。
1、该使用多高的显著性水平?
P ( x < c ) < α ( α = 0.05 )
2、单尾检验
检测的拒绝域落在可能的数据集的一侧,选择检验水平,以 α 表示,然后确保拒绝域以相应的概率反映这个水平。尾部可以是可能数据集的左侧或者右侧,具体用哪一侧取决于备选假设 H1 。如果备选假设包含一个“<”符号,则使用左尾,此时拒绝域位于数据的低端;如果备选假设包含一个“>”符号,则使用右尾,此时拒绝域位于数据的高端
3、双尾检验
拒绝域一分为二位于数据集的两侧,选择检验水平α,然后将拒绝域一分为二,并确保整个拒绝域以相应的概率反应这个检验水平。两侧各占α,因为总和为α。
判断是否需要双尾检验的设方法是:查看备选假H1,如果H1包含一个不等号“ ≠ ”,则需要双尾检验。
4. 求出检验统计量的P值
(在假定段艳伟真的情况下,我们的试验结果的可信程度)
P值定义:某个小于或等于拒绝域方向上的一个样本数值的概率,具体求法是利用样本进行计算,然后判定样本结果是否落在假设检验的拒绝域以内,也就是说,我们通过P值确定是否该拒绝原假设。
P值怎么求:P值即为取得样本中的跟踪结果或去的拒绝域方向上的某些更为极端的结果的概率
5. 查看样本结果是否位于拒绝域内
(了解试验结果是否位于确定性限值范围内)
通过求出的P值来检查样本结果是否落在拒绝域内。
6. 做出决策
两类错误
我们通过以上的步骤,可能正确地接受或者拒绝原假设,但即使再考虑了证据的情况下,仍然有可能犯错误。你可能会拒绝一个正确的原假设,也可能接受一个实质上错误的原假设。统计学家为以上类型的错误给出了专用名称
1. 第一类错误:错误地拒绝真原假设
P(第一类错误) = α,其中α为检验的显著性水平
2. 第二类错误:错误地接受假原假设
P(第二类错误) = β
求β步骤
1、检查是否拥有H1的特定数值(没有这个数值无法计算第二类错误概率)。
2、求检验拒绝域以外的数值范围(如果检验统计量已经标准化,则该数值范围要进行逆标准化)
3、假定H1为真,求得到这些数值的概率
假设检验决策
实际情况
接受H0 | 拒绝H0 | |
---|---|---|
H0真 | 第一类错误 | |
H0假 | 第二类错误 |
3. 功效
定义:在H0为假的情况下拒绝!H0的概率,也就是说,这是我们做出正确决策而拒绝!H0的概率
功效 = 1 - β
其中β等于发生第二类错误的概率
Z-统计量 vs T-统计量
- 当样本数量足够大(z>30)时,样本抽样均值分布服从正态分布,此时可使用Z分布表
- 当样本数量很小(z<30)时,样本抽样均值分布服从t分布,此时应使用t分布表