统计推断的基本问题可以分为两类:1、估计问题;2、假设检验问题。
- 一个总体或两个总体均值差的Z检验与t检验,对于总体偏离正态性是==稳健的==。
- 而一个总体方差的卡方检验 与 两个总体方差比的F检验,对于总体偏离正态性是十分==不稳健的==。
- 如果要使用它们,就必须先对给出的样本进行检验,如经过检验认为有理由认为样本来自正态总体才能使用!!!
假设检验
- 统计推断的另一类重要问题就是假设检验问题
- 假设检验(hypothesis testing),又称统计假设检验,是用来判断样本与样本、样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。
- 显著性检验是假设检验中最常用的一种方法,也是一种最基本的统计推断形式,其基本原理是先对总体的特征做出某种假设,然后通过抽样研究的统计推理,对此假设应该被拒绝还是接受做出推断。
- 常用的假设检验方法有Z检验、t检验、卡方检验、F检验等 。
1、基本概念
一、假设检验问题
- 总体分布未知
- 分布类型不知道:非参数假设
- 分布类型已知,参数未知:参数假设
- 对总体分布未知的推断称之为==假设==:
- 对总体分布类型不知道,提出的假设叫==非参数假设==
- 对总体分布类型已知,参数未知的假设,叫==参数假设==
- 假设检验:
- ==参数假设检验==
- ==非参数假设检验==
二、假设检验基本概念
- 假设: 对总体未知的论断
- 原(或零)假设: H
0, 不能轻易否定 - 备择假设: H
1 - 第 I 类错误: H
0为真,拒绝H0 - 第 II 类错误: H
0不为真, 接受 H0 - 双边检验: 拒绝域在两边
- 右边检验: 拒绝域在右边
- 左边检验: 拒绝域在左边
- ==方差齐次==:总体方差相等
三、假设检验的基本思想与步骤
- ==思想==:
- 1、从样本出发, 构造==检验统计量T==, 在H
0成立下, ==T的分布已知== - 2、构造检验法则, 实质就是 ==找小概率事件==, 小事件发生则拒绝H
0, 否则接受
- 1、从样本出发, 构造==检验统计量T==, 在H
- ==步骤==:
- 1、根据实际问题的要求,提出原假设H
0, 备择假设H1, 其基本准则: - 1、保护原假设
- 2、原假设维持现状
- 3、原假设取简单假设
- 2、假定==H
0==成立, 构造(选取)==检验统计量T== —-需要分布已知 - 3、对于给定的 α、n , 找到小概率事件(给出拒绝域的形式)
- 4、由样本(x
1, x2, …, xn)值 求出T的值 - 5、若落在拒绝域 ,则拒绝H
0, 否则接受
- 1、根据实际问题的要求,提出原假设H
四、两类错误
- 第一类错误: 弃真错误, H
0为真,拒绝H0, 所犯概率为 ==α== - 第二类错误: 纳伪错误, H
0不为真, 接受 H0所犯概率为 ==β== - 保证第一类错误概率α小的前提下, 尽可能减小第二类错误的概率β
决策 | H |
H |
---|---|---|
接受H |
正确决策 概率为 1-α | 第二类错误 概率为 β |
拒绝H |
第一类错误 概率为 α | 正确决策 概率为 1-β |
基本思想
假设检验的基本思想是“小概率事件”原理,其统计推断方法是带有某种概率性质的反证法。
小概率思想是指小概率事件在一次试验中基本上不会发生。
反证法思想是先提出检验假设,再用适当的统计方法,利用小概率原理,确定假设是否成立。即为了检验一个假设H0是否正确,首先假定该假设H0正确,然后根据样本对假设H0做出接受或拒绝的决策。如果样本观察值导致了“小概率事件”发生,就应拒绝假设H0,否则应接受假设H0。
假设检验中所谓“小概率事件”,并非逻辑中的绝对矛盾,而是基于人们在实践中广泛采用的原则,即小概率事件在一次试验中是几乎不发生的,但概率小到什么程度才能算作“小概率事件”,显然,“小概率事件”的概率越小,否定原假设H0就越有说服力,常记这个概率值为α(0<α<1),称为检验的显著性水平。
对于不同的问题,检验的显著性水平α不一定相同,一般认为,事件发生的概率小于0.1、0.05或0.01等,即“小概率事件” 。
2、正态总体的参数的假设检验
- X
N(μ, δ^2^), (X1, X2, …, Xn) 为取自总体X的样本, 样本值为 (x1, x2, …, xn~), 检验水平为α.
单个总体N(μ, δ^2^)均值的μ检验
两个正态总体N(μ, δ^2^)均值差的检验(t检验)
单个总体的方差假设检验
两个总体的方差假设检验
基于成对数据的检验(t检验)
- 有时为了比较两种产品、两种仪器、两种方法等的差异,我们常在相同的条件下做对比试验,得到一批成对比的观察值,然后分析观察数据作出推断。这种方法常称为==逐对比较法==
思想与步骤
3、分布拟合检验
在实际问题中,有时不能知道总体服从什么类型的分布,这是就需要根据样本来检验关于分布的假设。
==卡方拟合检验法==:是检验总体分布的较一般的方法,犯第二类错误的概率往往比较大
==偏度、峰度检验法== 与 ==夏皮罗-威尔克检验法==:是检验总体分布的较为有效的方法
卡方拟合检验法
偏度、峰度检验法
- 使用这一检验法时 样本容量以大于 100 为宜。
夏皮罗-威尔克检验法
- 夏皮罗-威尔克检验法 简称==W检验==,当样本容量n满足 8 <= n <= 50 时,它可以检验总体的正态性。
4、秩和检验
- 秩和检验(rank sum test)又称顺序和检验,它是一种非参数检验(nonparametric test)。
- 它不依赖于总体分布的具体形式,应用时可以==不考虑被研究对象为何种分布以及分布是否已知==,因而实用性较强 。
对配对比较的资料应采用符号秩和检验(signed-rank test)
多个样本比较的秩和检验可用Kruskal-Wallis法
两样本成组资料的比较应用Wilcoxon秩和检验
参考链接
5、假设检验问题的p值法
定义
- 假设检验问题的p值(probability value)是由检验统计量的样本观察值的得出的原假设可==被拒绝== 的 ==最小显著性水平==。
规则
- 若p ≤ α, 则拒绝H
0 - 若p > α, 则接受H
0