卡方检验的应用条件

卡方检验的应用条件
一、适用于四格表应用条件:
1、随机样本数据 。两个独立样本比较可以分以下3种情况:
(1)所有的理论数T≥5并且总样本量n≥40,用Pearson卡方进行检验 。
(2)如果理论数T<5但T≥1,并且1≥40,用连续性校正的卡方进行检验 。
(3)如果有理论数T<1或n<40,则用Fisher’s检验 。
2、卡方检验的理论频数不能太小 。
二、R×C表卡方检验应用条件:
1、R×C表中理论数小于5的格子不能超过1/5;
2、不能有小于1的理论数 。如果实验中有不符合R×C表的卡方检验,可以通过增加样本数、列合并来实现 。
卡方检验的基本原理
卡方检验就是统计样本的实际观测值与理论推断值之间的偏离程度,实际观测值与理论推断值之间的偏离程度就决定卡方值的大小,卡方值越大,越不符合;卡方值越小,偏差越小,越趋于符合,若两个值完全相等时,卡方值就为0,表明理论值完全符合 。
注意:卡方检验针对分类变量 。
t检验的应用条件是什么T检验的条件:要比较的数据必须是计量数据而非计数数据,组别为2组,2组以上则是做方差分析 。t检验通常需要做一个方差齐性检验 。T检验,亦称student t检验(Student's t test),主要用于样本含量较小(例如n<30),总体标准差σ未知的正态分布资料 。t检验是用t分布理论来推论差异发生的概率,从而比较两个平均数的差异是否显著 。它与z检验、卡方检验并列 。t检验是戈斯特为了观测酿酒质量而发明的 。
卡方校正公式使用条件卡方检验用于:推断两个及两个以上总体率或构成比是否有差别,两个分类变量间有无相关关系,多个率的趋势检验,以及两个率的等效检验等 。此外,也用于频数分布的拟合优度检验 。


对不同的设计类型的资料,检验的应用条件不同:


(1) 完全随机设计两样本率的比较


1) 当n>40,且T≥5时,用非连续性校正值;


若所得P≈α,则改用四格表的确切概率法 。


2) 当n≥40,且有1≤T<5时,用连续性校正值 。


3) n<40,或有T<1时,不能用检验,应当用四格表的确切概率法 。


(2) 配对设计四格表


1) 当b+c≥40,


2) 当b+c<40,需作连续性校正,


(3) 行列表资料


1) 不宜有1/5以上格子的理论频数小于5,或有1个格子的理论频数小于1;


2) 单向有序行列表,在比较各处理组的效应有无差别时,应该用秩和检验或Ridit检验;


3) 多个样本率(或构成比)比较的检验时,结论为拒绝无效假设时,只能认为各总体率(或总体构成比)之间总的说来有差别,但不能说明它们彼此之间都有差别,或某两者间有差别 。若想进一步了解哪两者的差别有统计学意义,可用分割法 。
t检验方法的选用及其适用条件有哪些应用条件
1、已知一个总体均数;
2、可得到一个样本均数及该样本标准差;
3、样本来自正态或近似正态总体 。
注意事项
1、选用的检验方法必须符合其适用条件(注意:t检验的前提:来自正态分布总体; 随机样本 ;均数比较时,要求两样本总体方差相等,即具有方差齐性) 。
理论上,即使样本量很小时,也可以进行t检验 。(如样本量为10,一些学者声称甚至更小的样本也行),只要每组中变量呈正态分布,两组方差不会明显不同 。如上所述,可以通过观察数据的分布或进行正态性检验估计数据的正态假设 。
方差齐性的假设可进行F检验,或进行更有效的Levene's检验 。如果不满足这些条件,可以采用校正的t检验,或者换用非参数检验代替t检验进行两组间均值的比较 。

推荐阅读