数据分析必掌握的统计学知识,为什么数据分析师要学统计学( 三 )


同时将研究者想收集证据证明其不正确的假设作为原假设H0
八、T检验
1. 主要用于样本含量较小(例如n<30),总体标准差σ未知的正态分布 。
流程如下:

数据分析必掌握的统计学知识,为什么数据分析师要学统计学

文章插图
是用t分布理论来推论差异发生的概率,从而比较两个平均数的差异是否显著;
一般检验水准α取0.05即可;
计算检验统计量的方法根据样本形式不同;
2. 独立样本T检验:
数据分析必掌握的统计学知识,为什么数据分析师要学统计学

文章插图
问题:为什么T检验查表时候要n-1?
样本均值替代总体均值损失了一个自由度
3. 配对样本t检验
分析人的早晨和晚上的身高是否不同,于是找来一拨人测他们早上和晚上的身高,这里每个人就有两个值,这里出现了配对
数据分析必掌握的统计学知识,为什么数据分析师要学统计学

文章插图
样本误差(Standard Error)
数据分析必掌握的统计学知识,为什么数据分析师要学统计学

文章插图
数据分析必掌握的统计学知识,为什么数据分析师要学统计学

文章插图
4. Pooled variance 合并方差
当样本平均数不一样,但实际上认为他们的方差是一样的时候,需要合并方差
不要被公式吓到,他的本质是两个样本方差加权平均
数据分析必掌握的统计学知识,为什么数据分析师要学统计学

文章插图
数据分析必掌握的统计学知识,为什么数据分析师要学统计学

文章插图
5. Cohen’s d
效应量(effect size):提示组间真正的差异占统计学差异的比例,值越大,组间差异越可靠 。
数据分析必掌握的统计学知识,为什么数据分析师要学统计学

文章插图
数据分析必掌握的统计学知识,为什么数据分析师要学统计学

文章插图
此文是《10周入门数据分析》系列的第7篇 。
【数据分析必掌握的统计学知识,为什么数据分析师要学统计学】想了解学习路线,可以先行阅读“学习计划 | 10周入门数据分析

推荐阅读