statis-ttest
t-test
t-test适用于检验一个或者两个群体的均值的方法。主要分为:评估单个群体和已知值之间是否存在差异(单样本t-test,one-sample t-test);两个群体之间是否存在差异(独立双样本检验);配对检测是否存在差异(配对样本t-test,paired samples t-test)
t-test的适用对象
一个或者两个群体的均值检验
t-test要求
-
数据是连续的
-
样本数据是从群体中随机抽取的。
-
方差具有同质性(即每组数据的方差相似)。
-
分布近似正态。
对于双样本 t 检验,我们必须有独立的样本。如果样本不独立,则可以采用配对 t 检验。
What if
如果sample size太小了怎么办?如果数据不符合normally distribution怎么办?
-
非参数检验:非参数检验不依赖于数据的正态分布假设,因此在样本量较小的情况下更为适用。
-
单样本情况:可以使用单样本Wilcoxon符号秩检验,也称为Wilcoxon signed-rank test。
-
双样本情况:可以使用Mann-Whitney U检验(也称为Wilcoxon秩和检验)。
-
配对样本情况:可以使用配对样本Wilcoxon符号秩检验。
-
-
Bootstrap方法:通过重复采样来估计统计量的分布。
从原始样本中随机抽取(有放回)生成许多新的样本(称为“bootstrap样本”),然后计算这些样本的统计量来估计总体的统计量分布。
-
贝叶斯方法:利用贝叶斯统计方法,通过先验分布和观测数据来更新对参数的后验分布。
贝叶斯方法可以结合先验知识,并且不依赖于大样本理论。
如果有多于两个群体的数据怎么办?
选择ANOVA,Tukey-Kramer pairwise comparison, Dunnett’s comparison to a control, and analysis of means (ANOM).
t-test的类型
检验类型 | 单样本t检验 | 双样本t检验 | 配对t检验 |
---|---|---|---|
同义词 | Student’s t检验 | - 独立组t检验 - 独立样本t检验 - 方差相等t检验 - 合并t检验 - 方差不等t检验 |
- 配对组t检验 - 依赖样本t检验 |
变量数量 | 一个 | 两个 | 两个 |
变量类型 | 连续测量 | - 连续测量 - 用于定义组的分类或命名变量 |
- 连续测量 - 用于定义组内配对的分类或命名变量 |
检验目的 | 判断总体均值是否等于某个特定值 | 判断两个不同组的总体均值是否相等 | 判断总体配对测量的差异是否为零 |
示例:测试是否… | 一组人的平均心率是否等于65 | 两组人的平均心率是否相同 | 一组人运动前后的平均心率差异是否为零 |
总体均值估计 | 样本平均值 | 每组的样本平均值 | 配对测量差异的样本平均值 |
总体标准差 | 未知,使用样本标准差 | 未知,使用每组的样本标准差 | 未知,使用配对测量差异的样本标准差 |
自由度 | 样本中的观测数减去1,或:n–1 | 每个样本的观测数之和减去2,或:n1 + n2 – 2 | 样本中的配对观测数减去1,或:n–1 |
Test Type | One-sample t-test | Two-sample t-test | Paired t-test |
---|---|---|---|
Synonyms | Student’s t-test | - Independent groups t-test - Independent samples t-test - Equal variances t-test - Pooled t-test - Unequal variances t-test |
- Paired groups t-test - Dependent samples t-test |
Number of variables | One | Two | Two |
Type of variable | Continuous measurement | - Continuous measurement - Categorical or Nominal to define groups |
- Continuous measurement - Categorical or Nominal to define pairing within group |
Purpose of test | Decide if the population mean is equal to a specific value or not | Decide if the population means for two different groups are equal or not | Decide if the difference between paired measurements for a population is zero or not |
Example: test if… | Mean heart rate of a group of people is equal to 65 or not | Mean heart rates for two groups of people are the same or not | Mean difference in heart rate for a group of people before and after exercise is zero or not |
Estimate of population mean | Sample average | Sample average for each group | Sample average of the differences in paired measurements |
Population standard deviation | Unknown, use sample standard deviation | Unknown, use sample standard deviations for each group | Unknown, use sample standard deviation of differences in paired measurements |
Degrees of freedom | Number of observations in sample minus 1, or: n–1 | Sum of observations in each sample minus 2, or: n1 + n2 – 2 | Number of paired observations in sample minus 1, or: n–1 |
单侧/双侧检验 | One-tailed vs. two-tailed tests
如果我们只关心是否A和B显著不同,则使用two-tailed test。对此我们的假设为
在该例子中,我们并不关心A和B谁大谁小,我们只关心它们俩是否显著不一样。
而如果我们想验证是否A显著大于B(或者A是否显著小于B),则我们使用one-tailed test。对此我们的假设为:
理论步骤
-
定义null hypothesis()和alternative hypothesis()
-
确定阈值,通常使用0.05作为p-value的阈值。t-test的p-value如果大于0.05,则接受原假设 ,如果p-value小于0.05,则接受alternative hypothesis .
-
进行t-test检验。
ANOVA
参考:
https://www.jmp.com/en_us/statistics-knowledge-portal/t-test.html