t-test

t-test适用于检验一个或者两个群体的均值的方法。主要分为:评估单个群体和已知值之间是否存在差异(单样本t-test,one-sample t-test);两个群体之间是否存在差异(独立双样本检验);配对检测是否存在差异(配对样本t-test,paired samples t-test)

t-test的适用对象

一个或者两个群体的均值检验

t-test要求

  1. 数据是连续的

  2. 样本数据是从群体中随机抽取的。

  3. 方差具有同质性(即每组数据的方差相似)。

  4. 分布近似正态。

对于双样本 t 检验,我们必须有独立的样本。如果样本不独立,则可以采用配对 t 检验。

What if

如果sample size太小了怎么办?如果数据不符合normally distribution怎么办?

  • 非参数检验:非参数检验不依赖于数据的正态分布假设,因此在样本量较小的情况下更为适用。

    • 单样本情况:可以使用单样本Wilcoxon符号秩检验,也称为Wilcoxon signed-rank test。

    • 双样本情况:可以使用Mann-Whitney U检验(也称为Wilcoxon秩和检验)。

    • 配对样本情况:可以使用配对样本Wilcoxon符号秩检验。

  • Bootstrap方法:通过重复采样来估计统计量的分布。

    从原始样本中随机抽取(有放回)生成许多新的样本(称为“bootstrap样本”),然后计算这些样本的统计量来估计总体的统计量分布。

  • 贝叶斯方法:利用贝叶斯统计方法,通过先验分布和观测数据来更新对参数的后验分布。

    贝叶斯方法可以结合先验知识,并且不依赖于大样本理论。

如果有多于两个群体的数据怎么办?

选择ANOVA,Tukey-Kramer pairwise comparison, Dunnett’s comparison to a control, and analysis of means (ANOM).

t-test的类型

检验类型 单样本t检验 双样本t检验 配对t检验
同义词 Student’s t检验 - 独立组t检验
- 独立样本t检验
- 方差相等t检验
- 合并t检验
- 方差不等t检验
- 配对组t检验
- 依赖样本t检验
变量数量 一个 两个 两个
变量类型 连续测量 - 连续测量
- 用于定义组的分类或命名变量
- 连续测量
- 用于定义组内配对的分类或命名变量
检验目的 判断总体均值是否等于某个特定值 判断两个不同组的总体均值是否相等 判断总体配对测量的差异是否为零
示例:测试是否… 一组人的平均心率是否等于65 两组人的平均心率是否相同 一组人运动前后的平均心率差异是否为零
总体均值估计 样本平均值 每组的样本平均值 配对测量差异的样本平均值
总体标准差 未知,使用样本标准差 未知,使用每组的样本标准差 未知,使用配对测量差异的样本标准差
自由度 样本中的观测数减去1,或:n–1 每个样本的观测数之和减去2,或:n1 + n2 – 2 样本中的配对观测数减去1,或:n–1

Test Type One-sample t-test Two-sample t-test Paired t-test
Synonyms Student’s t-test - Independent groups t-test
- Independent samples t-test
- Equal variances t-test
- Pooled t-test
- Unequal variances t-test
- Paired groups t-test
- Dependent samples t-test
Number of variables One Two Two
Type of variable Continuous measurement - Continuous measurement
- Categorical or Nominal to define groups
- Continuous measurement
- Categorical or Nominal to define pairing within group
Purpose of test Decide if the population mean is equal to a specific value or not Decide if the population means for two different groups are equal or not Decide if the difference between paired measurements for a population is zero or not
Example: test if… Mean heart rate of a group of people is equal to 65 or not Mean heart rates for two groups of people are the same or not Mean difference in heart rate for a group of people before and after exercise is zero or not
Estimate of population mean Sample average Sample average for each group Sample average of the differences in paired measurements
Population standard deviation Unknown, use sample standard deviation Unknown, use sample standard deviations for each group Unknown, use sample standard deviation of differences in paired measurements
Degrees of freedom Number of observations in sample minus 1, or: n–1 Sum of observations in each sample minus 2, or: n1 + n2 – 2 Number of paired observations in sample minus 1, or: n–1

单侧/双侧检验 | One-tailed vs. two-tailed tests

如果我们只关心是否A和B显著不同,则使用two-tailed test。对此我们的假设为

H0:A=BH1:ABH_0: A = B\\ H_1: A\neq B

在该例子中,我们并不关心A和B谁大谁小,我们只关心它们俩是否显著不一样。

而如果我们想验证是否A显著大于B(或者A是否显著小于B),则我们使用one-tailed test。对此我们的假设为:

H0:ABH1:A<BH_0: A \geq B \\ H_1: A<B

理论步骤

  1. 定义null hypothesis(H0H_0)和alternative hypothesis(H1H_1)

  2. 确定阈值,通常使用0.05作为p-value的阈值。t-test的p-value如果大于0.05,则接受原假设 H0H_0,如果p-value小于0.05,则接受alternative hypothesis H1H_1.

  3. 进行t-test检验。

ANOVA


参考:

https://www.jmp.com/en_us/statistics-knowledge-portal/t-test.html