我做的是 t 检验，应该用哪个效应量指标？

t 检验（两组均值比较）最常用 Cohen's d。独立样本 t 检验和配对 t 检验都可以报告 Cohen's d，一般认为 d=0.2 小、d=0.5 中、d=0.8 大。方差分析（ANOVA）则推荐报告 η²（eta squared）或偏 η²（partial eta squared）。

效应量很小，还需要报告吗？

必须报告。效应量不论大小都要在论文中呈现，这是学术规范的要求。APA 第 7 版明确要求报告效应量。效应量小并不是坏事，有时小效应在医学或政策领域也有重要意义，应在讨论中说明其实际意义。

效应量是什么？Cohen's d、η²、r 怎么解读

Q: p<0.05 但效应量很小，说明什么？

这说明差异统计上显著，但实际意义很小。大样本量能让微小差异也达到显著，但这种差异在实践中未必有价值。论文中需同时报告效应量，让读者自己判断实际意义的大小。

Q: 样本量与效应量有什么关系？

样本量影响统计显著性（p 值），但不影响效应量本身的大小。样本量越大，越容易让小效应量的差异也达到显著。因此大样本研究中，p 值显著不代表效果大，必须同时看效应量。效应量是样本量无关的指标，更能反映真实的效果大小。

分类：统计百科 | 更新时间：2026/06/17

1. 为什么光看 p 值不够？

你跑完 t 检验，得到 p = 0.003，兴奋地写进论文。但审稿人回来一句话："请补充效应量。"

这是因为 p 值只能回答"差异是不是真实存在的"，却告诉不了你"这个差异有多大、有没有实际意义"。

      一个真实的悖论：用 50,000 名被试做实验，两组均分差 0.1 分（满分 100 分），p 值照样能达到 <0.001。这在统计上高度显著，但 0.1 分的差异在现实中毫无意义。
    

效应量（effect size）正是为了解决这个问题而存在的。它衡量的是差异或关联的实际大小，与样本量无关。

目前，APA 第 7 版（2020）、Nature 等顶刊、国内越来越多的学术期刊和毕业论文答辩都明确要求：报告统计结果时，必须同时给出效应量。

2. 效应量是什么（统计显著 vs 实际意义）

效应量是一类标准化的、与样本量无关的指标，用来描述：

两组之间差异有多大（如 Cohen's d）
自变量能解释多少比例的因变量变异（如 η²）
两个变量之间关联有多强（如 r）

可以用一句话理解：p 值告诉你"有没有效果"，效应量告诉你"效果有多强"。

      类比：医生说"这种药对降压有显著效果（p=0.02）"，但效应量告诉你，平均只降了 1 mmHg——这在临床上几乎没有意义。而另一种药 p=0.08（不显著），但效应量显示平均降了 12 mmHg——可能因为样本量太小才没显著，值得进一步研究。
    

3. 常见效应量及大中小判断标准

不同的统计分析方法对应不同的效应量指标。下表汇总了最常用的五种，及 Cohen（1988）等提出的大中小参考阈值：

效应量	适用分析	小	中	大	含义
Cohen's d	独立/配对 t 检验、两组均值比较	0.2	0.5	0.8	均值差异除以合并标准差，衡量两组"有多少个标准差的距离"
η²（eta squared）	单因素 / 多因素方差分析（ANOVA）	0.01	0.06	0.14	自变量解释因变量总变异的比例；偏 η²（partial η²）更常用于多因素
r（皮尔逊相关系数）	相关分析、也可用于 t 检验	0.1	0.3	0.5	两变量线性关联强度，范围 -1 到 1；r² 表示解释的方差比例
OR（比值比）	二元逻辑回归、卡方检验	1.5	2.5	4.0	某因素存在时结果发生的概率是不存在时的多少倍；1 表示无效应
f²（Cohen's f²）	线性回归（R² 增量）、多层回归	0.02	0.15	0.35	回归模型新增变量带来的解释力提升，f² = R² / (1-R²)

      注意：大中小阈值是 Cohen（1988）基于社会科学领域经验提出的参考值，并非绝对标准。医学、教育、心理学等领域对"大效应"的期望值不同。报告时应结合专业领域背景进行解读，不能机械套用。
    

Cohen's d 怎么理解

Cohen's d = （A 组均值 - B 组均值）/ 合并标准差。直观理解：d = 0.5 意味着两组分布重叠约 67%，差异肉眼可见但不悬殊；d = 0.8 意味着重叠约 53%，差异相当明显。

η² 和偏 η² 的区别

η² = 该因素的平方和 / 总平方和（受其他因素影响）；偏 η²（partial η²）= 该因素的平方和 /（该因素平方和 + 误差平方和），排除其他因素的干扰，在多因素 ANOVA 中更常报告。SPSS 和 chatspss 默认输出偏 η²。

r 作为效应量

对于 t 检验，也可以把 t 值转换为 r：r = t / sqrt(t² + df)。相关分析中的皮尔逊 r 直接就是效应量。r = 0.3 表示两变量共享约 9% 的方差（r² = 0.09）。

4. 怎么在论文中报告效应量

APA 第 7 版推荐的报告格式，将效应量紧跟在统计检验结果后面给出：

t 检验 + Cohen's d：

实验组（M = 78.5, SD = 9.2）显著高于对照组（M = 71.3, SD = 10.1），t(58) = 2.91, p = .005, d = 0.74，效应量达到中等偏大水平。

单因素 ANOVA + η²：
三组之间在学习成绩上存在显著差异，F(2, 87) = 8.34, p < .001, η² = .16，效应量较大。

相关分析 + r：
焦虑得分与学习效率之间存在显著负相关，r(120) = -.42, p < .001，效应量中等。

逻辑回归 + OR：

吸烟显著预测肺病风险，OR = 3.21, 95% CI [1.87, 5.52], p < .001，暴露组发病风险约为非暴露组的 3.2 倍。

报告要点：

效应量符号斜体（d、r、η²）；
同时给出置信区间（CI）更好；
结合大中小阈值在文字中说明效应量级别；
若效应量小，不要隐瞒，要在讨论中说明局限性或实际情境下的意义。

5. 用 chatspss 自动获取效应量

传统做法是跑完分析再手动用公式换算效应量，容易出错。chatspss 在运行统计分析时自动在报告中附带效应量，无需额外计算。

      上传数据后，对 chatspss 说：

      "对实验组和对照组的前测成绩做独立样本 t 检验，输出 Cohen's d"

      "做单因素方差分析，比较三个教学方式对考试成绩的影响，报告 η²"

      "分析年龄与焦虑量表得分的相关性，给出 r 和 r²"

chatspss 输出内容包括：

标准化效应量（Cohen's d / η² / r / OR 视分析类型而定）
效应量大中小的自动判断说明
可直接粘贴进论文的 APA 格式报告句式
三线表格式的统计汇总

6. 常见问题

Q：p<0.05 但效应量很小，说明什么？

这说明差异在统计上是真实的（排除了偶然），但实际规模很小。大样本量会让微小差异也达到显著。论文中需同时呈现效应量，让读者自行判断结果是否具有实际意义。审稿人通常会对"显著但效应极小"的结果追问实践价值。

Q：我做的是 t 检验，应该选哪个效应量指标？

两组均值比较（独立样本 t 检验、配对 t 检验）首选 Cohen's d，标准明确（0.2/0.5/0.8），被社会科学领域广泛接受。如果你的期刊或导师偏好 r，也可以同时报告：r = t / sqrt(t² + df)。方差分析（ANOVA）则用 η² 或偏 η²，不要混用 Cohen's d。

Q：效应量很小，还要报告吗？

必须报告。APA 第 7 版明确要求效应量不论大小都要呈现，这是学术规范的底线。效应量小本身不是问题，部分领域（如大规模流行病学研究）小效应同样有重要政策意义。需要在讨论中结合专业背景说明其含义，而不是因为小就隐藏。

Q：样本量与效应量有什么关系？

样本量只影响 p 值（检验效能），不影响效应量本身的大小。效应量是"样本量无关"的指标，这正是它的价值所在。大样本研究中 p 值几乎必然显著，此时效应量才是判断结果重要性的关键依据。做功效分析（power analysis）时，也需要先预估效应量才能确定所需样本量——可参考样本量计算页。

让 chatspss 自动帮你计算并报告效应量

上传 Excel / SPSS 数据，说一句话，chatspss 自动输出 Cohen's d、η²、r——含 APA 格式报告，直接贴进论文。

立即免费体验