← 返回方法库首页

多分类逻辑回归(Multinomial Logistic)

本页专讲无序多分类因变量(3 个或以上类别,类别间无顺序,如品牌 A/B/C、出行方式)的逻辑回归。
如果你的因变量只有两个类别(是/否、0/1),请前往 二元逻辑回归; 如果类别之间有顺序(如低/中/高),请前往 有序逻辑回归
方法简介:多分类逻辑回归(Multinomial Logistic Regression,又称多项 Logit)用于研究一个或多个自变量对无序多分类因变量的影响关系。它以某一类别为参照,对每个非参照类别估计一组回归系数和相对风险比(RRR),揭示"选择 A 而非参照类别"的驱动因素,是消费者品牌选择、政治偏好研究、出行方式分析等场景的核心方法。

一、无序多分类因变量是什么?

无序多分类是指因变量有 3 个或以上类别,且类别之间不存在大小或优劣顺序。常见例子:

这类因变量不能用线性回归处理(类别没有数值意义),也不能用二元逻辑回归(因为不止两类),更不能用有序逻辑回归(因为类别无顺序)。多分类逻辑回归正是为它量身设计。

二元逻辑回归 其他页

因变量:2 个类别(是/否、0/1)
输出:1 组 OR 值
查看 logistic.html →

多分类逻辑回归 本页

因变量:3+ 个无序类别(A/B/C)
输出:每个非参照类别 1 组 RRR

有序逻辑回归 姊妹页

因变量:3+ 个有序类别(低/中/高)
输出:1 组累积 OR
查看 ordinal-logistic.html →

二、参照类别与 RRR 怎么读

多分类逻辑回归的核心机制是:选定一个参照类别(Reference Category),模型对每个非参照类别单独估计一组系数,回答"选择该类别而非参照类别的影响因素是什么"。

参照类别

chatspss 默认以因变量编码的最小值作为参照类别。例如因变量编码为 1=品牌A、2=品牌B、3=品牌C,则品牌A(编码=1)为参照。如果你希望用其他类别作参照,只需在数据里将目标类别的编码改为最小值即可。

参照类别的选择不影响模型拟合度(AIC/BIC/似然比不变),只改变系数的方向和数值,不影响研究结论。

RRR(相对风险比)

多分类逻辑回归中对应 OR 的指标叫做 RRR(Relative Risk Ratio,相对风险比),含义:

RRR 值 含义 示例解读
RRR > 1 自变量增加 1 单位,选择该类别(vs 参照)的相对风险增加 RRR = 2.3:自变量每增加 1,选品牌B而非品牌A的可能性是原来的 2.3 倍
RRR = 1 自变量对该类别与参照类别的选择无差异 该自变量对两类别的选择没有影响
RRR < 1 自变量增加 1 单位,选择该类别(vs 参照)的相对风险降低 RRR = 0.4:自变量每增加 1,选品牌B而非品牌A的可能性下降 60%

同时需要查看 RRR 的 95% 置信区间:若区间不含 1,且 p < 0.05,则该自变量对该类别的影响显著。

三、数据要求与前提检验

项目 要求
因变量 名义尺度(定类),3 个或以上无序类别,每类建议至少 20-30 个样本
自变量 可以是连续型(定量)或分类型(定类),数量不限,但需注意多重共线性
样本量 建议每个自变量至少 10-20 个样本,总样本量通常不少于 100
独立性 各观测样本相互独立,即个体间无嵌套或重复测量(如有,需用混合模型)
无完全分离 避免某一自变量完全预测因变量的某个类别,否则系数会发散

四、用 chatspss 做多分类逻辑回归(一句话)

上传数据后,直接用自然语言描述你的研究问题即可,无需手动选参数:

"分析年龄、收入、品牌态度对用户品牌选择(A/B/C)的影响"

"研究性别、学历、价格敏感度哪些因素影响出行方式选择(公交/地铁/自驾/共享单车)"

chatspss 会自动识别多分类因变量,调用多分类逻辑回归模型,以编码最小值为参照类别,默认使用全进入法(Enter),输出模型拟合度和分类回归结果。

五、输出结果怎么读

表 1 — 模型似然比检验

判断整体模型是否显著优于只含截距的空模型:

表 2 — 多分类回归结果汇总

结果按非参照类别分组显示,每组一个灰色表头(如"品牌B vs 品牌A"),包含:

论文报告句式参考:多分类逻辑回归结果(见表X)显示,以品牌A为参照,价格敏感度对品牌B选择有显著正向影响(RRR = 2.34,95% CI [1.45, 3.78],p < 0.01),即价格敏感度每增加1分,选择品牌B而非品牌A的相对风险增加2.34倍。

六、常见问题(FAQ)

Q:多分类逻辑回归和二元逻辑回归有什么区别?

二元逻辑回归的因变量只有两个类别(如是/否),输出唯一一组 OR 值。多分类逻辑回归的因变量有 3 个或以上无序类别(如品牌A/B/C),以某类别为参照,对每个非参照类别单独估计一组系数和 RRR,输出多组结果。两者核心逻辑一致,多分类需解读多组对比。二元逻辑回归请访问 logistic.html

Q:参照类别怎么选?选不同的有影响吗?

建议将样本量最大研究中最具基准意义的类别设为参照,以使 RRR 的解读最直观。chatspss 默认取编码最小值为参照;若要换参照,将目标类别编码改为最小值即可。参照类别的选择不影响模型拟合度(AIC/BIC/似然比检验的 p 值完全相同),只改变各系数的方向和数值,不改变研究结论。

Q:因变量是有序的(如低/中/高),应该用哪个?

如果类别间存在顺序(如满意度:1=非常不满意 → 5=非常满意),应使用有序逻辑回归(Ordinal Logistic),它利用类别顺序信息,结果更高效、更简洁。只有当类别是无序的(无法比大小)时才用多分类逻辑回归。详见 ordinal-logistic.html

Q:RRR 和 OR 是同一件事吗?

在多分类逻辑回归中,exp(B) 通常称为 RRR(相对风险比),在二元逻辑回归中称为 OR(优势比)。两者计算方式完全相同(都是 e 的系数次方),只是名称约定有别。多分类场景下用 RRR 更准确,因为它描述的是相对于参照类别的"相对风险",而不是严格意义的"优势"。

Q:自变量中有分类变量(如性别、专业)怎么处理?

只需在 chatspss 中正常告知即可,系统会自动识别分类型自变量,在内部进行哑变量编码,以编码最小值(或基准类)作为参照组,并在结果表中按参照类别标注。你无需手动创建虚拟变量。

Q:卡方检验和多分类逻辑回归什么时候搭配使用?

卡方检验适合单独检验某一分类自变量与多分类因变量之间的关联是否显著,但它无法同时控制其他变量。多分类逻辑回归则可以在控制多个协变量的条件下,评估每个自变量的独立影响。建议先用卡方检验做单变量筛查,再对有意义的变量纳入多分类逻辑回归做多变量分析。

相关方法

立即使用 chatspss 进行多分类逻辑回归