参照类别（reference category）应该怎么选？

chatspss默认以因变量的最小编码值作为参照类别，所有非参照类别的系数都表示“相对于参照类别的相对风险比（RRR）”。建议将样本量最大的类别、或研究中最具代表性的基准类别编码为最小值，以使RRR的解读最为直观。参照类别的选择不影响模型拟合度，只影响系数的方向和数值大小。

因变量是有序的（如低/中/高）时，应该用哪个方法？

如果因变量类别之间存在明确的顺序关系（如满意度：非常不满意/不满意/一般/满意/非常满意），应使用有序逻辑回归（Ordinal Logistic），而不是多分类逻辑回归。有序逻辑回归利用了类别间的顺序信息，模型更简洁、估计更高效。本页专讲无序多分类，有序情形请参考ordinal-logistic.html。

RRR（相对风险比）大于1还是小于1代表什么？

RRR（Relative Risk Ratio，相对风险比）是多分类逻辑回归中对应OR的核心指标。RRR > 1表示该自变量每增加一个单位，选择该类别（相对于参照类别）的风险增加；RRR < 1表示风险降低；RRR = 1表示无影响。例如RRR = 2.3表示自变量每增加1，选择该类别的可能性是参照类别的2.3倍。

模型的McFadden R²达到多少算好？

与线性回归的R²不同，McFadden R²在社会科学研究中，0.10-0.20即视为有意义，0.20-0.40视为较好，超过0.40为非常好。此外还可参考Cox & Snell R²和Nagelkerke R²作为补充判断。更重要的是查看似然比检验的p值是否显著（p<0.05），以及预测准确率是否高于随机猜测的基线。

多分类逻辑回归（Multinomial Logistic）

Q: 多分类逻辑回归和二元逻辑回归有什么区别？

二元逻辑回归的因变量只有两个类别（如是/否），输出唯一一组OR值。多分类逻辑回归的因变量有3个或以上无序类别（如品牌A/B/C），以其中一个类别为参照，对每个非参照类别单独估计一组系数和RRR，输出多组结果。两者的核心逻辑一致，但多分类需要解读多组对比。

Q: 模型的McFadden R²达到多少算好？

与线性回归的R²不同，McFadden R²在社会科学研究中，0.10-0.20即视为有意义，0.20-0.40视为较好，超过0.40为非常好。此外还可参考Cox & Snell R²和Nagelkerke R²作为补充判断。更重要的是查看似然比检验的p值是否显著（p<0.05），以及预测准确率是否高于随机猜测的基线。

本页专讲无序多分类因变量（3 个或以上类别，类别间无顺序，如品牌 A/B/C、出行方式）的逻辑回归。
如果你的因变量只有两个类别（是/否、0/1），请前往二元逻辑回归；如果类别之间有顺序（如低/中/高），请前往有序逻辑回归。

      方法简介：多分类逻辑回归（Multinomial Logistic Regression，又称多项 Logit）用于研究一个或多个自变量对无序多分类因变量的影响关系。它以某一类别为参照，对每个非参照类别估计一组回归系数和相对风险比（RRR），揭示"选择 A 而非参照类别"的驱动因素，是消费者品牌选择、政治偏好研究、出行方式分析等场景的核心方法。
    

一、无序多分类因变量是什么？

无序多分类是指因变量有 3 个或以上类别，且类别之间不存在大小或优劣顺序。常见例子：

消费者选择哪个品牌（品牌 A / B / C）
用户使用哪种出行方式（公交 / 地铁 / 自驾 / 共享单车）
调查对象支持哪位候选人（候选人甲 / 乙 / 丙）
患者入院类型（内科 / 外科 / 急诊）

这类因变量不能用线性回归处理（类别没有数值意义），也不能用二元逻辑回归（因为不止两类），更不能用有序逻辑回归（因为类别无顺序）。多分类逻辑回归正是为它量身设计。

二元逻辑回归其他页

因变量：2 个类别（是/否、0/1）
输出：1 组 OR 值
查看 logistic.html →

多分类逻辑回归本页

因变量：3+ 个无序类别（A/B/C）
输出：每个非参照类别 1 组 RRR

有序逻辑回归姊妹页

因变量：3+ 个有序类别（低/中/高）
输出：1 组累积 OR
查看 ordinal-logistic.html →

二、参照类别与 RRR 怎么读

多分类逻辑回归的核心机制是：选定一个参照类别（Reference Category），模型对每个非参照类别单独估计一组系数，回答"选择该类别而非参照类别的影响因素是什么"。

参照类别

chatspss 默认以因变量编码的最小值作为参照类别。例如因变量编码为 1=品牌A、2=品牌B、3=品牌C，则品牌A（编码=1）为参照。如果你希望用其他类别作参照，只需在数据里将目标类别的编码改为最小值即可。

参照类别的选择不影响模型拟合度（AIC/BIC/似然比不变），只改变系数的方向和数值，不影响研究结论。

RRR（相对风险比）

多分类逻辑回归中对应 OR 的指标叫做 RRR（Relative Risk Ratio，相对风险比），含义：

RRR 值	含义	示例解读
RRR > 1	自变量增加 1 单位，选择该类别（vs 参照）的相对风险增加	RRR = 2.3：自变量每增加 1，选品牌B而非品牌A的可能性是原来的 2.3 倍
RRR = 1	自变量对该类别与参照类别的选择无差异	该自变量对两类别的选择没有影响
RRR < 1	自变量增加 1 单位，选择该类别（vs 参照）的相对风险降低	RRR = 0.4：自变量每增加 1，选品牌B而非品牌A的可能性下降 60%

同时需要查看 RRR 的 95% 置信区间：若区间不含 1，且 p < 0.05，则该自变量对该类别的影响显著。

三、数据要求与前提检验

项目	要求
因变量	名义尺度（定类），3 个或以上无序类别，每类建议至少 20-30 个样本
自变量	可以是连续型（定量）或分类型（定类），数量不限，但需注意多重共线性
样本量	建议每个自变量至少 10-20 个样本，总样本量通常不少于 100
独立性	各观测样本相互独立，即个体间无嵌套或重复测量（如有，需用混合模型）
无完全分离	避免某一自变量完全预测因变量的某个类别，否则系数会发散

四、用 chatspss 做多分类逻辑回归（一句话）

上传数据后，直接用自然语言描述你的研究问题即可，无需手动选参数：

      "分析年龄、收入、品牌态度对用户品牌选择（A/B/C）的影响"

      "研究性别、学历、价格敏感度哪些因素影响出行方式选择（公交/地铁/自驾/共享单车）"

chatspss 会自动识别多分类因变量，调用多分类逻辑回归模型，以编码最小值为参照类别，默认使用全进入法（Enter），输出模型拟合度和分类回归结果。

五、输出结果怎么读

表 1 — 模型似然比检验

判断整体模型是否显著优于只含截距的空模型：

-2LL（空模型 vs 最终模型）：差值越大，自变量解释力越强
似然比 chi2 / p 值：p < 0.05 表示模型整体显著
AIC / BIC：越小越好，用于与其他候选模型比较
McFadden R²、Nagelkerke R²：伪 R² 越大拟合越好；McFadden R² > 0.10 视为有意义

表 2 — 多分类回归结果汇总

结果按非参照类别分组显示，每组一个灰色表头（如"品牌B vs 品牌A"），包含：

系数（B）：该自变量对该类别 log-odds 的影响量，正值增加风险，负值降低风险
标准误（SE）：系数的估计精度
Wald chi2 / p：p < 0.05 表示该自变量对此类别选择有显著影响
RRR（exp(B)）：即相对风险比，解读方式见第二节
RRR 的 95% CI：区间不含 1 且 p < 0.05，则影响显著
显著性标记：* p<0.05，** p<0.01

      论文报告句式参考：多分类逻辑回归结果（见表X）显示，以品牌A为参照，价格敏感度对品牌B选择有显著正向影响（RRR = 2.34，95% CI [1.45, 3.78]，p < 0.01），即价格敏感度每增加1分，选择品牌B而非品牌A的相对风险增加2.34倍。
    

六、常见问题（FAQ）

Q：多分类逻辑回归和二元逻辑回归有什么区别？

二元逻辑回归的因变量只有两个类别（如是/否），输出唯一一组 OR 值。多分类逻辑回归的因变量有 3 个或以上无序类别（如品牌A/B/C），以某类别为参照，对每个非参照类别单独估计一组系数和 RRR，输出多组结果。两者核心逻辑一致，多分类需解读多组对比。二元逻辑回归请访问 logistic.html。

Q：参照类别怎么选？选不同的有影响吗？

建议将样本量最大或研究中最具基准意义的类别设为参照，以使 RRR 的解读最直观。chatspss 默认取编码最小值为参照；若要换参照，将目标类别编码改为最小值即可。参照类别的选择不影响模型拟合度（AIC/BIC/似然比检验的 p 值完全相同），只改变各系数的方向和数值，不改变研究结论。

Q：因变量是有序的（如低/中/高），应该用哪个？

如果类别间存在顺序（如满意度：1=非常不满意 → 5=非常满意），应使用有序逻辑回归（Ordinal Logistic），它利用类别顺序信息，结果更高效、更简洁。只有当类别是无序的（无法比大小）时才用多分类逻辑回归。详见 ordinal-logistic.html。

Q：RRR 和 OR 是同一件事吗？

在多分类逻辑回归中，exp(B) 通常称为 RRR（相对风险比），在二元逻辑回归中称为 OR（优势比）。两者计算方式完全相同（都是 e 的系数次方），只是名称约定有别。多分类场景下用 RRR 更准确，因为它描述的是相对于参照类别的"相对风险"，而不是严格意义的"优势"。

Q：自变量中有分类变量（如性别、专业）怎么处理？

只需在 chatspss 中正常告知即可，系统会自动识别分类型自变量，在内部进行哑变量编码，以编码最小值（或基准类）作为参照组，并在结果表中按参照类别标注。你无需手动创建虚拟变量。

Q：卡方检验和多分类逻辑回归什么时候搭配使用？

卡方检验适合单独检验某一分类自变量与多分类因变量之间的关联是否显著，但它无法同时控制其他变量。多分类逻辑回归则可以在控制多个协变量的条件下，评估每个自变量的独立影响。建议先用卡方检验做单变量筛查，再对有意义的变量纳入多分类逻辑回归做多变量分析。

多分类逻辑回归（Multinomial Logistic）

一、无序多分类因变量是什么？

二元逻辑回归 其他页

多分类逻辑回归 本页

有序逻辑回归 姊妹页

二、参照类别与 RRR 怎么读

参照类别

RRR（相对风险比）

三、数据要求与前提检验

四、用 chatspss 做多分类逻辑回归（一句话）

五、输出结果怎么读

表 1 — 模型似然比检验

表 2 — 多分类回归结果汇总

六、常见问题（FAQ）

相关方法

二元逻辑回归其他页

多分类逻辑回归本页

有序逻辑回归姊妹页