无序多分类是指因变量有 3 个或以上类别,且类别之间不存在大小或优劣顺序。常见例子:
这类因变量不能用线性回归处理(类别没有数值意义),也不能用二元逻辑回归(因为不止两类),更不能用有序逻辑回归(因为类别无顺序)。多分类逻辑回归正是为它量身设计。
因变量:2 个类别(是/否、0/1)
输出:1 组 OR 值
查看 logistic.html →
因变量:3+ 个无序类别(A/B/C)
输出:每个非参照类别 1 组 RRR
因变量:3+ 个有序类别(低/中/高)
输出:1 组累积 OR
查看 ordinal-logistic.html →
多分类逻辑回归的核心机制是:选定一个参照类别(Reference Category),模型对每个非参照类别单独估计一组系数,回答"选择该类别而非参照类别的影响因素是什么"。
chatspss 默认以因变量编码的最小值作为参照类别。例如因变量编码为 1=品牌A、2=品牌B、3=品牌C,则品牌A(编码=1)为参照。如果你希望用其他类别作参照,只需在数据里将目标类别的编码改为最小值即可。
参照类别的选择不影响模型拟合度(AIC/BIC/似然比不变),只改变系数的方向和数值,不影响研究结论。
多分类逻辑回归中对应 OR 的指标叫做 RRR(Relative Risk Ratio,相对风险比),含义:
| RRR 值 | 含义 | 示例解读 |
|---|---|---|
| RRR > 1 | 自变量增加 1 单位,选择该类别(vs 参照)的相对风险增加 | RRR = 2.3:自变量每增加 1,选品牌B而非品牌A的可能性是原来的 2.3 倍 |
| RRR = 1 | 自变量对该类别与参照类别的选择无差异 | 该自变量对两类别的选择没有影响 |
| RRR < 1 | 自变量增加 1 单位,选择该类别(vs 参照)的相对风险降低 | RRR = 0.4:自变量每增加 1,选品牌B而非品牌A的可能性下降 60% |
同时需要查看 RRR 的 95% 置信区间:若区间不含 1,且 p < 0.05,则该自变量对该类别的影响显著。
| 项目 | 要求 |
|---|---|
| 因变量 | 名义尺度(定类),3 个或以上无序类别,每类建议至少 20-30 个样本 |
| 自变量 | 可以是连续型(定量)或分类型(定类),数量不限,但需注意多重共线性 |
| 样本量 | 建议每个自变量至少 10-20 个样本,总样本量通常不少于 100 |
| 独立性 | 各观测样本相互独立,即个体间无嵌套或重复测量(如有,需用混合模型) |
| 无完全分离 | 避免某一自变量完全预测因变量的某个类别,否则系数会发散 |
上传数据后,直接用自然语言描述你的研究问题即可,无需手动选参数:
"分析年龄、收入、品牌态度对用户品牌选择(A/B/C)的影响""研究性别、学历、价格敏感度哪些因素影响出行方式选择(公交/地铁/自驾/共享单车)"
chatspss 会自动识别多分类因变量,调用多分类逻辑回归模型,以编码最小值为参照类别,默认使用全进入法(Enter),输出模型拟合度和分类回归结果。
判断整体模型是否显著优于只含截距的空模型:
结果按非参照类别分组显示,每组一个灰色表头(如"品牌B vs 品牌A"),包含:
二元逻辑回归的因变量只有两个类别(如是/否),输出唯一一组 OR 值。多分类逻辑回归的因变量有 3 个或以上无序类别(如品牌A/B/C),以某类别为参照,对每个非参照类别单独估计一组系数和 RRR,输出多组结果。两者核心逻辑一致,多分类需解读多组对比。二元逻辑回归请访问 logistic.html。
建议将样本量最大或研究中最具基准意义的类别设为参照,以使 RRR 的解读最直观。chatspss 默认取编码最小值为参照;若要换参照,将目标类别编码改为最小值即可。参照类别的选择不影响模型拟合度(AIC/BIC/似然比检验的 p 值完全相同),只改变各系数的方向和数值,不改变研究结论。
如果类别间存在顺序(如满意度:1=非常不满意 → 5=非常满意),应使用有序逻辑回归(Ordinal Logistic),它利用类别顺序信息,结果更高效、更简洁。只有当类别是无序的(无法比大小)时才用多分类逻辑回归。详见 ordinal-logistic.html。
在多分类逻辑回归中,exp(B) 通常称为 RRR(相对风险比),在二元逻辑回归中称为 OR(优势比)。两者计算方式完全相同(都是 e 的系数次方),只是名称约定有别。多分类场景下用 RRR 更准确,因为它描述的是相对于参照类别的"相对风险",而不是严格意义的"优势"。
只需在 chatspss 中正常告知即可,系统会自动识别分类型自变量,在内部进行哑变量编码,以编码最小值(或基准类)作为参照组,并在结果表中按参照类别标注。你无需手动创建虚拟变量。
卡方检验适合单独检验某一分类自变量与多分类因变量之间的关联是否显著,但它无法同时控制其他变量。多分类逻辑回归则可以在控制多个协变量的条件下,评估每个自变量的独立影响。建议先用卡方检验做单变量筛查,再对有意义的变量纳入多分类逻辑回归做多变量分析。