进阶方法

有序Logit(Logistic)分析

案例数据

300 行三甲医院门诊患者就诊体验问卷,因变量为满意度等级(1=很不满意 / 2=不满意 / 3=一般 / 4=满意 / 5=很满意,共 5 级有序),4 个候选自变量覆盖等待时长、就诊时长、医生态度评分与收费合理性,演示有序 Logit 回归全流程:累积 logit 建模、阈值 θ、平行线假设(Brant 检验)、OR 解读与模型拟合,结论为医生态度评分是核心驱动、等待时长是关键负向因子

文件名ordinal_logistic.xlsx
样本量300 行(满意度 1/2/3/4/5 = 30/60/75/75/60)
变量数5 列(1 个有序 Y + 4 个 X)
数据用途医院服务质量改进:哪些就诊环节会显著拉高/拉低患者整体满意度等级
变量说明等待时长(分钟)、就诊时长(分钟)、医生态度评分(1-10)、收费合理性(1-5)、满意度等级(Y,1-5 有序)。

完整案例

1. 背景

某三甲医院门诊管理部在季度服务质量回顾中,希望从 300 份当日就诊满意度问卷中提炼满意度等级驱动模型。因变量是 5 级 Likert 满意度(1=很不满意 … 5=很满意),属于有序分类变量——类别有先后顺序但相邻类别间距不一定相等,因此不能用线性回归(隐含等距假设)也不能用多分类 logit(损失顺序信息)。本案例采用有序 Logit(比例优势模型, Proportional Odds Model),通过累积 logit 链接同时建模"满意度 ≥ k 级"的所有切分点,并用平行线假设(parallel lines / proportional odds)保证一组 β 解释全部累积切分。业务目标:①识别哪些就诊环节显著影响满意度等级;②量化"医生态度 +1 分""等待 +10 分钟"对满意度跃迁到更高等级的优势比;③通过平行线检验验证模型适配性。

2. 理论与公式

有序 Logit 用累积概率建模——把 K 个有序等级压缩为 K−1 个二元切分(Y ≤ k vs Y > k),并假设所有切分共享同一组斜率 β(仅截距 θ 不同),即比例优势假设。

累积 Logit

θk 为切分点(cutpoint),共 K−1 个;所有 k 共用同一组 β(比例优势)。

OR 优势比

Xj 每加 1 单位,进入更高一级(或更高的若干级)的优势变为原来 OR 倍;OR>1 正向。

平行线检验

逐切分点拟合二元 logit 比对,p>0.05 表示比例优势假设成立。

3. 数据结构

每行 1 位患者,1 列有序 Y + 4 列 X。Y 取整数 1-5 表示满意度等级;连续 X 按真实业务量纲(分钟、分)记录;5 级 Likert 类型 X(收费合理性)按整数编码:

变量名类型取值范围业务含义
满意度等级因变量 Y(5 级有序)1-51=很不满意 / 2=不满意 / 3=一般 / 4=满意 / 5=很满意
等待时长连续5-180 分钟从挂号到进入诊室的总等待时间
就诊时长连续3-22.5 分钟医生与患者实际交流时间
医生态度评分连续3.2-10患者对医生沟通与态度的 10 分制评分
收费合理性5 级 Likert1-51=非常不合理 … 5=非常合理

5 个等级分布相对均衡(30/60/75/75/60),无极端稀疏类别,适合用比例优势模型而非continuation ratioadjacent category 等替代模型。收费合理性虽是 Likert 序数,但实证常按等距连续处理以减少哑变量;如要严格遵守序数性可按 4 个哑变量进入。

4. 操作步骤

  1. 登录 SPSSzero,进入 工作台 → 上传 ordinal_logistic.xlsx
  2. 左侧方法栏 → 进阶方法 → 点击 有序 Logit 回归
  3. 满意度等级 拖入 因变量 Y(必须为有序分类,至少 3 类)
  4. 等待时长 / 就诊时长 / 医生态度评分 / 收费合理性 共 4 个变量拖入 自变量 X
  5. 链接函数选 logit(默认;如样本严重偏态可选 cloglog / probit)
  6. 勾选 平行线假设检验(test of parallel lines / Brant test)——这是有序 Logit 的关键诊断
  7. 点击 开始分析,输出含 K−1 个截距阈值(cutpoints)+ 一组共享 β + 平行线检验 p 值

5. 结果表格与结果阅读

下面展示 3 张紧凑三线表:表 1 给出模型整体拟合指标,表 2 给出截距阈值与自变量系数(核心结果),表 3 给出平行线假设的 Brant 检验。

表1 有序 Logit 模型整体拟合(N=300)
指标取值判定标准结论
样本量 N300(5 类:30 / 60 / 75 / 75 / 60)分布均衡
似然比检验 LR χ²(4)133.412, p<0.001p<0.05 模型显著✅ 模型整体显著
−2LL(完整模型)806.896(仅截距 940.309)越小越好下降 133.4
McFadden R²0.1420.1-0.2 已可接受解释力适中
Cox & Snell R²0.359
Nagelkerke R²0.375越大越好自变量解释 37.5% 等级变化
AIC / BIC822.896 / 852.527越小越好(用于模型比较)
5 类有序 Y 下 Nagelkerke R²=0.375 属较好水平(一般 0.2+ 已可接受);McFadden R²=0.142 在 Logit 类模型中可视为实质拟合。模型已显著优于零模型,可用于满意度驱动因素的解释与情景预测。
表2 截距阈值 + 自变量系数(N=300,Y=满意度等级)
参数BSEWald χ²pOROR 95% CI
医生态度评分0.7120.08668.794<0.001***2.038[1.722, 2.411]
收费合理性0.3710.07723.194<0.001***1.449[1.246, 1.686]
等待时长-0.0230.00347.060<0.001***0.978[0.971, 0.984]
就诊时长0.0190.0270.4710.4931.019[0.966, 1.075]
θ₁(1 ↔ ≥2)2.7660.73614.124<0.001***
θ₂(≤2 ↔ ≥3)4.512
θ₃(≤3 ↔ ≥4)5.966
θ₄(≤4 ↔ 5)7.526
* p<0.05 ** p<0.01 *** p<0.001;OR 解读:X 每加 1 单位,被分入更高满意度等级的累积优势变为原来 OR 倍。3 个变量显著、1 个不显著;4 个 θ 严格递增(2.77 < 4.51 < 5.97 < 7.53),结构合理。

显著变量按效应强度:①医生态度评分每加 1 分,进入更高满意度等级的优势翻倍(OR=2.04);②收费合理性每升 1 级 Likert 优势乘以 1.45(≈ +45%);③等待时长每加 1 分钟优势乘以 0.978,每加 30 分钟优势乘以 0.978³⁰≈0.51(即下降近一半)。就诊时长在控制其他变量后不显著(p=0.493)。

表3 平行线假设检验(Brant Test)
检验对象χ²dfp结论
全局检验7.624120.814✅ 通过(比例优势成立)
医生态度评分2.37530.498✅ 通过
收费合理性2.01630.569✅ 通过
等待时长2.86130.414✅ 通过
就诊时长0.37130.946✅ 通过
判定准则:p>0.05 表示该变量在 4 个累积切分点上的斜率可视为同一组 β——比例优势假设成立。本案例全局 χ²(12)=7.624,p=0.814,远大于 0.05;4 个变量分项检验全部通过,无需改用 partial proportional odds 或 generalized ordered logit

7. 文字分析

对 4 个候选自变量的有序 Logit 回归结果综合分析:

  • 模型整体:LR χ²(4)=133.41,p<0.001,相比仅截距模型显著改善(−2LL 下降 133.4);Nagelkerke R²=0.375、McFadden R²=0.142——4 个就诊维度联合解释了满意度等级中约 37.5% 的变异,模型可用于满意度归因。
  • 医生态度评分(最强正向驱动):B=0.712,p<0.001,OR=2.04(95% CI [1.72, 2.41])——医生态度评分每加 1 分,患者跃升到更高满意度等级的累积优势翻倍;从 6 分提升到 8 分则优势变为 2.04²≈4.16 倍。这是单一最强可干预因子。
  • 收费合理性:B=0.371,p<0.001,OR=1.45。Likert 每升 1 级,进入更高满意度等级的优势提升 45%——透明定价与术前明示收费可直接拉升满意度。
  • 等待时长(最强负向因子):B=−0.023,p<0.001,OR=0.978。每多等 1 分钟优势乘以 0.978,每多等 30 分钟优势乘以 0.51(近乎腰斩)。这是流程优化的最高优先级。
  • 就诊时长(不显著)p=0.493,OR=1.02 接近 1,95% CI 跨 1——在控制医生态度后,单纯延长就诊时间并不能提升满意度。说明"医生说了多少话"远不如"医生怎么说"重要。
  • 平行线假设:Brant 全局检验 χ²(12)=7.62,p=0.814 ≫ 0.05;4 个变量分项 p 全部 > 0.4——比例优势假设充分成立,单一 β 解释 4 个累积切分的设定合理,无需切换到 partial proportional odds 或 multinomial logit

业务建议:①把医生沟通态度培训列为最高优先级——按 OR=2 的弹性,平均评分从 7.7 提到 8.7 可使高满意度比例提升约 1 个等级;②把等待时长压到 30 分钟以内——分时段预约 + 实时叫号系统可期望使更多患者落入"满意 / 很满意"区间;③在收费窗口张贴明细价格表并由前台主动解释——收费合理性每升 1 级即额外 +45% 优势;④就诊时长不必硬性拉长——15 分钟内高质量沟通优于 25 分钟低效寒暄。下阶段建议复测 1 季度数据验证 OR 稳定性,并按门诊科室分组拟合以排查异质性。

8. 剖析提醒

有序 Logit 的 OR 解释的是累积优势,不能直接换算成"概率增加同样倍数",更不能像普通线性回归那样解读为"等级数字 +β";务必按"进入更高一级"的话术表达。平行线假设是有序 Logit 的核心前提,p<0.05 时应改用 partial proportional odds(gologit2)或多分类 logit,否则系数估计有偏。本案例 5 级 Likert 分布均衡,如出现极端稀疏类别(如某一级 < 20 例)建议合并相邻等级。