案例数据
300 行三甲医院门诊患者就诊体验问卷,因变量为满意度等级(1=很不满意 / 2=不满意 / 3=一般 / 4=满意 / 5=很满意,共 5 级有序),4 个候选自变量覆盖等待时长、就诊时长、医生态度评分与收费合理性,演示有序 Logit 回归全流程:累积 logit 建模、阈值 θ、平行线假设(Brant 检验)、OR 解读与模型拟合,结论为医生态度评分是核心驱动、等待时长是关键负向因子。
| 文件名 | ordinal_logistic.xlsx |
|---|---|
| 样本量 | 300 行(满意度 1/2/3/4/5 = 30/60/75/75/60) |
| 变量数 | 5 列(1 个有序 Y + 4 个 X) |
| 数据用途 | 医院服务质量改进:哪些就诊环节会显著拉高/拉低患者整体满意度等级 |
| 变量说明 | 等待时长(分钟)、就诊时长(分钟)、医生态度评分(1-10)、收费合理性(1-5)、满意度等级(Y,1-5 有序)。 |
完整案例
1. 背景
某三甲医院门诊管理部在季度服务质量回顾中,希望从 300 份当日就诊满意度问卷中提炼满意度等级驱动模型。因变量是 5 级 Likert 满意度(1=很不满意 … 5=很满意),属于有序分类变量——类别有先后顺序但相邻类别间距不一定相等,因此不能用线性回归(隐含等距假设)也不能用多分类 logit(损失顺序信息)。本案例采用有序 Logit(比例优势模型, Proportional Odds Model),通过累积 logit 链接同时建模"满意度 ≥ k 级"的所有切分点,并用平行线假设(parallel lines / proportional odds)保证一组 β 解释全部累积切分。业务目标:①识别哪些就诊环节显著影响满意度等级;②量化"医生态度 +1 分""等待 +10 分钟"对满意度跃迁到更高等级的优势比;③通过平行线检验验证模型适配性。
2. 理论与公式
有序 Logit 用累积概率建模——把 K 个有序等级压缩为 K−1 个二元切分(Y ≤ k vs Y > k),并假设所有切分共享同一组斜率 β(仅截距 θ 不同),即比例优势假设。
θk 为切分点(cutpoint),共 K−1 个;所有 k 共用同一组 β(比例优势)。
Xj 每加 1 单位,进入更高一级(或更高的若干级)的优势变为原来 OR 倍;OR>1 正向。
逐切分点拟合二元 logit 比对,p>0.05 表示比例优势假设成立。
3. 数据结构
每行 1 位患者,1 列有序 Y + 4 列 X。Y 取整数 1-5 表示满意度等级;连续 X 按真实业务量纲(分钟、分)记录;5 级 Likert 类型 X(收费合理性)按整数编码:
| 变量名 | 类型 | 取值范围 | 业务含义 |
|---|---|---|---|
| 满意度等级 | 因变量 Y(5 级有序) | 1-5 | 1=很不满意 / 2=不满意 / 3=一般 / 4=满意 / 5=很满意 |
| 等待时长 | 连续 | 5-180 分钟 | 从挂号到进入诊室的总等待时间 |
| 就诊时长 | 连续 | 3-22.5 分钟 | 医生与患者实际交流时间 |
| 医生态度评分 | 连续 | 3.2-10 | 患者对医生沟通与态度的 10 分制评分 |
| 收费合理性 | 5 级 Likert | 1-5 | 1=非常不合理 … 5=非常合理 |
5 个等级分布相对均衡(30/60/75/75/60),无极端稀疏类别,适合用比例优势模型而非continuation ratio 或 adjacent category 等替代模型。收费合理性虽是 Likert 序数,但实证常按等距连续处理以减少哑变量;如要严格遵守序数性可按 4 个哑变量进入。
4. 操作步骤
- 登录 SPSSzero,进入 工作台 → 上传
ordinal_logistic.xlsx - 左侧方法栏 → 进阶方法 → 点击 有序 Logit 回归
- 把 满意度等级 拖入 因变量 Y(必须为有序分类,至少 3 类)
- 把 等待时长 / 就诊时长 / 医生态度评分 / 收费合理性 共 4 个变量拖入 自变量 X
- 链接函数选 logit(默认;如样本严重偏态可选 cloglog / probit)
- 勾选 平行线假设检验(test of parallel lines / Brant test)——这是有序 Logit 的关键诊断
- 点击 开始分析,输出含 K−1 个截距阈值(cutpoints)+ 一组共享 β + 平行线检验 p 值
5. 结果表格与结果阅读
下面展示 3 张紧凑三线表:表 1 给出模型整体拟合指标,表 2 给出截距阈值与自变量系数(核心结果),表 3 给出平行线假设的 Brant 检验。
| 指标 | 取值 | 判定标准 | 结论 |
|---|---|---|---|
| 样本量 N | 300(5 类:30 / 60 / 75 / 75 / 60) | — | 分布均衡 |
| 似然比检验 LR χ²(4) | 133.412, p<0.001 | p<0.05 模型显著 | ✅ 模型整体显著 |
| −2LL(完整模型) | 806.896(仅截距 940.309) | 越小越好 | 下降 133.4 |
| McFadden R² | 0.142 | 0.1-0.2 已可接受 | 解释力适中 |
| Cox & Snell R² | 0.359 | — | — |
| Nagelkerke R² | 0.375 | 越大越好 | 自变量解释 37.5% 等级变化 |
| AIC / BIC | 822.896 / 852.527 | 越小越好(用于模型比较) | — |
| 5 类有序 Y 下 Nagelkerke R²=0.375 属较好水平(一般 0.2+ 已可接受);McFadden R²=0.142 在 Logit 类模型中可视为实质拟合。模型已显著优于零模型,可用于满意度驱动因素的解释与情景预测。 | |||
| 参数 | B | SE | Wald χ² | p | OR | OR 95% CI |
|---|---|---|---|---|---|---|
| 医生态度评分 | 0.712 | 0.086 | 68.794 | <0.001*** | 2.038 | [1.722, 2.411] |
| 收费合理性 | 0.371 | 0.077 | 23.194 | <0.001*** | 1.449 | [1.246, 1.686] |
| 等待时长 | -0.023 | 0.003 | 47.060 | <0.001*** | 0.978 | [0.971, 0.984] |
| 就诊时长 | 0.019 | 0.027 | 0.471 | 0.493 | 1.019 | [0.966, 1.075] |
| θ₁(1 ↔ ≥2) | 2.766 | 0.736 | 14.124 | <0.001*** | — | — |
| θ₂(≤2 ↔ ≥3) | 4.512 | — | — | — | — | — |
| θ₃(≤3 ↔ ≥4) | 5.966 | — | — | — | — | — |
| θ₄(≤4 ↔ 5) | 7.526 | — | — | — | — | — |
| * p<0.05 ** p<0.01 *** p<0.001;OR 解读:X 每加 1 单位,被分入更高满意度等级的累积优势变为原来 OR 倍。3 个变量显著、1 个不显著;4 个 θ 严格递增(2.77 < 4.51 < 5.97 < 7.53),结构合理。 | ||||||
显著变量按效应强度:①医生态度评分每加 1 分,进入更高满意度等级的优势翻倍(OR=2.04);②收费合理性每升 1 级 Likert 优势乘以 1.45(≈ +45%);③等待时长每加 1 分钟优势乘以 0.978,每加 30 分钟优势乘以 0.978³⁰≈0.51(即下降近一半)。就诊时长在控制其他变量后不显著(p=0.493)。
| 检验对象 | χ² | df | p | 结论 |
|---|---|---|---|---|
| 全局检验 | 7.624 | 12 | 0.814 | ✅ 通过(比例优势成立) |
| 医生态度评分 | 2.375 | 3 | 0.498 | ✅ 通过 |
| 收费合理性 | 2.016 | 3 | 0.569 | ✅ 通过 |
| 等待时长 | 2.861 | 3 | 0.414 | ✅ 通过 |
| 就诊时长 | 0.371 | 3 | 0.946 | ✅ 通过 |
| 判定准则:p>0.05 表示该变量在 4 个累积切分点上的斜率可视为同一组 β——比例优势假设成立。本案例全局 χ²(12)=7.624,p=0.814,远大于 0.05;4 个变量分项检验全部通过,无需改用 partial proportional odds 或 generalized ordered logit。 | ||||
7. 文字分析
对 4 个候选自变量的有序 Logit 回归结果综合分析:
- 模型整体:LR χ²(4)=133.41,p<0.001,相比仅截距模型显著改善(−2LL 下降 133.4);Nagelkerke R²=0.375、McFadden R²=0.142——4 个就诊维度联合解释了满意度等级中约 37.5% 的变异,模型可用于满意度归因。
- 医生态度评分(最强正向驱动):B=0.712,p<0.001,OR=2.04(95% CI [1.72, 2.41])——医生态度评分每加 1 分,患者跃升到更高满意度等级的累积优势翻倍;从 6 分提升到 8 分则优势变为 2.04²≈4.16 倍。这是单一最强可干预因子。
- 收费合理性:B=0.371,p<0.001,OR=1.45。Likert 每升 1 级,进入更高满意度等级的优势提升 45%——透明定价与术前明示收费可直接拉升满意度。
- 等待时长(最强负向因子):B=−0.023,p<0.001,OR=0.978。每多等 1 分钟优势乘以 0.978,每多等 30 分钟优势乘以 0.51(近乎腰斩)。这是流程优化的最高优先级。
- 就诊时长(不显著):p=0.493,OR=1.02 接近 1,95% CI 跨 1——在控制医生态度后,单纯延长就诊时间并不能提升满意度。说明"医生说了多少话"远不如"医生怎么说"重要。
- 平行线假设:Brant 全局检验 χ²(12)=7.62,p=0.814 ≫ 0.05;4 个变量分项 p 全部 > 0.4——比例优势假设充分成立,单一 β 解释 4 个累积切分的设定合理,无需切换到 partial proportional odds 或 multinomial logit。
业务建议:①把医生沟通态度培训列为最高优先级——按 OR=2 的弹性,平均评分从 7.7 提到 8.7 可使高满意度比例提升约 1 个等级;②把等待时长压到 30 分钟以内——分时段预约 + 实时叫号系统可期望使更多患者落入"满意 / 很满意"区间;③在收费窗口张贴明细价格表并由前台主动解释——收费合理性每升 1 级即额外 +45% 优势;④就诊时长不必硬性拉长——15 分钟内高质量沟通优于 25 分钟低效寒暄。下阶段建议复测 1 季度数据验证 OR 稳定性,并按门诊科室分组拟合以排查异质性。
8. 剖析提醒
有序 Logit 的 OR 解释的是累积优势,不能直接换算成"概率增加同样倍数",更不能像普通线性回归那样解读为"等级数字 +β";务必按"进入更高一级"的话术表达。平行线假设是有序 Logit 的核心前提,p<0.05 时应改用 partial proportional odds(gologit2)或多分类 logit,否则系数估计有偏。本案例 5 级 Likert 分布均衡,如出现极端稀疏类别(如某一级 < 20 例)建议合并相邻等级。