进阶方法

有序Logit（Logistic）分析

案例数据

300 行三甲医院门诊患者就诊体验问卷，因变量为满意度等级（1=很不满意 / 2=不满意 / 3=一般 / 4=满意 / 5=很满意，共 5 级有序），4 个候选自变量覆盖等待时长、就诊时长、医生态度评分与收费合理性，演示有序 Logit 回归全流程：累积 logit 建模、阈值 θ、平行线假设（Brant 检验）、OR 解读与模型拟合，结论为医生态度评分是核心驱动、等待时长是关键负向因子。

下载案例数据查看数据文件

文件名	ordinal_logistic.xlsx
样本量	300 行（满意度 1/2/3/4/5 = 30/60/75/75/60）
变量数	5 列（1 个有序 Y + 4 个 X）
数据用途	医院服务质量改进：哪些就诊环节会显著拉高/拉低患者整体满意度等级
变量说明	等待时长（分钟）、就诊时长（分钟）、医生态度评分（1-10）、收费合理性（1-5）、满意度等级（Y，1-5 有序）。

完整案例

1. 背景

某三甲医院门诊管理部在季度服务质量回顾中，希望从 300 份当日就诊满意度问卷中提炼满意度等级驱动模型。因变量是 5 级 Likert 满意度（1=很不满意 … 5=很满意），属于有序分类变量——类别有先后顺序但相邻类别间距不一定相等，因此不能用线性回归（隐含等距假设）也不能用多分类 logit（损失顺序信息）。本案例采用有序 Logit（比例优势模型, Proportional Odds Model），通过累积 logit 链接同时建模"满意度 ≥ k 级"的所有切分点，并用平行线假设（parallel lines / proportional odds）保证一组 β 解释全部累积切分。业务目标：①识别哪些就诊环节显著影响满意度等级；②量化"医生态度 +1 分""等待 +10 分钟"对满意度跃迁到更高等级的优势比；③通过平行线检验验证模型适配性。

2. 理论与公式

有序 Logit 用累积概率建模——把 K 个有序等级压缩为 K−1 个二元切分（Y ≤ k vs Y > k），并假设所有切分共享同一组斜率 β（仅截距 θ 不同），即比例优势假设。

累积 Logit

θ_k 为切分点（cutpoint），共 K−1 个；所有 k 共用同一组 β（比例优势）。

OR 优势比

X_j 每加 1 单位，进入更高一级（或更高的若干级）的优势变为原来 OR 倍；OR>1 正向。

平行线检验

逐切分点拟合二元 logit 比对，p>0.05 表示比例优势假设成立。

3. 数据结构

每行 1 位患者，1 列有序 Y + 4 列 X。Y 取整数 1-5 表示满意度等级；连续 X 按真实业务量纲（分钟、分）记录；5 级 Likert 类型 X（收费合理性）按整数编码：

变量名	类型	取值范围	业务含义
满意度等级	因变量 Y（5 级有序）	1-5	1=很不满意 / 2=不满意 / 3=一般 / 4=满意 / 5=很满意
等待时长	连续	5-180 分钟	从挂号到进入诊室的总等待时间
就诊时长	连续	3-22.5 分钟	医生与患者实际交流时间
医生态度评分	连续	3.2-10	患者对医生沟通与态度的 10 分制评分
收费合理性	5 级 Likert	1-5	1=非常不合理 … 5=非常合理

5 个等级分布相对均衡（30/60/75/75/60），无极端稀疏类别，适合用比例优势模型而非continuation ratio 或 adjacent category 等替代模型。收费合理性虽是 Likert 序数，但实证常按等距连续处理以减少哑变量；如要严格遵守序数性可按 4 个哑变量进入。

4. 操作步骤

登录 SPSSzero，进入 工作台 → 上传 ordinal_logistic.xlsx
左侧方法栏 → 进阶方法 → 点击 有序 Logit 回归
把 满意度等级 拖入 因变量 Y（必须为有序分类，至少 3 类）
把 等待时长 / 就诊时长 / 医生态度评分 / 收费合理性 共 4 个变量拖入 自变量 X
链接函数选 logit（默认；如样本严重偏态可选 cloglog / probit）
勾选 平行线假设检验（test of parallel lines / Brant test）——这是有序 Logit 的关键诊断
点击 开始分析，输出含 K−1 个截距阈值（cutpoints）+ 一组共享 β + 平行线检验 p 值

5. 结果表格与结果阅读

下面展示 3 张紧凑三线表：表 1 给出模型整体拟合指标，表 2 给出截距阈值与自变量系数（核心结果），表 3 给出平行线假设的 Brant 检验。

表1 有序 Logit 模型整体拟合（N=300）

指标	取值	判定标准	结论
样本量 N	300（5 类：30 / 60 / 75 / 75 / 60）	—	分布均衡
似然比检验 LR χ²(4)	133.412, p<0.001	p<0.05 模型显著	✅ 模型整体显著
−2LL（完整模型）	806.896（仅截距 940.309）	越小越好	下降 133.4
McFadden R²	0.142	0.1-0.2 已可接受	解释力适中
Cox & Snell R²	0.359	—	—
Nagelkerke R²	0.375	越大越好	自变量解释 37.5% 等级变化
AIC / BIC	822.896 / 852.527	越小越好（用于模型比较）	—
5 类有序 Y 下 Nagelkerke R²=0.375 属较好水平（一般 0.2+ 已可接受）；McFadden R²=0.142 在 Logit 类模型中可视为实质拟合。模型已显著优于零模型，可用于满意度驱动因素的解释与情景预测。

表2 截距阈值 + 自变量系数（N=300，Y=满意度等级）

参数	B	SE	Wald χ²	p	OR	OR 95% CI
医生态度评分	0.712	0.086	68.794	<0.001***	2.038	[1.722, 2.411]
收费合理性	0.371	0.077	23.194	<0.001***	1.449	[1.246, 1.686]
等待时长	-0.023	0.003	47.060	<0.001***	0.978	[0.971, 0.984]
就诊时长	0.019	0.027	0.471	0.493	1.019	[0.966, 1.075]
θ₁（1 ↔ ≥2）	2.766	0.736	14.124	<0.001***	—	—
θ₂（≤2 ↔ ≥3）	4.512	—	—	—	—	—
θ₃（≤3 ↔ ≥4）	5.966	—	—	—	—	—
θ₄（≤4 ↔ 5）	7.526	—	—	—	—	—
* p<0.05 p<0.01 * p<0.001；OR 解读：X 每加 1 单位，被分入更高满意度等级的累积优势变为原来 OR 倍。3 个变量显著、1 个不显著；4 个 θ 严格递增（2.77 < 4.51 < 5.97 < 7.53），结构合理。

显著变量按效应强度：①医生态度评分每加 1 分，进入更高满意度等级的优势翻倍（OR=2.04）；②收费合理性每升 1 级 Likert 优势乘以 1.45（≈ +45%）；③等待时长每加 1 分钟优势乘以 0.978，每加 30 分钟优势乘以 0.978³⁰≈0.51（即下降近一半）。就诊时长在控制其他变量后不显著（p=0.493）。

表3 平行线假设检验（Brant Test）

检验对象	χ²	df	p	结论
全局检验	7.624	12	0.814	✅ 通过（比例优势成立）
医生态度评分	2.375	3	0.498	✅ 通过
收费合理性	2.016	3	0.569	✅ 通过
等待时长	2.861	3	0.414	✅ 通过
就诊时长	0.371	3	0.946	✅ 通过
判定准则：p>0.05 表示该变量在 4 个累积切分点上的斜率可视为同一组 β——比例优势假设成立。本案例全局 χ²(12)=7.624，p=0.814，远大于 0.05；4 个变量分项检验全部通过，无需改用 partial proportional odds 或 generalized ordered logit。

7. 文字分析

对 4 个候选自变量的有序 Logit 回归结果综合分析：

模型整体：LR χ²(4)=133.41，p<0.001，相比仅截距模型显著改善（−2LL 下降 133.4）；Nagelkerke R²=0.375、McFadden R²=0.142——4 个就诊维度联合解释了满意度等级中约 37.5% 的变异，模型可用于满意度归因。
医生态度评分（最强正向驱动）：B=0.712，p<0.001，OR=2.04（95% CI [1.72, 2.41]）——医生态度评分每加 1 分，患者跃升到更高满意度等级的累积优势翻倍；从 6 分提升到 8 分则优势变为 2.04²≈4.16 倍。这是单一最强可干预因子。
收费合理性：B=0.371，p<0.001，OR=1.45。Likert 每升 1 级，进入更高满意度等级的优势提升 45%——透明定价与术前明示收费可直接拉升满意度。
等待时长（最强负向因子）：B=−0.023，p<0.001，OR=0.978。每多等 1 分钟优势乘以 0.978，每多等 30 分钟优势乘以 0.51（近乎腰斩）。这是流程优化的最高优先级。
就诊时长（不显著）：p=0.493，OR=1.02 接近 1，95% CI 跨 1——在控制医生态度后，单纯延长就诊时间并不能提升满意度。说明"医生说了多少话"远不如"医生怎么说"重要。
平行线假设：Brant 全局检验 χ²(12)=7.62，p=0.814 ≫ 0.05；4 个变量分项 p 全部 > 0.4——比例优势假设充分成立，单一 β 解释 4 个累积切分的设定合理，无需切换到 partial proportional odds 或 multinomial logit。

业务建议：①把医生沟通态度培训列为最高优先级——按 OR=2 的弹性，平均评分从 7.7 提到 8.7 可使高满意度比例提升约 1 个等级；②把等待时长压到 30 分钟以内——分时段预约 + 实时叫号系统可期望使更多患者落入"满意 / 很满意"区间；③在收费窗口张贴明细价格表并由前台主动解释——收费合理性每升 1 级即额外 +45% 优势；④就诊时长不必硬性拉长——15 分钟内高质量沟通优于 25 分钟低效寒暄。下阶段建议复测 1 季度数据验证 OR 稳定性，并按门诊科室分组拟合以排查异质性。

8. 剖析提醒

有序 Logit 的 OR 解释的是累积优势，不能直接换算成"概率增加同样倍数"，更不能像普通线性回归那样解读为"等级数字 +β"；务必按"进入更高一级"的话术表达。平行线假设是有序 Logit 的核心前提，p<0.05 时应改用 partial proportional odds（gologit2）或多分类 logit，否则系数估计有偏。本案例 5 级 Likert 分布均衡，如出现极端稀疏类别（如某一级 < 20 例）建议合并相邻等级。