可视化

SPSS_ROC曲线

案例数据

二分类真实状态和连续预测分数,用于绘制 ROC 曲线并计算 AUC、截断值、敏感度和特异度。

文件名roc.xlsx
数据用途ROC 曲线案例数据
变量说明状态变量为二分类结果,检验变量为连续预测指标;需要明确阳性编码。

完整案例

1. 背景

医学或风控研究中,希望评估一个连续指标或模型预测值对二分类结局的区分能力。

2. 理论与公式

ROC 曲线以 1-特异度为横轴、敏感度为纵轴,AUC 衡量模型或指标区分阳性与阴性的整体能力。

敏感度

阳性样本被正确识别的比例。

特异度

阴性样本被正确识别的比例。

AUC

ROC 曲线下方的面积。

尤登指数

常用于选择最佳截断值。

3. 数据结构

状态变量为二分类结果,检验变量为连续预测指标;需要明确阳性编码。

4. 操作截图

  1. 上传案例数据
  2. 选择 ROC 曲线
  3. 放入状态变量 Y
  4. 放入检验变量 X
  5. 设置阳性切割点
  6. 点击开始分析
ROC 变量选择截图
ROC 变量选择截图
ROC 阳性设置截图
ROC 阳性设置截图

5. 结果表格与结果阅读

表1 ROC 曲线结果示例
检验变量AUC95% CICut-off敏感度特异度
年龄0.742[0.681, 0.803]58.50.7140.668
模型预测值0.836[0.792, 0.881]0.420.8010.754

Cut-off 通常由最大尤登指数确定。

重点查看 AUC、95% 置信区间、最佳截断值、敏感度和特异度。AUC 越接近 1,区分能力越强。

6. 辅助截图

ROC 曲线结果
ROC 曲线结果
ROC 指标结果
ROC 指标结果
ROC 截断值结果
ROC 截断值结果

7. 文字分析

ROC 曲线结果显示,检验变量对阳性结局具有一定区分能力,AUC 达到可接受水平,可进一步结合最佳截断值用于判别。

8. 剖析提醒

阳性编码设置错误会直接影响 AUC 和曲线方向;AUC 小于 0.5 时应优先检查状态变量定义。