案例数据
300 名员工 × 11 列。10 个心理量表平均分(自我效能 / 责任心 / 内控性 / 目标导向 / 情绪稳定性 / 抗压能力 / 心理韧性 / 外向性 / 主动性 / 团队合作)作为自变量,工作绩效(50-100 分)为因变量。10 个量表间相关系数 0.34-0.90、平均相关 0.62,VIF 最高 9.62 —— 多重共线性严重,OLS 不稳定。专为演示 PLS(偏最小二乘回归)设计:通过提取少量与 Y 协方差最大的潜在成分,把高维相关自变量压缩到低维潜空间后再做回归,从根本上回避共线性。
| 文件名 | pls_regression.xlsx |
|---|---|
| 样本量 | 300 行 |
| 变量数 | 11 列(10 个心理量表分 + 1 个因变量) |
| 数据用途 | 员工工作绩效预测:演示 PLS 用 2-3 个潜成分概括 10 个高度相关心理量表的信息,VIP 排序识别核心人格驱动因子。 |
| 变量说明 | 自变量(10 个,1-7 分 Likert 均分,互相 r=0.34-0.90):自我效能 / 责任心 / 内控性 / 目标导向 / 情绪稳定性 / 抗压能力 / 心理韧性 / 外向性 / 主动性 / 团队合作。三组潜结构:①"自我管理"组(自我效能/责任心/内控性/目标导向,强驱动);②"情绪稳定"组(情绪稳定性/抗压能力/心理韧性,中等驱动);③"外向主动"组(外向性/主动性/团队合作,弱驱动)。因变量:工作绩效(连续 50-100 分)。 |
完整案例
1. 背景
面对"自变量数量多 + 高度共线"的场景,OLS 估计极不稳定:参数方差被 VIF 放大若干倍,单个变量的回归系数可能正负翻转、p 值飘忽,模型可解释性彻底崩塌。常见解法可分两条路 —— ①正则化派(岭回归 / Lasso):保留原变量但对系数施加 L1/L2 惩罚来收缩或归零;②潜空间派(PCR / PLS):把原变量压缩为正交的潜成分后再回归。PLS(Partial Least Squares Regression, 偏最小二乘回归)属于潜空间派,但与 PCR(主成分回归)有本质区别 —— PCR 提取的成分只追求"解释 X 自身方差最大",可能与 Y 无关;PLS 提取的成分追求"X 与 Y 的协方差最大",每一个成分都"瞄准"对 Y 的预测。这让 PLS 在变量比样本多、共线性极强、且需要稳定预测的场景(化学计量学、感官评定、心理量表、组学数据、临床预测)几乎成为首选。PLS 不像 Lasso 自动稀疏 —— 保留全部原变量但赋予VIP(Variable Importance in Projection),VIP > 1 经验阈值用于识别核心驱动变量,VIP 与 W*(旋转权重)共同构成 PLS 独有的"变量诊断"工具集。本案例 10 个心理量表 → 工作绩效,VIF 最高 9.62 已逼近共线性临界值,正是 PLS 大展身手的典型场景。
2. 理论与公式
PLS 通过迭代算法(NIPALS 或 SIMPLS)依次提取成分:每一步在残差空间寻找权重向量 w 使潜成分 t = Xw 与 Y 的协方差最大,然后从 X、Y 中剥离该成分的贡献再继续。最终用前 k 个潜成分做回归。
第 a 个成分的权重 wa 让 ta 与 Y 协方差最大 —— 这是 PLS 与 PCA/PCR 的根本区别。
用前 k 个成分回归 Y;W* 是旋转权重,可把潜空间系数映回原变量空间得到 βPLS。
第 j 个变量的 VIP 是其权重平方在各成分上加权(按 Y 解释力)的几何平均;VIP > 1 经验阈值表示该变量对 Y 预测的贡献高于平均。
用交叉验证残差替代训练残差计算的 R²;Q² > 0 说明模型有泛化预测力,Q² 拐点处是最优成分数。
3. 数据结构
每行 1 名员工,10 个心理量表平均分按"潜结构组"分为 3 组,外加 1 个因变量:
| 组别(潜结构) | 变量名 | 类型 | 说明 |
|---|---|---|---|
| 自我管理组(强驱动,4 个) | 自我效能 | 连续 1-7 | 对完成任务的信心评分 |
| 责任心 | 连续 1-7 | 大五人格责任心维度 | |
| 内控性 | 连续 1-7 | Rotter 内外控量表分 | |
| 目标导向 | 连续 1-7 | 目标设定与达成倾向 | |
| 情绪稳定组(中等驱动,3 个) | 情绪稳定性 | 连续 1-7 | 大五人格神经质反向 |
| 抗压能力 | 连续 1-7 | 压力情境应对自评 | |
| 心理韧性 | 连续 1-7 | CD-RISC 韧性量表分 | |
| 外向主动组(弱驱动,3 个) | 外向性 | 连续 1-7 | 大五人格外向性维度 |
| 主动性 | 连续 1-7 | 个体主动行为评分 | |
| 团队合作 | 连续 1-7 | 协作意愿与表现 | |
| 因变量 Y | 工作绩效 | 连续 50-100 分 | 主管 + KPI 综合评分 |
这是 PLS 的典型适用场景 —— 自变量来自同一概念体系(心理量表)、彼此高度相关、且不希望像 Lasso 一样把变量"砍掉"(量表条目都有理论意义,需保留并赋权)。
4. 操作步骤
- 登录 SPSSzero,进入 工作台 → 上传
pls_regression.xlsx - 左侧方法栏 → 进阶方法 → 点击 PLS 回归
- 把 工作绩效 拖入 因变量 Y
- 把 10 个心理量表全部拖入 自变量 X(系统自动 z-score 标准化 —— 这是 PLS 的硬性前置条件,否则量纲大的变量会主导成分)
- 勾选 OLS 对照 + VIF 诊断,确认共线性严重程度(VIF > 5 时 PLS 比 OLS 优势明显)
- 勾选 成分数选择:设置最大成分数(默认 = min(p, 10)),系统跑 1...k_max 每个值的 R²(训练) + Q²(10-fold CV) + CV-RMSE,绘制曲线并标出 Q² 拐点
- 系统自动选 Q² 最大对应的 k* 作为最优成分数;也可手动指定
- 勾选 VIP 报告 + W* 权重 + 标准化系数,得到三件套:变量重要性 / 旋转权重 / 映回原空间的回归系数
- 点击 开始分析,依次得到:成分数选择表 / VIP 与 W* 排序表 / OLS vs PLS 综合指标对比表
5. 结果表格与结果阅读
结果区按"先定成分数、再看变量重要性、最后对比 OLS"输出 3 张表:
| 成分数 k | R²(训练) | Q²(10-fold CV) | CV-RMSE(绩效分) | 说明 |
|---|---|---|---|---|
| 1 | 0.7804 | 0.7758 | 4.900 | 单成分已抓住主成分,但仍欠拟合 |
| 2 | 0.8249 | 0.8179 | 4.416 | 第 2 成分带来 Q² 跃升 +0.042 |
| 3 (k*) | 0.8254 | 0.8180 | 4.415 | Q² 拐点 —— 最优成分数,增益已饱和 |
| 4 | 0.8263 | 0.8106 | 4.503 | Q² 反降,开始过拟合 |
| 5 | 0.8264 | 0.8100 | 4.511 | 训练 R² 几乎不变,CV 性能下滑 |
| 6-10 | 0.8264 | 0.8101 | 4.510 | 已无新信息,等价于 OLS |
| N=300, p=10;R² 在标准化空间,CV-RMSE 在原始绩效分尺度;k* 由 Q² 最大值规则选出 | ||||
路径观察:①Q² 在 k=3 处达到 0.8180 拐点;②k=10 时 Q²=0.8101 已等同于 OLS(PLS 用满成分会退化为 OLS)—— 这正是 PLS 的"成分减半 + 性能不降"特性;③CV-RMSE 在 k=3 最小(4.415 分),用 3 个潜成分概括 10 个心理量表的信息已足够。
| 排序 | 变量 | VIP | W*1(成分1) | W*2(成分2) | βstd(PLS) | 重要性判断 |
|---|---|---|---|---|---|---|
| 1 | 责任心 | 1.198 | 0.380 | 0.395 | 0.207 | 核心驱动(VIP > 1) |
| 2 | 目标导向 | 1.196 | 0.387 | 0.209 | 0.177 | 核心驱动(VIP > 1) |
| 3 | 内控性 | 1.183 | 0.380 | 0.307 | 0.188 | 核心驱动(VIP > 1) |
| 4 | 自我效能 | 1.158 | 0.362 | 0.478 | 0.217 | 核心驱动(VIP > 1) |
| 5 | 心理韧性 | 0.977 | 0.312 | −0.210 | 0.065 | 中等贡献(VIP < 1) |
| 6 | 团队合作 | 0.893 | 0.287 | −0.138 | 0.086 | 中等贡献 |
| 7 | 情绪稳定性 | 0.865 | 0.275 | −0.205 | 0.047 | 较弱贡献 |
| 8 | 抗压能力 | 0.857 | 0.266 | −0.309 | 0.023 | 较弱贡献 |
| 9 | 主动性 | 0.763 | 0.232 | −0.344 | 0.019 | 弱贡献 |
| 10 | 外向性 | 0.761 | 0.225 | −0.411 | 0.004 | 弱贡献 |
| PLS-3 模型;W* 为旋转权重(rotation matrix),βstd 是潜空间映回原变量的标准化系数;VIP > 1 经验阈值 | ||||||
关键观察:①VIP > 1 的 4 个变量全部来自"自我管理组"(责任心 / 目标导向 / 内控性 / 自我效能),与数据生成时的强驱动因子设定完全吻合;②W*1 列所有变量同号 —— 第 1 成分是"整体心理资本"综合因子;③W*2 列出现正负分化(自我管理组正 / 情绪稳定组负 / 外向组负)—— 第 2 成分是"自我管理 vs 情绪外向"对比因子;④"外向性"VIP=0.761 最低,但 PLS 仍保留它在模型中(与 Lasso 归零的处理方式完全不同)。
| 指标 | OLS | PLS-3 | PLS 相对 OLS 的变化 |
|---|---|---|---|
| 参数数量(有效) | 10 | 3 潜成分 | 维度从 10 降到 3(−70%) |
| R²(训练集) | 0.8264 | 0.8254 | 几乎相同(−0.001) |
| RMSE(训练,绩效分) | 4.312 | 4.325 | 几乎相同(+0.013) |
| Q²(10-fold CV) | 0.8101 | 0.8180 | PLS 更高 +0.008(泛化更稳) |
| CV-RMSE(绩效分) | 4.510 | 4.415 | PLS 更低 −0.095(预测误差降 2.1%) |
| 最大 VIF | 9.62(共线性警告) | —(潜空间正交无 VIF) | PLS 从结构上消除共线性 |
| 系数稳定性 | 方差被 VIF 放大 | 低方差(成分正交) | PLS 系数显著更稳健 |
| CV 折数 = 10;标准化空间训练,原始尺度 RMSE 反算;PLS 用满 10 成分时退化为 OLS | |||
关键对比:①训练集 R² 几乎无差异(0.8264 vs 0.8254)—— 说明 3 个潜成分已概括 10 个量表的全部相关信息;②交叉验证下 PLS 反超 OLS(Q² 0.8180 vs 0.8101),证明 PLS 在共线场景的泛化优势;③CV-RMSE 降 0.095 绩效分,看似不大但样本外稳定性显著提升;④PLS 维度从 10 → 3,模型复杂度降 70%,每个潜成分都有清晰心理学解读。
7. 文字分析
对 10 个心理量表 → 工作绩效 PLS 建模的完整解读:
- 最佳成分数 k* = 3(表1):Q² 在 k=1 → 2 → 3 一路上升(0.7758 → 0.8179 → 0.8180),k=4 起反降至 0.8106 —— 典型的Q² 拐点形态。这意味着 10 个心理量表的有效预测信息可被 3 个潜成分完全概括,再增加成分只会引入噪声。CV-RMSE 同步在 k=3 取最小值 4.415 分,与 Q² 判据完全一致。这是 PLS 区别于 OLS 的关键优势 —— 用 3 个正交潜成分替代 10 个高度相关的原变量做回归,参数空间维度降 70%。
- 前 3 VIP 变量及业务含义(表2):①责任心(VIP=1.198)—— 大五人格中工作绩效预测力最强的特质,与认真负责、自律执行直接相关;②目标导向(VIP=1.196)—— 设定目标并坚持完成的倾向,与 KPI 达成率高度同构;③内控性(VIP=1.183)—— 内控者相信自身行动决定结果,主动改进意愿更强。这 3 个变量 + 自我效能(VIP=1.158)构成"自我管理"潜构念,βstd 累计 0.789,对工作绩效的解释力远超情绪稳定与外向主动两组。结论:选拔/培养应重点关注"自我管理"维度,而非传统认知中的"性格外向 = 工作好"。
- Q² 预测稳健性(表3):PLS-3 的 Q²=0.8180 不仅高于训练 R²=0.8254 仅 0.007 的差距(说明几乎无过拟合),还反超 OLS 的 Q²=0.8101 — 后者由于 10 维参数空间方差膨胀导致 CV 表现下滑。原尺度 CV-RMSE 从 OLS 的 4.510 降到 PLS 的 4.415(降 2.1%),意味着对新员工绩效预测的平均误差小 0.1 分,对大样本人事决策而言显著。
- 共线性处理效果:原始 OLS 设计阵 VIF 最高 9.62(目标导向),其余 6 个变量 VIF > 6 —— 共线性严重已逼近"模型不可信"边界,OLS 系数(如外向性 β=−0.011、抗压能力 β=0.003)出现物理意义可疑的近零值。PLS 通过把变量投影到正交潜空间,从结构上消除了共线性问题,βstd 全部呈现合理正向(最小 0.004,无符号翻转),可解释性大幅提升。这是 PLS 相对 OLS 与岭回归(仍保留原相关变量)的独特优势。
- 业务建议:①人事筛选:在心理测评中优先关注 4 个 VIP > 1 变量(责任心 / 目标导向 / 内控性 / 自我效能),可将量表条目优化为重点考察项;②培训方向:对低绩效员工提供"目标管理 + 内控归因"培训,预期单位投入 ROI 显著高于团队建设/外向训练;③模型部署:使用 PLS-3 而非 OLS 作为生产环境绩效预测模型 —— 3 个潜成分模型不仅 CV 误差更低,对未来量表条目微调(如新增 1-2 个量表)也更鲁棒;④对比研究:若样本量增加到 1000+ 后,可重跑 PLS 并对比 Q²,监测模型稳定性;若研究目的是变量精简(如把量表从 10 题压到 5 题),应改用 Lasso;若想保留所有变量但收缩系数,用 岭回归。
结论:PLS-3 用 3 个潜成分概括 10 个高度相关心理量表,Q² 反超 OLS(0.8180 vs 0.8101),CV-RMSE 降 2.1%;VIP 排序清晰识别"自我管理 4 因子"为工作绩效核心驱动,模型既稳健又具理论可解释性 —— 这是面对"高维 + 共线性 + 需保留全部变量"心理量表场景时的标准建模流程。
8. 剖析提醒
PLS 与 Ridge/Lasso/PCR 的本质区别:①Lasso(L1)压稀疏,把部分系数归 0 完成变量选择;②Ridge(L2)压收缩,保留所有原变量但缩小系数;③PCR(主成分回归)先做 PCA 提取"解释 X 方差最大"的成分再回归,成分可能与 Y 无关;④PLS 提取"X 与 Y 协方差最大"的潜成分,每个成分都"瞄准 Y"。所以 PLS = "带 Y 监督的 PCR",在共线 + 需稳定预测场景几乎严格优于 PCR。VIP > 1 是经验阈值而非统计检验:源于"所有 VIP 平方加权均值 = 1"的代数恒等式,VIP > 1 表示该变量对 Y 预测的贡献高于平均,常用 1.0 / 0.8 两档;正式报告时应给出 VIP 排序图 + W* 权重 + Q² 曲线,不能仅凭 VIP 单值决策。PLS-DA vs PLS-R:本案例因变量是连续值用 PLS-R;若 Y 是分类变量(如绩效高/低二分类),应改用 PLS-DA(判别分析变体,把 Y 编码为 dummy 哑变量再做 PLS),SIMCA / R 的 ropls 包均原生支持。标准化必要性:PLS 提取成分时按变量方差排序,未标准化则单位大的变量会主导第一成分,本案例所有结果均基于 z-score 标准化;如已知变量量纲一致(如全部为同一量表的 Likert 分),可考虑保留原方差;化学计量学中常用"仅中心化不标准化"以保留浓度信息。最后,PLS 系数是有偏估计,报告时必须给出 Q² 而不仅是训练 R²,并对 W* 与 VIP 给出业务/理论可解释性的讨论 —— 这是 PLS 区别于"黑盒预测模型"的核心价值。