进阶方法

PLS回归分析

案例数据

300 名员工 × 11 列。10 个心理量表平均分（自我效能 / 责任心 / 内控性 / 目标导向 / 情绪稳定性 / 抗压能力 / 心理韧性 / 外向性 / 主动性 / 团队合作）作为自变量，工作绩效（50-100 分）为因变量。10 个量表间相关系数 0.34-0.90、平均相关 0.62，VIF 最高 9.62 —— 多重共线性严重，OLS 不稳定。专为演示 PLS（偏最小二乘回归）设计：通过提取少量与 Y 协方差最大的潜在成分，把高维相关自变量压缩到低维潜空间后再做回归，从根本上回避共线性。

下载案例数据查看数据文件

文件名	pls_regression.xlsx
样本量	300 行
变量数	11 列（10 个心理量表分 + 1 个因变量）
数据用途	员工工作绩效预测：演示 PLS 用 2-3 个潜成分概括 10 个高度相关心理量表的信息，VIP 排序识别核心人格驱动因子。
变量说明	自变量（10 个，1-7 分 Likert 均分，互相 r=0.34-0.90）：自我效能 / 责任心 / 内控性 / 目标导向 / 情绪稳定性 / 抗压能力 / 心理韧性 / 外向性 / 主动性 / 团队合作。三组潜结构：①"自我管理"组（自我效能/责任心/内控性/目标导向，强驱动）；②"情绪稳定"组（情绪稳定性/抗压能力/心理韧性，中等驱动）；③"外向主动"组（外向性/主动性/团队合作，弱驱动）。因变量：工作绩效（连续 50-100 分）。

完整案例

1. 背景

面对"自变量数量多 + 高度共线"的场景，OLS 估计极不稳定：参数方差被 VIF 放大若干倍，单个变量的回归系数可能正负翻转、p 值飘忽，模型可解释性彻底崩塌。常见解法可分两条路 —— ①正则化派（岭回归 / Lasso）：保留原变量但对系数施加 L1/L2 惩罚来收缩或归零；②潜空间派（PCR / PLS）：把原变量压缩为正交的潜成分后再回归。PLS（Partial Least Squares Regression, 偏最小二乘回归）属于潜空间派，但与 PCR（主成分回归）有本质区别 —— PCR 提取的成分只追求"解释 X 自身方差最大"，可能与 Y 无关；PLS 提取的成分追求"X 与 Y 的协方差最大"，每一个成分都"瞄准"对 Y 的预测。这让 PLS 在变量比样本多、共线性极强、且需要稳定预测的场景（化学计量学、感官评定、心理量表、组学数据、临床预测）几乎成为首选。PLS 不像 Lasso 自动稀疏 —— 保留全部原变量但赋予VIP（Variable Importance in Projection），VIP > 1 经验阈值用于识别核心驱动变量，VIP 与 W*（旋转权重）共同构成 PLS 独有的"变量诊断"工具集。本案例 10 个心理量表 → 工作绩效，VIF 最高 9.62 已逼近共线性临界值，正是 PLS 大展身手的典型场景。

2. 理论与公式

PLS 通过迭代算法（NIPALS 或 SIMPLS）依次提取成分：每一步在残差空间寻找权重向量 w 使潜成分 t = Xw 与 Y 的协方差最大，然后从 X、Y 中剥离该成分的贡献再继续。最终用前 k 个潜成分做回归。

潜成分提取（协方差最大）

第 a 个成分的权重 w_a 让 t_a 与 Y 协方差最大 —— 这是 PLS 与 PCA/PCR 的根本区别。

预测模型（成分回归）

用前 k 个成分回归 Y；W* 是旋转权重，可把潜空间系数映回原变量空间得到 β_PLS。

VIP（变量重要性）

第 j 个变量的 VIP 是其权重平方在各成分上加权（按 Y 解释力）的几何平均；VIP > 1 经验阈值表示该变量对 Y 预测的贡献高于平均。

Q²（预测 R²，留一/k-fold CV）

用交叉验证残差替代训练残差计算的 R²；Q² > 0 说明模型有泛化预测力，Q² 拐点处是最优成分数。

3. 数据结构

每行 1 名员工，10 个心理量表平均分按"潜结构组"分为 3 组，外加 1 个因变量：

组别（潜结构）	变量名	类型	说明
自我管理组（强驱动，4 个）	自我效能	连续 1-7	对完成任务的信心评分
	责任心	连续 1-7	大五人格责任心维度
	内控性	连续 1-7	Rotter 内外控量表分
	目标导向	连续 1-7	目标设定与达成倾向
情绪稳定组（中等驱动，3 个）	情绪稳定性	连续 1-7	大五人格神经质反向
	抗压能力	连续 1-7	压力情境应对自评
	心理韧性	连续 1-7	CD-RISC 韧性量表分
外向主动组（弱驱动，3 个）	外向性	连续 1-7	大五人格外向性维度
	主动性	连续 1-7	个体主动行为评分
	团队合作	连续 1-7	协作意愿与表现
因变量 Y	工作绩效	连续 50-100 分	主管 + KPI 综合评分

这是 PLS 的典型适用场景 —— 自变量来自同一概念体系（心理量表）、彼此高度相关、且不希望像 Lasso 一样把变量"砍掉"（量表条目都有理论意义，需保留并赋权）。

4. 操作步骤

登录 SPSSzero，进入 工作台 → 上传 pls_regression.xlsx
左侧方法栏 → 进阶方法 → 点击 PLS 回归
把 工作绩效 拖入 因变量 Y
把 10 个心理量表全部拖入 自变量 X（系统自动 z-score 标准化 —— 这是 PLS 的硬性前置条件，否则量纲大的变量会主导成分）
勾选 OLS 对照 + VIF 诊断，确认共线性严重程度（VIF > 5 时 PLS 比 OLS 优势明显）
勾选 成分数选择：设置最大成分数（默认 = min(p, 10)），系统跑 1...k_max 每个值的 R²(训练) + Q²(10-fold CV) + CV-RMSE，绘制曲线并标出 Q² 拐点
系统自动选 Q² 最大对应的 k* 作为最优成分数；也可手动指定
勾选 VIP 报告 + W* 权重 + 标准化系数，得到三件套：变量重要性 / 旋转权重 / 映回原空间的回归系数
点击 开始分析，依次得到：成分数选择表 / VIP 与 W* 排序表 / OLS vs PLS 综合指标对比表

5. 结果表格与结果阅读

结果区按"先定成分数、再看变量重要性、最后对比 OLS"输出 3 张表：

表1 成分数选择：1-10 成分下的 R² / Q² / CV-RMSE

成分数 k	R²(训练)	Q²(10-fold CV)	CV-RMSE（绩效分）	说明
1	0.7804	0.7758	4.900	单成分已抓住主成分，但仍欠拟合
2	0.8249	0.8179	4.416	第 2 成分带来 Q² 跃升 +0.042
*3 (k)**	0.8254	0.8180	4.415	Q² 拐点 —— 最优成分数，增益已饱和
4	0.8263	0.8106	4.503	Q² 反降，开始过拟合
5	0.8264	0.8100	4.511	训练 R² 几乎不变，CV 性能下滑
6-10	0.8264	0.8101	4.510	已无新信息，等价于 OLS
N=300, p=10；R² 在标准化空间，CV-RMSE 在原始绩效分尺度；k* 由 Q² 最大值规则选出

路径观察：①Q² 在 k=3 处达到 0.8180 拐点；②k=10 时 Q²=0.8101 已等同于 OLS（PLS 用满成分会退化为 OLS）—— 这正是 PLS 的"成分减半 + 性能不降"特性；③CV-RMSE 在 k=3 最小（4.415 分），用 3 个潜成分概括 10 个心理量表的信息已足够。

表2 最优 PLS-3 模型下变量 VIP / W* / 标准化系数（按 VIP 降序）

排序	变量	VIP	W*₁（成分1）	W*₂（成分2）	β_std（PLS）	重要性判断
1	责任心	1.198	0.380	0.395	0.207	核心驱动（VIP > 1）
2	目标导向	1.196	0.387	0.209	0.177	核心驱动（VIP > 1）
3	内控性	1.183	0.380	0.307	0.188	核心驱动（VIP > 1）
4	自我效能	1.158	0.362	0.478	0.217	核心驱动（VIP > 1）
5	心理韧性	0.977	0.312	−0.210	0.065	中等贡献（VIP < 1）
6	团队合作	0.893	0.287	−0.138	0.086	中等贡献
7	情绪稳定性	0.865	0.275	−0.205	0.047	较弱贡献
8	抗压能力	0.857	0.266	−0.309	0.023	较弱贡献
9	主动性	0.763	0.232	−0.344	0.019	弱贡献
10	外向性	0.761	0.225	−0.411	0.004	弱贡献
PLS-3 模型；W* 为旋转权重（rotation matrix），β_std 是潜空间映回原变量的标准化系数；VIP > 1 经验阈值

关键观察：①VIP > 1 的 4 个变量全部来自"自我管理组"（责任心 / 目标导向 / 内控性 / 自我效能），与数据生成时的强驱动因子设定完全吻合；②W*₁ 列所有变量同号 —— 第 1 成分是"整体心理资本"综合因子；③W*₂ 列出现正负分化（自我管理组正 / 情绪稳定组负 / 外向组负）—— 第 2 成分是"自我管理 vs 情绪外向"对比因子；④"外向性"VIP=0.761 最低，但 PLS 仍保留它在模型中（与 Lasso 归零的处理方式完全不同）。

表3 OLS vs PLS-3 综合指标对比（N=300, p=10, max VIF=9.62）

指标	OLS	PLS-3	PLS 相对 OLS 的变化
参数数量（有效）	10	3 潜成分	维度从 10 降到 3（−70%）
R²（训练集）	0.8264	0.8254	几乎相同（−0.001）
RMSE（训练，绩效分）	4.312	4.325	几乎相同（+0.013）
Q²（10-fold CV）	0.8101	0.8180	PLS 更高 +0.008（泛化更稳）
CV-RMSE（绩效分）	4.510	4.415	PLS 更低 −0.095（预测误差降 2.1%）
最大 VIF	9.62（共线性警告）	—（潜空间正交无 VIF）	PLS 从结构上消除共线性
系数稳定性	方差被 VIF 放大	低方差（成分正交）	PLS 系数显著更稳健
CV 折数 = 10；标准化空间训练，原始尺度 RMSE 反算；PLS 用满 10 成分时退化为 OLS

关键对比：①训练集 R² 几乎无差异（0.8264 vs 0.8254）—— 说明 3 个潜成分已概括 10 个量表的全部相关信息；②交叉验证下 PLS 反超 OLS（Q² 0.8180 vs 0.8101），证明 PLS 在共线场景的泛化优势；③CV-RMSE 降 0.095 绩效分，看似不大但样本外稳定性显著提升；④PLS 维度从 10 → 3，模型复杂度降 70%，每个潜成分都有清晰心理学解读。

7. 文字分析

对 10 个心理量表 → 工作绩效 PLS 建模的完整解读：

最佳成分数 k* = 3（表1）：Q² 在 k=1 → 2 → 3 一路上升（0.7758 → 0.8179 → 0.8180），k=4 起反降至 0.8106 —— 典型的Q² 拐点形态。这意味着 10 个心理量表的有效预测信息可被 3 个潜成分完全概括，再增加成分只会引入噪声。CV-RMSE 同步在 k=3 取最小值 4.415 分，与 Q² 判据完全一致。这是 PLS 区别于 OLS 的关键优势 —— 用 3 个正交潜成分替代 10 个高度相关的原变量做回归，参数空间维度降 70%。
前 3 VIP 变量及业务含义（表2）：①责任心（VIP=1.198）—— 大五人格中工作绩效预测力最强的特质，与认真负责、自律执行直接相关；②目标导向（VIP=1.196）—— 设定目标并坚持完成的倾向，与 KPI 达成率高度同构；③内控性（VIP=1.183）—— 内控者相信自身行动决定结果，主动改进意愿更强。这 3 个变量 + 自我效能（VIP=1.158）构成"自我管理"潜构念，β_std 累计 0.789，对工作绩效的解释力远超情绪稳定与外向主动两组。结论：选拔/培养应重点关注"自我管理"维度，而非传统认知中的"性格外向 = 工作好"。
Q² 预测稳健性（表3）：PLS-3 的 Q²=0.8180 不仅高于训练 R²=0.8254 仅 0.007 的差距（说明几乎无过拟合），还反超 OLS 的 Q²=0.8101 — 后者由于 10 维参数空间方差膨胀导致 CV 表现下滑。原尺度 CV-RMSE 从 OLS 的 4.510 降到 PLS 的 4.415（降 2.1%），意味着对新员工绩效预测的平均误差小 0.1 分，对大样本人事决策而言显著。
共线性处理效果：原始 OLS 设计阵 VIF 最高 9.62（目标导向），其余 6 个变量 VIF > 6 —— 共线性严重已逼近"模型不可信"边界，OLS 系数（如外向性 β=−0.011、抗压能力 β=0.003）出现物理意义可疑的近零值。PLS 通过把变量投影到正交潜空间，从结构上消除了共线性问题，β_std 全部呈现合理正向（最小 0.004，无符号翻转），可解释性大幅提升。这是 PLS 相对 OLS 与岭回归（仍保留原相关变量）的独特优势。
业务建议：①人事筛选：在心理测评中优先关注 4 个 VIP > 1 变量（责任心 / 目标导向 / 内控性 / 自我效能），可将量表条目优化为重点考察项；②培训方向：对低绩效员工提供"目标管理 + 内控归因"培训，预期单位投入 ROI 显著高于团队建设/外向训练；③模型部署：使用 PLS-3 而非 OLS 作为生产环境绩效预测模型 —— 3 个潜成分模型不仅 CV 误差更低，对未来量表条目微调（如新增 1-2 个量表）也更鲁棒；④对比研究：若样本量增加到 1000+ 后，可重跑 PLS 并对比 Q²，监测模型稳定性；若研究目的是变量精简（如把量表从 10 题压到 5 题），应改用 Lasso；若想保留所有变量但收缩系数，用 岭回归。

结论：PLS-3 用 3 个潜成分概括 10 个高度相关心理量表，Q² 反超 OLS（0.8180 vs 0.8101），CV-RMSE 降 2.1%；VIP 排序清晰识别"自我管理 4 因子"为工作绩效核心驱动，模型既稳健又具理论可解释性 —— 这是面对"高维 + 共线性 + 需保留全部变量"心理量表场景时的标准建模流程。

8. 剖析提醒

PLS 与 Ridge/Lasso/PCR 的本质区别：①Lasso（L1）压稀疏，把部分系数归 0 完成变量选择；②Ridge（L2）压收缩，保留所有原变量但缩小系数；③PCR（主成分回归）先做 PCA 提取"解释 X 方差最大"的成分再回归，成分可能与 Y 无关；④PLS 提取"X 与 Y 协方差最大"的潜成分，每个成分都"瞄准 Y"。所以 PLS = "带 Y 监督的 PCR"，在共线 + 需稳定预测场景几乎严格优于 PCR。VIP > 1 是经验阈值而非统计检验：源于"所有 VIP 平方加权均值 = 1"的代数恒等式，VIP > 1 表示该变量对 Y 预测的贡献高于平均，常用 1.0 / 0.8 两档；正式报告时应给出 VIP 排序图 + W* 权重 + Q² 曲线，不能仅凭 VIP 单值决策。PLS-DA vs PLS-R：本案例因变量是连续值用 PLS-R；若 Y 是分类变量（如绩效高/低二分类），应改用 PLS-DA（判别分析变体，把 Y 编码为 dummy 哑变量再做 PLS），SIMCA / R 的 ropls 包均原生支持。标准化必要性：PLS 提取成分时按变量方差排序，未标准化则单位大的变量会主导第一成分，本案例所有结果均基于 z-score 标准化；如已知变量量纲一致（如全部为同一量表的 Likert 分），可考虑保留原方差；化学计量学中常用"仅中心化不标准化"以保留浓度信息。最后，PLS 系数是有偏估计，报告时必须给出 Q² 而不仅是训练 R²，并对 W* 与 VIP 给出业务/理论可解释性的讨论 —— 这是 PLS 区别于"黑盒预测模型"的核心价值。