进阶方法

多选题多重响应分析

案例数据

300 行 × 11 列:300 位大学生回答一道多选题 "选择手机品牌时考虑哪些因素?"(外观/性能/价格/拍照/续航/品牌/系统/售后 8 个选项,0/1 二元存储),并附 性别 / 月消费水平 两个分组变量,用于演示多重响应频次表 + 与分组变量的交叉分析 + 卡方检验。

文件名multiple.xlsx
样本量300 行(大学生消费者)
变量数11 列(用户ID + 8 选项 0/1 + 性别 + 月消费水平)
数据用途多选题 × 分组变量交叉,用于群体画像与差异化营销
分组变量性别(男/女)、月消费水平(低/中/高三档)

完整案例

1. 背景

多选题在问卷里常用于捕捉"购买动机/影响因素"等多元偏好——比如"选择手机品牌时考虑哪些因素?"。每位被访者可同时勾选多个选项,存储时拆为 8 个 0/1 二元列(多重二分法 multi-dichotomy,区别于多重分类法把名次编码为单列)。多重响应分析 的核心不是"哪个选项最高"那样的简单频次(这一步在 问卷研究 · 多选题分析 已覆盖),而是要把多选行为嵌入到分组变量(性别 / 消费水平 / 年龄段 ...)里做交叉,回答"不同人群的选择结构是否显著不同"——这正是市场细分与差异化策略的统计基础。响应% 用于结构对比,个案% 用于覆盖率,卡方检验则给出每个选项 × 分组是否独立的显著性证据。

2. 理论与公式

响应百分比

选项 j 占全部响应次数的比例(结构占比)。

个案百分比

选项 j 在样本中的覆盖率,合计常超 100%。

分组卡方

对每个选项 × 分组 2×k 列联表做独立性检验。

3. 数据结构

每行 1 位大学生,8 个选项列 用 0/1 编码(多重二分法),后面跟 2 个分组变量。同一行可同时有多个 1(这是多重响应与单选频数的本质区别):

列名类型说明
用户ID字符串S001 ~ S300,匿名编号
外观 / 性能 / 价格 / 拍照0 / 1前 4 个选项,1=该因素被考虑
续航 / 品牌 / 系统 / 售后0 / 1后 4 个选项,同样 0/1 二分法存储
性别男 / 女分组变量 1(2 水平)
月消费水平低 / 中 / 高分组变量 2(3 水平:低<1000、中 1000-2000、高>2000 元)

8 个选项列 不是 8 个独立变量 而是 1 道题的并列响应;不能直接放进回归或单变量卡方,需用专门的"多重响应集"来组合分析。

4. 操作步骤

  1. 登录 SPSSzero,进入 工作台 → 上传 multiple.xlsx
  2. 左侧方法栏 → 进阶方法 → 点击 多选题多重响应分析
  3. 多重响应集 字段把 8 个选项列(外观/性能/价格/拍照/续航/品牌/系统/售后)全部拖入,确认 0/1 二分法
  4. 分组变量 字段先放 性别,运行第一次拿 2 水平交叉表;再换 月消费水平 拿 3 水平交叉表
  5. 勾选 卡方独立性检验(默认对每个选项 × 分组做 χ² 检验)与 响应% / 个案% 双列输出
  6. 点击 开始分析,结果区会输出频次表 + 性别交叉表 + 消费水平交叉表 + 显著性标记

5. 结果表格与结果阅读

结果分 3 张紧凑三线表:先看整体频次排序,再看性别差异(2 水平),最后看消费水平分层(3 水平)。

表1 多重响应频次表(N=300,总响应数=1155,平均每人选 3.85 个因素)
选项响应数响应%个案%排序
价格18015.58%60.00%1
外观17915.50%59.67%2
性能16314.11%54.33%3
续航16314.11%54.33%3
拍照14812.81%49.33%5
品牌13411.60%44.67%6
系统978.40%32.33%7
售后917.88%30.33%8
合计1155100.00%385.00%

头部 价格 (60.00%)外观 (59.67%) 几乎并驾齐驱;性能/续航并列第 3(54.33%);系统、售后处于尾部 30% 区间。个案% 合计 385% 大幅超过 100%,说明每位大学生平均关心约 3.85 个因素。

表2 性别 × 选项 交叉与卡方检验(男 N=129,女 N=171)
选项男%女%差值χ²p显著性
外观39.53%74.85%+35.3pp38.114<0.001***
性能73.64%39.77%−33.9pp34.011<0.001***
价格57.36%61.99%+4.6pp0.6550.418n.s.
拍照31.01%63.16%+32.2pp30.407<0.001***
续航59.69%50.29%−9.4pp2.6170.106n.s.
品牌43.41%45.61%+2.2pp0.1440.704n.s.
系统54.26%15.79%−38.5pp49.748<0.001***
售后25.58%33.92%+8.3pp2.4180.120n.s.
每行对该选项 0/1 × 性别做 Pearson χ²(无连续校正);* p<.05,** p<.01,*** p<.001,n.s. 不显著

4 项显著差异:女生显著更看重 外观(+35.3pp)/ 拍照(+32.2pp),男生显著更看重 性能(+33.9pp)/ 系统(+38.5pp);价格、续航、品牌、售后 4 项性别差异不显著(p>.05),说明它们是男女共同的基础需求

表3 月消费水平 × 选项 交叉与卡方检验(低 N=85,中 N=139,高 N=76)
选项低%中%高%χ²p显著性
价格82.35%62.59%30.26%46.087<0.001***
品牌27.06%47.48%59.21%17.613<0.001***
外观50.59%58.99%71.05%7.0310.030*
性能50.59%49.64%67.11%6.7110.035*
拍照42.35%48.20%59.21%4.6950.096n.s.
售后27.06%26.62%40.79%5.2710.072n.s.
续航56.47%53.96%52.63%0.2530.881n.s.
系统28.24%34.53%32.89%0.9710.616n.s.
按 p 升序展示前 4 项;价格 / 品牌 高低反向(消费水平越低越关注价格、越高越关注品牌)

最强分层信号是 价格:低消费 82.35% → 高消费 30.26%(净降 52pp,χ²=46.087,p<.001);品牌 反向,27.06% → 59.21%(净升 32pp,χ²=17.613,p<.001);外观、性能在高消费组也显著抬升。续航、系统在三档之间没有显著差异。

7. 文字分析

对 300 位大学生 8 个手机购买考虑因素的多重响应分析综合结论:

  • 整体偏好:总响应 1155,平均每人选 3.85 个因素;头部 价格 60.00% / 外观 59.67% / 性能=续航 54.33% 构成"决策铁三角",系统 32.33% / 售后 30.33% 排名末尾。
  • 性别画像:女生显著更看 外观 (74.85% vs 39.53%) / 拍照 (63.16% vs 31.01%),男生显著更看 性能 (73.64% vs 39.77%) / 系统 (54.26% vs 15.79%),4 项 χ²>30(p<.001);价格、续航、品牌、售后 4 项性别一致,是男女通用基础需求
  • 消费分层价格品牌 出现显著反向梯度——低消费组 82.35% 关注价格、仅 27.06% 关注品牌;高消费组 30.26% 关注价格、却 59.21% 关注品牌(χ² 分别为 46.087 / 17.613,p<.001);说明消费层级是"价格敏感↔品牌敏感"的核心切分轴。
  • 群体画像:综合 2 个分组维度,女生 + 中高消费 群体最关注外观与拍照、品牌;男生 + 高消费 最关注性能与系统;低消费 群体(无论性别)以价格为绝对核心(82.35% 居所有交叉单元最高)。
  • 营销建议:① 主打"颜值+影像"机型应优先面向女生与中高消费群(占样本约 40%);② 性能+系统旗舰应聚焦男生 + 高消费用户;③ 价位敏感的入门机型应突出价格优势锁定低消费组;④ 续航、售后属于"沉默基础项",建议作为通用文案兜底而非差异化卖点。

8. 剖析提醒

多选题不能整体当一个变量做卡方:本页采用的做法是"每个选项 0/1 单独 × 分组"做 8 次 2×k 列联表 χ²,得到每个选项的独立显著性;不要把 8 个选项合并成 1 个多类别变量。② SPSS 默认对 2×2 表使用 Yates 连续校正(continuity correction),本页结果遵循经典"无连续校正"的 Pearson χ²,所以与 SPSS 默认 2×2 输出可能相差 ~0.01;当两选项都是 2×2 时 SPSS 还会自动给出 Fisher 精确检验,可作为小样本备选。③ 多次比较问题:本案例对每个分组变量做了 8 次 χ²,整体犯第一类错误的概率会膨胀,严谨写作应做 Bonferroni 校正(阈值 0.05/8≈0.006),按这个更严苛的阈值,性别上 4 项依然显著、消费水平上 2 项依然显著。④ 若想做两组之间响应% 是否相等的检验,SPSS 多重响应 → 比较列比例(z-test for column proportions) 是更直接的等价工具,与本页 2×2 χ² 同源。