可视化

SPSS箱线图

案例数据

连续变量和可选分组变量,用于展示中位数、四分位距和异常值。

文件名box.xlsx
数据用途箱线图案例数据
变量说明Y 为连续变量,X 为可选分组变量。

完整案例

1. 背景

希望比较不同组别的分布位置、离散程度和异常点情况。

2. 理论与公式

箱线图使用中位数、四分位数、须线和异常点概括连续变量分布。

四分位距

箱体高度由四分位距决定。

下须

低于下须的点常标记为异常值。

上须

高于上须的点常标记为异常值。

3. 数据结构

Y 为连续变量,X 为可选分组变量。

4. 操作截图

  1. 上传案例数据
  2. 选择箱线图
  3. 放入连续变量
  4. 按需放入分组变量
  5. 点击开始分析
箱线图变量设置截图
箱线图变量设置截图

5. 结果表格与结果阅读

表1 箱线图统计示例
组别Q1中位数Q3IQR异常值数
A组2.913.424.061.152
B组2.643.183.821.185

箱体越高表示中间 50% 数据越分散。

重点查看中位线、箱体高度、须线长度和异常点。

6. 辅助截图

箱线图结果
箱线图结果
分组箱线图结果
分组箱线图结果

7. 文字分析

箱线图显示,不同组别的中位数和离散程度存在差异,部分组别出现异常值。

8. 剖析提醒

箱线图适合看异常值和分布差异,但不展示完整密度形态;可与小提琴图搭配使用。