| 文件名 | box.xlsx |
|---|---|
| 数据用途 | 箱线图案例数据 |
| 变量说明 | Y 为连续变量,X 为可选分组变量。 |
完整案例
1. 背景
希望比较不同组别的分布位置、离散程度和异常点情况。
2. 理论与公式
箱线图使用中位数、四分位数、须线和异常点概括连续变量分布。
四分位距
箱体高度由四分位距决定。
下须
低于下须的点常标记为异常值。
上须
高于上须的点常标记为异常值。
3. 数据结构
Y 为连续变量,X 为可选分组变量。
4. 操作截图
- 上传案例数据
- 选择箱线图
- 放入连续变量
- 按需放入分组变量
- 点击开始分析

5. 结果表格与结果阅读
| 组别 | Q1 | 中位数 | Q3 | IQR | 异常值数 |
|---|---|---|---|---|---|
| A组 | 2.91 | 3.42 | 4.06 | 1.15 | 2 |
| B组 | 2.64 | 3.18 | 3.82 | 1.18 | 5 |
箱体越高表示中间 50% 数据越分散。
重点查看中位线、箱体高度、须线长度和异常点。
6. 辅助截图


7. 文字分析
箱线图显示,不同组别的中位数和离散程度存在差异,部分组别出现异常值。
8. 剖析提醒
箱线图适合看异常值和分布差异,但不展示完整密度形态;可与小提琴图搭配使用。