数据处理

数据标签

案例数据

包含 data 和 tags 两个工作表,用于演示分类编码如何显示为男、女、本科、研究生等标签。

文件名dataprocess_labels.xlsx
数据用途数据标签案例数据
变量说明data 工作表为样本数据,tags 工作表记录变量、数字和标签三列映射。

完整案例

1. 背景

上传后的分类变量以数字编码保存,结果表中直接显示 1、2、3 不便阅读,需要给编码补充含义。

2. 理论与公式

数据标签用于给分类编码补充可读含义。分析时仍使用原数字,展示时按标签映射显示。

标签映射

当编码值等于 k 时,结果展示为对应标签。

分析值不变

设置标签不会改变用于计算的原始数字。

3. 数据结构

data 工作表为样本数据,tags 工作表记录变量、数字和标签三列映射。

4. 操作步骤与截图

  1. 上传案例数据
  2. 进入数据标签
  3. 选择 gender、education、channel 等定类变量
  4. 填写数字与标签的对应关系
  5. 回到频数或交叉表查看标签展示
数据标签设置示意
数据标签设置示意

5. 结果表格与核验

表1 数据标签映射示例
变量数字标签用途
gender1频数和交叉表展示
gender2频数和交叉表展示
education4本科分组比较展示

标签只改变展示,不改变底层数据值。

重点确认标签只影响展示,不改变原始数字编码;带标签的变量在结果表中应显示清晰类别名称。

6. 辅助截图

下载数据中的 tags 工作表示意
下载数据中的 tags 工作表示意
上传数据 tags 工作表示意
上传数据 tags 工作表示意

7. 文字分析

设置数据标签后,分类变量在分析结果中由数字编码转换为可读文本,提高了交叉表、频数表和模型结果的解释性。

8. 剖析提醒

数据标签不等于数据编码。标签只负责显示含义,编码才会改变变量取值。