使用指南
完整的规则使用方法、函数参考和最佳实践
规则体系概览
清晰的规则体系分为五大类,按照数据处理的业务流程组织:
规则配置基础
所有规则类型
| 规则类型 | 功能 | 常见参数 |
|---|---|---|
| mask | 脱敏敏感信息 | preset, field, keepFirst, keepLast, maskChar |
| replace | 文本替换(支持正则) | field, search, replace, regex |
| normalize | 标准化和清洗(格式、大小写、空白) | field, mode, outputFormat |
| convert | 类型转换(字符串↔数字、日期格式等) | field, subType, fromUnit, toUnit |
| compute | 公式计算生成新字段 | targetField, formula |
| aggregate | 分组聚合统计 | groupBy, targets, outputMode |
JSON 配置示例
每条规则都是一个 JSON 对象,包含规则类型和相关参数:
{
"type": "mask", // 规则类型
"field": "phone", // 作用字段
"preset": "phone", // 脱敏方案
"keepFirst": 3, // 脱敏参数
"keepLast": 4
}
// 更多例子:
{ "type": "replace", "field": "status", "search": "pending", "replace": "waiting" }
{ "type": "normalize", "field": "email", "mode": "lowercase" }
{ "type": "convert", "field": "price", "subType": "str_to_num" }
{ "type": "compute", "targetField": "total", "formula": "price * quantity" }
{ "type": "aggregate", "groupBy": "dept", "targets": [{"field": "salary", "agg": "sum"}] }
规则链式执行
规则按顺序执行,前一条规则的输出成为后一条规则的输入。这使你能够:
- 先脱敏保护敏感信息
- 再用 replace/normalize 清洗数据
- 再用 convert 统一格式
- 再用 compute 计算衍生指标
- 最后用 aggregate 汇总分析
💡 推荐顺序:mask → replace → normalize → convert → compute → aggregate
快速导航
| 规则类型 | 适用场景 | 复杂度 | 文档 |
|---|---|---|---|
| 脱敏 (mask) | 保护敏感字段 | ⭐ | 查看 |
| 替换 (replace) | 快速修正数据 | ⭐ | 查看 |
| 规范化 (normalize) | 统一格式、标准化数据 | ⭐⭐ | 查看 |
| 转换 (convert) | 类型转换、格式转换 | ⭐⭐ | 查看 |
| 计算 (compute) | 生成衍生字段 | ⭐⭐⭐ | 查看 |
| 聚合 (aggregate) | 统计分析 | ⭐⭐⭐ | 查看 |
实战示例集合
为了更好地理解规则的实际应用,我们准备了多个完整的实战场景示例,每个示例都包含:
- 原始数据: 真实的CSV/JSON样本数据
- 规则配置: 调试通过的rules.json配置
- 结果展示: 脱敏/转换后的实际输出
- 应用说明: 该规则的使用场景和最佳实践
学习路线
⚙️ 中级 (2-4 小时)
- 掌握 计算规则 的基础函数
- 学习日期、字符串操作函数
- 理解规则链式执行的逻辑