📚 规则实战场景集合

包含 6 个完整场景、支持 CSV 和 JSON 两种数据格式,涵盖数据脱敏、关联表、自定义计算等应用

📦 快速下载(推荐)

选择您需要的数据格式,一键即可获得该格式的完整示例数据 + 对应规则配置

每个包包含 6 个数据文件 + 6 个规则配置文件;并额外包含场景 05 的使用说明文件 scenario_05_lookup_ref_README.md,约 20KB

📋 单个场景下载(自定义选择)

如需只下载特定场景的文件,可以在下方选择具体的场景和文件

🛍️ 电商订单处理

演示在线订单导出前的完整脱敏和数据处理流程

涉及的规则类型:

脱敏 搜索替换 文本标准化 类型转换 字段计算 添加字段
📊 CSV 数据 scenario_01_ecommerce.csv (5 订单记录)
📋 JSON 数据 scenario_01_ecommerce.json (3 订单对象)
⚙️ 规则配置
CSV 规则: scenario_01_ecommerce_rules_csv.json
JSON 规则: scenario_01_ecommerce_rules_json.json
🏥 医疗数据脱敏

演示医疗记录的多字段脱敏和缺失数据处理

涉及的规则类型:

脱敏 文本标准化 缺失值处理 字段复制 一致性校验
📊 CSV 数据 scenario_02_medical.csv (5 患者记录)
📋 JSON 数据 scenario_02_medical.json (3 患者对象)
⚙️ 规则配置
CSV 规则: scenario_02_medical_rules_csv.json
JSON 规则: scenario_02_medical_rules_json.json
📍 地理位置处理

演示地理数据的去重、坐标转换和异常检测

涉及的规则类型:

去重 坐标转换 异常检测 字段计算 添加字段
📊 CSV 数据 scenario_03_geolocation.csv (5 位置记录)
📋 JSON 数据 scenario_03_geolocation.json (3 位置对象)
⚙️ 规则配置
CSV 规则: scenario_03_geolocation_rules_csv.json
JSON 规则: scenario_03_geolocation_rules_json.json
📊 用户行为分析

演示用户行为数据的计算、分级和聚合统计

涉及的规则类型:

文本标准化 搜索替换 类型转换 字段计算 分组聚合
📊 CSV 数据 scenario_04_behavior.csv (7 行为记录)
📋 JSON 数据 scenario_04_behavior.json (4 行为对象)
⚙️ 规则配置
CSV 规则: scenario_04_behavior_rules_csv.json
JSON 规则: scenario_04_behavior_rules_json.json
🔗 订单维表补齐

演示通过关联表补齐缺失数据,附带完整产品维度表

涉及的规则类型:

关联补齐 添加字段 字段计算 一致性校验
📊 CSV 数据 scenario_05_lookup_ref.csv (5 订单) + scenario_05_products_ref.csv (4 产品维度表)
📋 JSON 数据 scenario_05_lookup_ref.json (5 订单+维度表) + scenario_05_products_ref.json
⚙️ 规则配置
CSV 规则: scenario_05_lookup_ref_rules_csv.json
JSON 规则: scenario_05_lookup_ref_rules_json.json
📘 使用说明 scenario_05_lookup_ref_README.md
🐍 高级计算:分级与分类

演示使用 JavaScript 公式实现复杂的数据转换和多字段综合计算

涉及的规则类型:

字段计算 脱敏 添加字段
📊 CSV 数据 scenario_06_python_udf.csv (5 用户记录)
📋 JSON 数据 scenario_06_python_udf.json (5 用户对象)
⚙️ 规则配置
CSV 规则: scenario_06_python_udf_rules_csv.json
JSON 规则: scenario_06_python_udf_rules_json.json

🎯 规则类型覆盖

以下是所有 4 个场景涉及的 8 种规则类型及其在各场景中的应用:

脱敏 脱敏敏感数据
场景: 1,2
搜索替换 文本替换
场景: 1,4
文本标准化 数据标准化
场景: 1,2,4
类型转换 类型转换
场景: 1,4
字段计算 公式计算
场景: 1,3,4
添加字段 添加字段
场景: 1,3,4
分组聚合 分组聚合
场景: 4
去重 数据去重
场景: 3
坐标转换 坐标转换
场景: 3
异常检测 异常检测
场景: 3
缺失值处理 缺失补全
场景: 2
字段复制 字段复制
场景: 2

📖 快速开始指南

1. 下载数据和规则

2. 选择数据格式

3. 在平台中使用

4. 深入学习

💡 提示:所有场景的 rules.json 都已在实际系统中测试通过,可以直接复制使用。建议先用其中一个场景进行试验,熟悉后再根据自己的需求修改规则。

📁 完整文件清单

文件名 类型 说明
scenario_01_ecommerce.csv CSV 电商订单样本数据 (5 行)
scenario_01_ecommerce.json JSON 电商订单样本数据 (3 对象)
scenario_01_ecommerce_rules.json Rules 电商场景规则配置
scenario_02_medical.csv CSV 医疗记录样本数据 (5 行)
scenario_02_medical.json JSON 医疗记录样本数据 (3 对象)
scenario_02_medical_rules.json Rules 医疗场景规则配置
scenario_03_geolocation.csv CSV 地理位置样本数据 (5 行)
scenario_03_geolocation.json JSON 地理位置样本数据 (3 对象)
scenario_03_geolocation_rules.json Rules 地理位置场景规则配置
scenario_04_behavior.csv CSV 用户行为样本数据 (7 行)
scenario_04_behavior.json JSON 用户行为样本数据 (4 对象)
scenario_04_behavior_rules.json Rules 用户行为场景规则配置
scenario_05_lookup_ref.csv CSV 订单维表样本数据 (5 行)
scenario_05_lookup_ref.json JSON 订单维表样本数据 (5 对象 + 维表)
scenario_05_products_ref.csv CSV 产品维度表 (用于场景 05 的参考表)
scenario_05_products_ref.json JSON 产品维度表 (用于场景 05 的参考表)
scenario_05_lookup_ref_rules.json Rules 订单维表场景规则配置
scenario_05_lookup_ref_README.md MD 场景 05 的使用说明,包含如何使用产品维表补齐示例
scenario_06_python_udf.csv CSV Python UDF 样本数据 (5 行)
scenario_06_python_udf.json JSON Python UDF 样本数据 (5 对象)
scenario_06_python_udf_rules.json Rules Python UDF 场景规则配置

需要更详细的规则文档?查看 使用指南首页