数据校验
基于多种自研技术,Tapdata 可最大程度保障数据一致性。除此以外,Tapdata 还支持对数据表执行数据校验,帮助您进一步验证和确保数据流转的正确性,满足生产环境的严苛要求。本文介绍数据校验任务的配置流程。
操作步骤
登录 Tapdata 平台。
在左侧导航栏,选择数据管道 > 数据校验。
单击页面右上角的创建,填写任务名称,然后选择任务模式并根据下述说明填写各项参数:
- 对数据复制/开发任务执行校验
- 自定义待校验的源和目标表
- 校验任务模式:选择为特定的 PIPELINE 创建的校验任务。
- 选择任务:选择待校验的数据复制/数据开发任务。
- 结果输出:选择输出所有不一致的数据或只输出来源表不一致的数据。
- 校验告警:选择当任务运行出错或校验结果不一致时,告警信息的通知方式。
- 校验类型:目前支持下述三种校验方式。
- 快速 count 校验:对源表和目标表的行数进行校验,不会展示具体的差异内容,速度极快。
- 全表字段值校验:对源表和目标表的全部字段的值逐行校验,可展示所有字段的差异内容,速度较慢。
- 关联字段值校验:仅对源表和目标表的关联字段的值进行校验,速度中等。
- 校验频次:默认为单次校验,如选择为重复校验,您还需要设置校验执行的起止时间和任务间隔时间。
- 错误保存条数:即不一致数据保存的最大条数,默认为 100,最大为 10000,推荐设置较大的值以确保记录的完整性。
- 校验条件:推荐选择自动添加表,即由 Tapdata 自动加载数据复制/开发任务中的源/目标数据表,此外,您也可以手动添加表、设置高级校验并添加 JS 校验逻辑。
如在同步过程中修改了表的字段名,那么执行表全字段值校验或关联字段值校验时,可能因字段名不匹配而导致校验失败。
- 校验任务模式:选择指定任意表的校验任务。
- 结果输出:选择输出所有不一致的数据或只输出来源表不一致的数据。
- 校验告警:选择当任务运行出错或校验结果不一致时,告警信息的通知方式。
- 校验类型:目前支持下述三种校验方式。
- 快速 count 校验:对源表和目标表的行数进行校验,不会展示具体的差异内容,速度极快。
- 全表字段值校验:对源表和目标表的全部字段的值逐行校验,可展示所有字段的差异内容,速度较慢。
- 关联字段值校验:仅对源表和目标表的关联字段的值进行校验,速度中等。
- 校验频次:默认为单次校验,如选择为重复校验,您还需要设置校验执行的起止时间和任务间隔时间。
- 错误保存条数:即不一致数据保存的最大条数,默认为 100,最大为 10000,推荐设置较大的值以确保记录的完整性。
- 校验条件:单击 图标,手动指定待校验的校验源/目标数据连接、待校验的表、索引字段、待校验模型,此外,您还可以通过高级校验添加 JS 校验逻辑。
如需校验多个表,可单击添加表继续添加校验条件。
单击保存,校验任务开始执行。
(可选)单击校验任务对应的详情,查看详细校验结果。
提示当校验类型为全表字段值校验或关联字段值校验时,您还可以单击右上角的差异校验,对本次全量校验的差异数据结果进行再次校验,以确认数据是否已经一致。
常见问题
问:支持定时执行数据校验吗?
答:支持,可在配置校验任务时选择校验频次为重复校验,然后根据需要选择执行时间和间隔时间。
问:为什么会出现数据校验不一致?
答:Tapdata 基于多种自研技术保障数据一致性,通常数据校验不一致的原因包括但不限于以下几种原因:
- 有客户端在目标表中新写或修改了数据
- 数据复制过程中修改了表的字段名
- 数据增量复制有延迟,源表中新的数据变更尚未同步到目标表
问:校验任务提示失败,如何处理?
答:单击校验任务对应的详情,查看相关报错提示,或联系我们获取技术支持。