1 / 5
文档名称:

大数据平台数据质量评价维度.docx

格式:docx   大小:26KB   页数:5页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

大数据平台数据质量评价维度.docx

上传人:guoxiachuanyue006 2022/7/26 文件大小:26 KB

下载得到文件列表

大数据平台数据质量评价维度.docx

文档介绍

文档介绍:DB15/T1873—2020
10
13
附录A
(资料性附录)
数据质量评价维度

按照数据规则要求,数据元素被赋予数值的程度。即完整性指的是数据信息是否存在缺失的状况,
数据缺失的情况可能是整个:X=A/B
式中
人=满足元数据定义的数据集中元
素的个数;
B=被评价的数据集中元素个数
4
业务规则
数据符合业务规则的度量。
注1:业务规则是一种权威性原则或业务方针,用来描述业务交互,并建立行动和数据行为结果及完整性的规则。
注2:评价数据质量时需要检查是否存在良好归档的业务规则。
计算公式:X=A/B
式中
A-满足业务规则的数据集中元素
的个数;
B=被评价的数据集中元素个数
5
权威参考数

参考数据是系统、应用软件、数据库、流程、报告及交易记录和主记录用来参考的数值集合和分类表。
注1:评价数据质量时需要收集参考数据列表。
计算公式:X=A/B
式中
人=满足参考数据规则的数据集中
元素的个数;
B=被评价的数据集中元素个数
6
安全规则
安全规则是安全和隐私方面的规则,包括数据权限管理,数据脱敏处理等。
计算公式:X=A/B
式中
人=满足安全规范的数据集中元素
的个数;
B=被评价的数据集中元素个数

数据与其他特定上下文中使用的数据无矛盾的程度。即一致性是指数据是否遵循了统一的规范,数
据集合是否保持了统一的格式。数据质量的一致性主要体现在数据记录的规范和数据是否符合逻辑。

序号
指标名称
指标描述
计算方法
1
相同数据致性
同一数据在不同位置存储或被不同应用或用户使用时,数据的致性,数据发生变化时,存储
在不同位置的数据的同一数据被同步修改。
计算公式:X=A/B
式中
A=满足致性要求的数据集中元素的个数;
B=被评价的数据集中元素个数;
DB15/T1873—2020
12
13
2
关联数据致性
根据致性约束规则检查关联数据的致性。
计算公式:X=A/B
式中
A=满足致性要求的数据集中元素的个数;
B=被评价的数据集中元素个数;
DB15/T1873—2020
12
13

数据准确表示其所描述的真实实体(实际对象)真实值得程度。即准确性是指数据记录的信息是否存在异常或错误。

序号
指标名称
指标描述
计算方法
1
数据内容正确性
数据内容是否是预期数据。
计算公式:X=A/B
式中
A=满足数据正确性要求的数据集中元素的个数。
B=被评价的数据集中元素个数;
2
数据格式合规性
数据格式包含(数据类型、数据范围、数据长度、精度等)是否满足预期要求。
计算公式:X=A/B
式中
A=满足格式要求的数据集中元素的个数。
B=被评价的数据集中元素个数;
3
数据重复率
特定字段、记录、文件或数据集意外重复的度量。
计算公式:X=A/B
式中
A=重复数据集中元素的个数
B=被评价的数据集中元素个数;
4
数据唯一性
特定字段、记录、文件或数据集唯性的度量。
计算公式:X=A/B
式中