1 / 14
文档名称:

技术白皮书-【电科凌云大数据脱敏系统v1.doc

格式:doc   大小:102KB   页数:14页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

技术白皮书-【电科凌云大数据脱敏系统v1.doc

上传人:蓝天 2022/7/1 文件大小:102 KB

下载得到文件列表

技术白皮书-【电科凌云大数据脱敏系统v1.doc

相关文档

文档介绍

文档介绍:密级:公开
电科凌云大数据脱敏系统V1- 0
技术白皮书
电旅僵云
修订记录
修订日期
修订版本
修订章节
修订描述
作者
2016-03月

全部
初稿完成。
V2. 0
全部
全文识别用户数据中的敏感数据,提供基于规则的发现方式 和人工定义方式实现敏感数据发现。
算法管理:使用程序框架技术,实现脱敏算法的动态加载、卸载、参数 管理和算法可扩展功能。
规则管理:实现脱敏规则的添加、修改、删除等基本管理功能,同时为 脱敏引擎提供规则加载功能。
用户管理:对系统中用户进行权限分配、以及用户的添加、删除、修改 等管理操作。
动态脱敏服务:在线实时接收脱敏服务请求,并根据用户配置的脱敏规 则,实现对敏感数据脱敏处理,及时返回处理结果。
脱敏引擎:对系统中的脱敏任务进行调度,完成具体的脱敏任务。主要 针对各种数据类型,执行脱敏操作,包括元数据脱敏、文本脱敏、图像脱敏、 HTML/XML 脱敏、PDFAVORD 脱敏。
静态脱敏服务:接收用户从管理界面提交的批量脱敏任务,根据脱敏要 求,一次性完成数据脱敏操作,并输出到指定位置。
日志管理:收集系统数据脱敏日志,提供日志查询、统计与维护接口。
3)辅助模块:为后台其他模块提供支撑,主要包括数据处理模块、服务接 口、数据抽取及写入接口。
工具模块:为后台管理的数据脱敏和敏感数据发现提供基础模型,主要 包括NLP处理模块、OCR处理模块、HTML/XML处理模块、图像处理模块、 PDFAVORD处理模块五个模块。
服务接口:为数据脱敏应用系统和后台数据脱敏模块提供接口的交互。
数据抽取与写入接口:为数据抽取和数据写入提供接口。

。MySQL具有体积小、速度快、 运行稳定可靠、总体成本低等优点。
工作数据库主要包括规则库、元数据库、日志库、算法库、用户信息库。
1) 规则库
规则库用来存储数据脱敏规则,规则包含待脱敏的数据的元数据、脱敏算法 等信息。
2) 元数据库
元数据库用来存储用户对数据的描述与定义的相关信息。
3) 日志库
日志库用来存储数据脱敏服务所产生的日志数据,包括:时间、任务来源、 脱敏前数据、脱敏后数据、脱敏规则。
4)算法库
算法库用来存储数据脱敏的算法,包括算法名称、类型、描述与相关参数等 信息。
5)用户信息库
用户信息库用来存储系统中所有用户的详细信息,包括用户名、角色、权限、 登录口令等信息。
3产品功能
、静态数据脱敏、动态数 据脱敏及数据脱敏安全审计四大功能。
图1电科凌云大数据脱敏系统组成
产品功能模块说明如下:
1) 敏感数据发现
敏感数据发现主要功能是提供人工定义和自动发现两种方式实现敏感数据 的识别,用户可以对发现的敏感数据进行修改和确认,同时系统可以自动为敏感 数据推荐脱敏规则。
2) 静态数据脱敏
静态数据脱敏服务是用户通过管理界面,配置脱敏数据和规则,并以可视化 的形式,将脱敏任务提交后台服务,后台脱敏引擎根据用户指定的数据和规则, 一次性将用户数据全部脱敏输出到指定位置。
3) 动态数据脱敏
动态数据脱敏服务是以服务的方式,在线实时接收脱敏服务请求,并根据用 户配置的脱敏规则,对数据进行脱敏处理,及时返回处理结果,支持高并发和高 吞吐量。
4) 脱敏安全审计
脱敏安全审计是对数据脱敏的日志进行分析挖掘,及时发现异常行为,保障 数据的安全。

1) 对用户数据的数据来源、数据内容、数据类型等信息进行描述与定义。
2) 对元数据信息进行查询、编辑、删除等操作。
3) 按照用户自定义模板导入元数据信息。

1) 支持结构化(数据库、xmh excel等)与非结构化(图片、文本等)的 敏感数据发现。
2) 支持多种敏感数据发现方式,包括:人工定义的方式、基于规则的方式、 基于机器学****的方式、基于脚本的方式。
3) 支持用户自定义敏感数据发现方式。
4) 支持用户对发现的敏感数据进行确认,在敏感数据发现的结果出现偏差 后,可手动进行修改。
5) 支持用户依照敏感数据定义规范,导入敏感数据的脚本文件。
6) 支持界面自定义敏感数据发现规则,并存入规则库。

1) 支持对脱敏规则进行查询、添加、修改、删除的操作。
2) 可根据敏感数据的数据特征,自动为敏感数据推荐脱敏规则。
3)管理已有的数据脱敏规则,方便用户对脱敏规则的复用。

1) 支持用户对数据的存储位置、数据访问账号、数据描述进行查询、添加、 修改、删除操作