说明:收录全文最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210538585.7 (22)申请日 2022.05.17 (71)申请人 浙江华云信息科技有限公司 地址 310008 浙江省杭州市西湖区西园一 路16号2幢 (72)发明人 陈茂锐 陆沈雄 徐志强 俞立  陈燎原 陈思 王健 潘月 童剑  吴波 柴华明 卢菲菲 赵蜜  张云鹏 林坊辉 袁琪 孙晓超  刘双宇 董栋 李堃 卢翔华  (74)专利代理 机构 杭州华鼎知识产权代理事务 所(普通合伙) 33217 专利代理师 项军 (51)Int.Cl. G06F 16/28(2019.01)G06F 16/2455(2019.01) G06F 16/215(2019.01) G06F 16/248(2019.01) (54)发明名称 一种基于数据血缘的可视化检索系统 (57)摘要 本发明公开了一种基于数据血缘的可视化 检索系统, 解决了现有技术的不足, 包括: 数据采 集模块, 用于采集数据, 数据的属性包括数据种 类、 数据数量以及数据的关联关系; 数据存储模 块, 用于对采集的数据进行存储; 数据分析模块, 用于构建数据的血缘关系, 调用数据存储模块中 的数据, 将数据的血缘关系写入 预设的关系数据 表并进行存储; 检索模块, 相关操作人员通过检 索模块检索数据, 检索模块条用数据存储模块后 的数据将检索需要的整合数据发送至展示模块, 整合数据包括数据、 数据的属性以及数据的血缘 关系; 展示模块, 用于对整合数据包进行可视化 展示。 权利要求书1页 说明书4页 附图1页 CN 115048467 A 2022.09.13 CN 115048467 A 1.一种基于数据血缘的可视化检索系统, 其特 征是, 包括: 数据采集模块, 用于采集数据, 数据的属性包括数据种类、 数据 数量以及数据的关联关 系; 数据存储模块, 用于对 采集的数据进行存 储; 数据分析模块, 用于构建数据的血缘关系, 调用数据存储模块中的数据, 将数据的血缘 关系写入预设的关系数据表并进行存 储; 检索模块, 相关操作人员通过检索模块检索数据, 检索模块条用数据存储模块后的数 据将检索需要的整合数据发送至展示模块, 整合数据包括数据、 数据的属 性以及数据的血 缘关系; 展示模块, 用于对整合数据包进行 可视化展示。 2.根据权利要求1所述的一种基于数据 血缘的可视化检索系统, 其特征是, 所述的展示 模块进行可视化展示包括数据 节点和数据流转线路, 不同的数据 节点之间通过数据流转线 路进行连接。 3.根据权利要求2所述的一种基于数据 血缘的可视化检索系统, 其特征是, 所述的数据 节点包括主节点、 流入节点和流出节 点, 数据流转线路包括流入线路和流出线路, 主节点即 为检索数据本身, 流入节点通过流入线路与主节点连接, 流出节点通过流出线路与主节点 连接。 4.根据权利要求3所述的一种基于数据 血缘的可视化检索系统, 其特征是, 所述的数据 流转线路为若干种颜色的数据流转线路, 不同的颜色代表主节点和流入节点或流出节点之 间的不同的关联程度。 5.根据权利要求3所述的一种基于数据 血缘的可视化检索系统, 其特征是, 所述的数据 流转线路为不同粗细程度的数据流转线路, 数据流转线路的粗细程度 代表主节点和流入节 点或流出节点之间的关联程度。 6.根据权利要求1所述的一种基于数据 血缘的可视化检索系统, 其特征是, 还包括有数 据清洗模块, 数据清洗模块设置在数据采集模块和数据存储模块之间, 数据清洗模块对于 数据采集模块的错 误数据进行清洗, 清洗 完成的数据再发送至数据存 储模块。 7.根据权利要求6所述的一种基于数据 血缘的可视化检索系统, 其特征是, 所述的错误 数据包括以下的一种或多种: 重复值、 别名、 缺失值和异常值。 8.根据权利要求6所述的一种基于数据 血缘的可视化检索系统, 其特征是, 所述的数据 清洗模块还对相似度较高的数据进行清洗, 当至少两个数据之 间的相似度大于 设定的阈值 时, 判断两个数据为相同数据, 数据 清洗模块清洗掉其中一个数据, 同时将清洗掉的其中一 个数据的血缘关系添加至保留的另一个数据上。 9.根据权利要求6所述的一种基于数据 血缘的可视化检索系统, 其特征是, 所述的数据 清洗模块还对相似度较高的数据进行清洗, 当至少两个数据之 间的相似度大于 设定的阈值 时, 判断两个数据为相同数据, 将 两个数据进行整合构成新的数据, 新的数据包括两个数据 之间相同的部分和不同的部分, 新的数据的血缘关系包 含整合前的两个数据的血缘关系。权 利 要 求 书 1/1 页 2 CN 115048467 A 2一种基于数据血缘的可视化检索系统 技术领域 [0001]本发明涉及计算机技 术领域, 尤其是指一种基于数据血缘的可视化检索系统。 背景技术 [0002]在人类社会中, 血缘关系是指由婚姻或生育而产生的人际关系。 如父母与子女的 关系, 兄弟姐妹关系, 以及由此而派生的其他亲属关系。 它是人先天的与生俱来的关系, 在 人类社会产生之初就已存在, 是最 早形成的一种社会关系。 [0003]大数据时代, 数据爆发性增长, 海量的、 各种类型的数据在快速产生。 这些庞大复 杂的数据信息, 通过 联姻融合、 转换变换、 流 转流通, 又生成新的数据, 汇聚成数据的海洋。 [0004]数据的产生、 加工融合、 流转流通, 到最终消亡, 数据之间自然会形成一种关系。 我 们借鉴人类社会中类似的一种关系来表达数据之间的这种关系, 称之为数据的血缘关系。 [0005]现有的数据检索系统, 往往只能简单的对数据本身进行检索, 对于数据的血缘关 系缺乏有效的反馈, 导致相关人员难以对数据进行整体宏观的掌握和把控, 进而难以实现 对数据资产的统一管理。 发明内容 [0006]本发明的目的是克服现有技术中的缺点, 提供一种基于数据血缘的可视化检索系 统。 [0007]本发明的目的是通过 下述技术方案予以实现: 一种基于数据血缘的可视化检索系统, 包括: 数据采集模块, 用于采集数据, 数据的属性包括数据种类、 数据数量以及数据的关 联关系; 数据存 储模块, 用于对 采集的数据进行存 储; 数据分析模块, 用于构建数据的血缘关系, 调用数据存储模块中的数据, 将数据的 血缘关系写入预设的关系数据表并进行存 储; 检索模块, 相关操作人员通过检索模块检索数据, 检索模块条用数据存储模块后 的数据将检索需要的整合数据发送至展示模块, 整合数据包括数据、 数据的属 性以及数据 的血缘关系; 展示模块, 用于对整合数据包进行 可视化展示。 [0008]数据血缘即数据的来龙去脉, 主要包含数据的来源、 数据的加工方式、 映射关系以 及数据出口。 数据血缘属于元数据的一部 分, 清晰的数据血缘是数据 平台维持稳定的基础, 更有利于数据变更影响分析以及数据问题排 查。 [0009]可视化, 从技术概念上来看, 是利用计算机图形学和图像处理技术, 将数据转换成 图形或图像在屏幕上显示出来, 并进 行交互处理的理论、 方法和技术。 可视化的意义在于迅 速快捷地传递信号, 形象、 直观 地将数据及其关系展现出来, 方便用户探讨、 探索本质, 发现 问题。 对于数据的血缘关系, 可视化尤为重要。 只有通过可视化, 血缘关系才能很清晰地展 现在用户面前。 [0010]通过本方案 的检索系统, 相关人员只需要输入需要检索的数据, 便可以知道数据说 明 书 1/4 页 3 CN 115048467 A 3

.PDF文档 专利 一种基于数据血缘的可视化检索系统

文档预览
中文文档 7 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共7页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于数据血缘的可视化检索系统 第 1 页 专利 一种基于数据血缘的可视化检索系统 第 2 页 专利 一种基于数据血缘的可视化检索系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 00:10:10上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。