1 / 88
文档名称:

科技云中非结构化数据向结构化数据的转换方法.pdf

格式:pdf   大小:2,624KB   页数:88页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

科技云中非结构化数据向结构化数据的转换方法.pdf

上传人:陈潇睡不醒 2021/8/14 文件大小:2.56 MB

下载得到文件列表

科技云中非结构化数据向结构化数据的转换方法.pdf

文档介绍

文档介绍:箱条 从
圍 切气 4
碩 士 学 位 论文
_
圍 ?
圓
科技云 中 非结构 化数据 向 结构化数据 的转换
方法
晓荣
1 作者姓名马 
isa il学校导师姓名 、 职称 鱼滨 教授
企业导师姓名 、 职称 张 晓红 研宄员
一
1
A method for converting unstructed data into
structed data in scientific and technological
cloud

A thesis submitted to
XIDIAN UNIVERSITY
in partial fulfillment of the requirements
for the degree of Master
in Computer Technology


By

Ma Xiaorong
Supervisor: Yu Bin Title: Professor
Supervisor: Zhang Xiaohong Title: Research Fellow

June 2017
April 2017
摘要
摘要
在大数据时代,数据逐渐成为驱动经济增长和社会进步的重要生产力和战略资源,
加快推进这些数据资源的开放共享则是政府转型的内在需求及强大动力。为了更好地
实现科技数据的共享联动和服务管理的高效便捷,陕西省政府充分利用工作中积累的
丰富科技资源,提出了“科技服务管理一体化云平台”的建设目标。但在科技云的建
设过程中所采集的原始数据绝大部分是非结构化的文本数据,许多资源无法直接使用,
而仅仅依靠人工方式从海量数据中提取有效信息,将其转换为结构化数据需要消耗大
量时间和人工成本,无法满足业务需求。基于对非结构化数据转换的迫切需要,本文
提出非结构化数据向结构化数据转换的相关方法。
本文首先分析了科技云中对非结构化数据处理的相关需求和特点,并对非结构化
数据转换的主要方法进行对比,根据实际情况采用基于机器学习的实体关系抽取方法
实现了非结构化数据的结构化,并 将非结构化数据向结构化数据转换的过程分解为三
个关键问题,即分词和词性标注,命名实体识别和实体关系抽取。本文重点对其中的
两个核心任务命名实体识别和实体关系抽取进行了算法研究和实现。
对分类并解析后的非结构化文本,本文 首先利用中科院的 NLPIR(Natural
Language Processing and Information Retrieval)自动分词工具包进行分词和

最近更新

2024年河南地矿职业学院单招职业技能考试必刷.. 56页

2024年济源职业技术学院单招职业倾向性测试必.. 55页

融合党建元素的二零二五物流供应链优化方案汇.. 22页

高中生安全的演讲稿范例5篇 9页

高一下学期开学讲话稿4篇范文 7页

跨平台适配的2025远程述职报告模板响应式设计.. 22页

销售员年终述职工作总结5篇 14页

采购员个人工作年终工作总结(精选10篇) 17页

迎五一五四国旗下讲话5篇 7页

财务经理年度工作总结集锦7篇 16页

财务人员工作总结部队5篇 11页

讲诚信学生讲话稿精选5篇 6页

节约用水的演讲稿简短4篇 5页

繁星春水读书心得体会范文5篇 4页

精选教师年度工作总结模板10篇 25页

精选大班工作计划模板合集10篇 36页

第一次军训心得300字2篇 2页

礼赞新时代奋进新征程感悟启示9篇精选 13页

生产主管试用期转正工作总结(精选4篇) 6页

消防安全精彩演讲稿5篇 7页

档案员年终工作总结范文2篇 5页

有关音乐教师工作总结范文合集8篇 14页

有关教师节的演讲稿怎么写最新5篇 8页

有关小学教师年终工作总结模板汇编9篇 16页

最新的学生军训心得250字3篇 4页

最新初中生军训心得感想8篇 10页

新郎在婚礼上个人讲话稿3篇 3页

文明过春节优秀演讲稿3分钟5篇 5页

在临床思维指导下充分运用听诊技能 30页

教师个人辞职申请书汇编7篇 8页