1 / 88
文档名称:

科技云中非结构化数据向结构化数据的转换方法.pdf

格式:pdf   大小:2,624KB   页数:88页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

科技云中非结构化数据向结构化数据的转换方法.pdf

上传人:陈潇睡不醒 2021/8/14 文件大小:2.56 MB

下载得到文件列表

科技云中非结构化数据向结构化数据的转换方法.pdf

文档介绍

文档介绍:箱条 从
圍 切气 4
碩 士 学 位 论文
_
圍 ?
圓
科技云 中 非结构 化数据 向 结构化数据 的转换
方法
晓荣
1 作者姓名马 
isa il学校导师姓名 、 职称 鱼滨 教授
企业导师姓名 、 职称 张 晓红 研宄员
一
1
A method for converting unstructed data into
structed data in scientific and technological
cloud

A thesis submitted to
XIDIAN UNIVERSITY
in partial fulfillment of the requirements
for the degree of Master
in Computer Technology


By

Ma Xiaorong
Supervisor: Yu Bin Title: Professor
Supervisor: Zhang Xiaohong Title: Research Fellow

June 2017
April 2017
摘要
摘要
在大数据时代,数据逐渐成为驱动经济增长和社会进步的重要生产力和战略资源,
加快推进这些数据资源的开放共享则是政府转型的内在需求及强大动力。为了更好地
实现科技数据的共享联动和服务管理的高效便捷,陕西省政府充分利用工作中积累的
丰富科技资源,提出了“科技服务管理一体化云平台”的建设目标。但在科技云的建
设过程中所采集的原始数据绝大部分是非结构化的文本数据,许多资源无法直接使用,
而仅仅依靠人工方式从海量数据中提取有效信息,将其转换为结构化数据需要消耗大
量时间和人工成本,无法满足业务需求。基于对非结构化数据转换的迫切需要,本文
提出非结构化数据向结构化数据转换的相关方法。
本文首先分析了科技云中对非结构化数据处理的相关需求和特点,并对非结构化
数据转换的主要方法进行对比,根据实际情况采用基于机器学习的实体关系抽取方法
实现了非结构化数据的结构化,并 将非结构化数据向结构化数据转换的过程分解为三
个关键问题,即分词和词性标注,命名实体识别和实体关系抽取。本文重点对其中的
两个核心任务命名实体识别和实体关系抽取进行了算法研究和实现。
对分类并解析后的非结构化文本,本文 首先利用中科院的 NLPIR(Natural
Language Processing and Information Retrieval)自动分词工具包进行分词和

最近更新

几种天然橡胶基本性能和应用技术 2页

2025年动物繁殖与成长奥秘解析 29页

冷冲模新型堆焊焊条的研制及应用 2页

冲击性负荷对电能计量设备的影响分析 2页

2025年东莞人民医院陈博士谈脑卒中精神行为干.. 25页

农机化电子计算机应用研究会成立 2页

内腔耦合电光调制的频率特性研究 2页

2025年骨骼肌细胞功能与调控机制解析 18页

兴古潜山低效井治理研究与应用 2页

关于非线性方程组解的一点讨论 2页

关于钢筋焊接质量检验要求的几个问题探讨 2页

2025年过敏性紫癜全方位护理指南 24页

关于解决炭质滑板弯曲问题的探讨 2页

2025年西施丽露非药品使用培训教程 4页

关于管理业务的伸缩性及其对策 2页

关于矿石的损失与贫化计算问题的讨论 2页

关于求解叶轮机械中三维跨音流场途径的探讨 2页

《运动性猝死》 50页

关于提高西瓜经济效益的技术措施研究 2页

2025年游艇市场项目发展计划 61页

2025年破碎筛分设备合作协议书 47页

2025年监护病房项目发展计划 52页

2025年电子浆料金浆、银浆、银铂浆合作协议书.. 72页

2025年糖尿病危象急救指南 67页

关于多角高程导线发展次数问题的讨论 2页

2025年癌症相关性疲劳症状解析 35页

关于化学教学中几个易混淆问题的探讨 2页

人教版小语九册习作 32页

JJF(鄂)92-2023 电动汽车公用充电设施计量监.. 21页

(完整版)考研复试个人简历模板 2页