1 / 8
文档名称:

基于BERT的水稻表型知识图谱实体关系抽取研究.pdf

格式:pdf   大小:1,020KB   页数:8页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于BERT的水稻表型知识图谱实体关系抽取研究.pdf

上传人:好用的文档 2021/10/30 文件大小:1020 KB

下载得到文件列表

基于BERT的水稻表型知识图谱实体关系抽取研究.pdf

文档介绍

文档介绍:万方数据
⋯:戮基于的水稻表型知识图谱实体关系抽取研究农业机械学报袁培森李润隆种徐焕良王引言琣植物表型组学数据分析是近年来植物学、信息科学领域研究的交叉热点,其本质是对植物基因数据的三维时序表达,以及地域分布特征和代际演进规律⋯。表型组学指利用生物的遗传基因组信息对生物的外部及内部表型数据进行研究的一门综合性学科㈦。植物表型组学不仅研究植物的外在形第卷第.南京农业大学人工智能学院,南京;帐〉缌τ邢薰拘畔⑼ㄐ欧止荆暇摘要:针对水稻表型知识图谱中的实体关系抽取问题,根据植物本体论提出了一种对水稻的基因、环境、表型等表型组学实体进行关系分类的方法。首先,获取水稻表型组学数据,并进行标注和分类;随后,提取关系数据集中的诃向量、位置向量及句子向量,基于双向转换编码表示模型构建水稻表型组学关系抽取模型;最后,将模型与卷积神经网络模型、分段卷积网络模型进行结果比较。结果表明,在止叵党槿∧P椭校珺P表现更佳,精度达.%、值为.%。关键词:水稻表型;知识图谱;关系抽取;双向转换编码表示模型.月痡..·...中图分类号:文献标识码:文章编号:..,,甀.,琋,:.琧琫.瑃,,甌..瑃..%.,簉籯籸;——修回期:一一国家自然科学基金项目和大学生创新创业训练专项计划项目袁培森,男,讲师,博士,主要从事智能信息处理和表型数据分析研究,:.甤徐焕良,男,教授,博士生导师,主要从事农业信息化与大数据技术研究,:.甤珻,琣,.收稿日期基金项目作者简介通信作者
万方数据
颈硇妥檠Ч叵凳菁状,还研究其内部结构、物理和生化性质以及遗传信息。亟需研究建立植物表型组学数据完整知识库的智能计算方法¨中国是世界上水稻产量最大、消费最多的国家,水稻的培育及研究是中国粮食安全战略的重要内容!K颈硇妥檠а芯渴侵参锷镅У难究热点,水稻表型数据的高通量、高维、海量的数据特征对数据的快速检索和知识的有效提取提出了更高的技术要求∞。。知识图谱将知识转化为图,利用计算机进行推理分析,实现从感知智能到认知智能的飞跃,是人工智能领域的一项重要技术¨VJ锻计资且桓鼍有结构化特征的语义知识库,采用符号的形式描述数据中的实体及之间的关系旧枚杂镆宓某槿和分析,并结合数据科学、人工智能等学科的前沿技术和方法,在学科知识库构建领域获得了广泛关注。对知识图谱系统的构建包括龊诵牟街瑁菏体抽取、实体间关系的构建,其中实体关系的构建需要关系的抽取技术。关系抽取任务的研究目标是自动对两个实体和之间联系所构成的W榻泄叵识别‘。关系抽取能够提取文本数据中的特征,并提升到更高的层面‘实体关系的抽取方法可以分为啵夯谀0濉基于传统机器学****和基于深度学****的方法⋯;于模板的关系抽取方法是早期基于语料学知识及语料的特点,由相应领域的专家和研究人员手工编写模板,这种方法需要耗费大量专业人力,可移植性较差。基于传统机器学****的关系抽取方法主要包括使用核函数⋯⒙呒毓椤以及条件随机场‘龋一种依赖特征工程的方法。等¨纠使用聚类方法计算上下文的相似性。赵明等。胁捎帽体学****使用有监督的、基于依存句法分析的词汇一语法模式对百度百科植物语料库进行关系抽取,在非分类的关系抽取任务中表现较好,为构建植物领域知识图谱奠定了基础。基于深度学****的关系抽取方法包括递归神经网络模型Ⅲ⒕砘窬缒P汀А⑺蜃;槐嗦氡示模型,等。深度学****能够实现语义特征的自动提取,从而使模型能