1 / 13
文档名称:

大学生创新创业项目论文.docx

格式:docx   大小:107KB   页数:13页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

大学生创新创业项目论文.docx

上传人:sssmppp 2020/7/30 文件大小:107 KB

下载得到文件列表

大学生创新创业项目论文.docx

文档介绍

文档介绍:大学生创新创业项目论文基于复杂网络的疾病合并关系分析应用研究作者姓名:郭梦霏、马晓莹、张凯雅指导老师:周雪忠院系:计算机与信息技术学院二零一七年十月引言研究背景与研究意义:该项目以500余家医院近2000万的病历首页数据为基础,采用复杂网络分析方法,进行疾病合并关系的研究,发现疾病合并的关系和时序发生关系模式。在此基础上,进行疾病之间的风险因素研究和因果关系的分析,为疾病的预测、发生和发展规律提供可靠的分析结果。利用大规模病历首页数据,基于复杂网络进行疾病合并关系的研究在国内尚属首次。利用疾病合并关系,进行疾病的时序发生预测和因果关系的预测均具有新颖性。本课题是国家自然基金项目的部分研究内容,可以提供大规模(近2000万)病历首页数据;借助复杂网络分析方法和硕士研究生的辅助指导;同时可以借助中国中医科学院中医药数据中心高性能计算环境和软件平台的支持。在中医临床诊疗过程中,我们通过对临床处方数据的初期分析,并与临床专家的交流中发现,名老中医的临床复方的配伍规律主要体现在两个层次:第一层次为临床医生一般以经典复方(包括经方、时方和验方等)为基础进行临床处方;第二层次为在药证或药症关系基础上的药物随症状的加减处理。这两个层次的临床处方配伍过程形成了既有核心处方结构,又具有较大灵活性的处方集合。因此,通过对名老中医处方集的共性网络结构分析,能够发现体现其处方思维和临床特点的核心处方配伍结构,从而辅助进行名老中医经验的传承和整理研究。⑴复杂网络是当前科学界研究的热点问题,诸如蛋白质网络、万维网、生态网、交通网和文献引用网等都具有非常有趣的统计特性。其中,除了小世界网络特性之外,无尺度网络(work)是一种具有节点度壽律分布现象的复杂网络,科学家对其动力学原理和应用问题的研讨已经成为相关科学研究的亮点。复杂合作网络如文献作者网等也具有无尺度网络的规律。何氏等把中药复方视为广义的合作网络是合适的。无尺度网络现象反映了复杂网络在一定驱动力的影响下动态的自组织过程宏观规律。口]摘要目的:复杂网络是当前科学界研究的热点问题,其中,无尺度网络(work)是一种具有节点度壽律分布现象的复杂网络,科学家对其动力学原理和应用问题的研讨已经成为相关科学研究的亮点。为了实现疾病的预测结果:项目阶段成果:以java为基础构建fptree读取记录,最终形成大量共现数据以构成网络。得到的拓扑网络中对网络特征进行的分析附件可见。将整个网络通过聚类算法划分为不同模块,每个模块具有不同的性质;选取每个模块中的大节点查找其医学含义,一定程度上验证了社团划分依据;以度为划分依据分析网络的特征;判定网络属于壽律分布。进行网络特征值的计算,以betweenness值为主进行网络中心性的分析;与基因的网络特征值进行合并连接,由两个平行网络进行分析。结论:1)利用现有数据研制疾病合并的一致性分子机制;2)研究病证关系,以及以证候为依据的疾病相似性的分子依据,同时揭示证候诊断的个体性问题。关键词:壽律分布现象复杂网络分析疾病预测中医疾病基于复杂网络的疾病合并关系分析应用研究研究方法的概述:以大量数据为基础,使用fpgrowth算法进行计算,得出计算结果(从原始数据中进行分类,选取可以进行加入记录的数据,算法计算,结果处理,分类为二元、多元)进行复杂网络分析以及相关性分析(使用gephi和R语言)(制作网络图,计算数据,分析复杂网络)对复杂网络具体指标进行分析对fp结果中高频疾病进行相关性分析(卡方检验)研究方法的实现:1、 利用数据,构建疾病合并网络,并进行网络拓扑特征分析。2、 整理ICD10到ICD9-CM的映射关系,以便能够整合利用以ICD9-CM为编码的疾病基因关系。3、 通过PPI等数据,关联疾病与分子的联系,进行疾病合并与分子的关联分析研究。4、 采用性别、年龄和科室等进行分层和分组,研究各组群的疾病合并关系规律。5、 采用以证候为特征进行疾病的相似性计算,构建疾病相似性网络。证候相似性可以通过证候与症状的关系(来自证候标准)进行构建,并采用一定的填充方式如平均值,中位数等进行以证候为特征的疾病向最的填充。6、 以上证候的疾病相似性计算,可以以记录比较多的几个医院进行分组分析,看其机构对证候诊断的影响。具体过程:对原始数据进行处理,调查项目背景,了解项目内容,逐步开始上手;开始研究已有的国外研究的论文,学习疾病合并的相关知识以及复杂网络的基本概念対原始数据进行了解,学习编码和疾病之间的对应关系;以归\<3为工具处理不正确、无法使用的数据(垃圾数据),分割文件进行分批处理,提高可用性,以达到可以进行基本计算的水平。以大最数据为基础,首先将数据进行分类,选取可以加入记录的、格式基本符合编码规律的数据作为基础,再筛选岀疾病整合成为500W+条原始记录渎入程序中,构建fptree