1 / 17
文档名称:

糖尿病发病率问题模型论文.doc

格式:doc   页数:17页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

糖尿病发病率问题模型论文.doc

上传人:1006108867 2014/2/17 文件大小:0 KB

下载得到文件列表

糖尿病发病率问题模型论文.doc

文档介绍

文档介绍:数学建模竞赛
承诺书
我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。
我们参赛选择的题号是(从A/B中选择一项填写): B
我们的队号为: 294
参赛队员:1. ……
2. ……
3. ……
指导教师或指导教师组负责人: 数模组
日期: 2012 年 5 月 4日
评阅编号(由评阅老师评阅前进行编号):
糖尿病发病率问题模型
摘要
糖尿病发展前景令人堪忧,因为我国不仅是目前糖尿病人数最多的国家,而且也是糖尿病治疗效果最差的国家,约有75%的糖尿病患者血糖不达标。现了解某设计研究院与某网络公司员工患糖尿病情况,了解两家公司的发病率情况,经过对两家公司患病率的比较。通过研究不同年龄、不同职业人群中糖尿病患病情况,分析各种工作、生活行为方式对糖尿病患病率的影响,可以对糖尿病防治提供参考,并对糖尿病患者和高危人群采取相应干预措施。
方法模型将利用统计学方法采用糖尿病诊断标准,通过对两家公司人员的体检表统计分析得到受调查人群中糖尿病确诊人数,在统计过程中还按照性别、年龄对确诊人数进行了分组。在糖尿病成因关联度分析中我们利用数据挖掘技术,按照年龄段将被调查人员分段,并进行糖尿病与某个指标的关联计数,计算每个指标的支持度和置信度,采用基于频集理论的Apriori 的层次算法来对糖尿病危险因素做出关联度分析,通过该算法可分别求得糖尿病与各个指标之间的关系,并根据人群的发病情况及危险因素大小对患病者及高危人群给出干预措施
结果 在被调查的人群中按糖尿病诊断标准的确认人数为:设计研究院27人,%。男性发病率高于女性发病率;网络公司受24人,%。其中男性发病率低于女性发病率。并且随着年龄的增加,发病率呈现上升趋势。根据关联度分析,年龄、生活压力、生活方式是糖尿病的危险因子,据此我们可以从相关方面给出干预措施。同时,我们可以完成一篇可供报社发表的小短文,向普通大众介绍我们的研究成果。
关键词:
糖尿病发病率成因频集理论干预措施
二、模型的基本假设
假设1:题目中测到的数据没有记录的错误。
假设2:由于妊娠糖尿病是妇女在怀孕期间患上的糖尿病,在妊娠之后糖尿病自动消失,故这并不算严格意义上的患者。所以假设我们建立的模型中调查的人群中无孕妇。
假设3、由于1型糖尿病也有家族发病的特点,这与基因遗传有关,根据题目所给简单的数据无法推测人员间的亲代关系。所以假设调查的人群中都无糖尿病家族史。
三、符号说明
:
糖尿病患者数据集
:
调查的两个单位的工作人员年龄分段产生的集合
:
糖尿病的类别集
:
糖尿病的类别总数
:
中的元素
:
中的子集
:
影响因子数据集
:
影响因子
:
影响因子的类别集
:
影响因子个数
:
糖尿病患者数据集与影响因子数据集得到关联分析数据集
:
糖尿病患者的类别与影响因子的类别进行组合可以得到所关心的项集
:
在事务集中出现的次数称为的支持度计数
:
项的支持度
:
事务集中的总事务项数
:
数据集中,项出现的次数占相同糖尿病类别事务总数的比例称为的置信度
:
数据集中相同因子的事务项总数
:
支持度阈值
:
置信度阈值
:
数据集中找出支持度不小于支持度阈值并且置信度不小于置信度阈值的所有规则
四、模型的建立与求解


(*以下表格中数据是每个年龄所测空腹血糖(mmol/L)的平均值,保留四位小数)
设计研究院体检统计数据
网络公司体检统计数据
年龄(岁)


年龄(岁)


25


25


26


26


27


27


28


28


29


29


30


30


31