1 / 6
文档名称:

朴素贝叶斯方法在健康大数据中的应用.pdf

格式:pdf   大小:547KB   页数:6页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

文档介绍:朴素贝叶斯方法在健康大数据中的应用

朱鸣宸

摘 要:朴素贝叶斯为什么朴素?顾名思义,说明这种方法应用起来简单、方便。

朴素贝叶方法是一种概率计算的数学模型,通过假设实现

人工智能目标的中重要理论基础。而在机器学习的众多算法中,朴素贝叶斯方法

在分类方面表现卓越,因其算法的简单与良好的效果在多个领域有着广泛的应用。

2.2 原理

朴素贝叶斯方法是以贝叶斯原理为基础,在其基础上进行了相应的简化,并

假定了给定的目标属性相互独立。将数据的一系列特征 X 作为输入,输出其最

大后延概率 Y。训练集中的数据是一组(X,Y)的数据,即给定标签的数据。通过

训练样本数据确定 Y 的先验概率 P(Y),再通过训练样本数据确定 P(X|Y),P(X),

则我们可以通过贝叶斯公式求出当给定一个新的 X,P(Y|X)=P(X|Y)×P(Y)/P(X) 。
[4]
3.朴素贝叶斯方法在健康大数据中的应用目前,朴素贝叶斯方法在健康大数据中应用并不广泛,主要原因可能是在大

部分情况下,人们并不需要在健康大数据中应用朴素贝叶斯方法;或是人们对朴

素贝叶斯方法的陌生及不熟悉。但是对于不少老年人和慢性病患者来说,需要经

常测量血压、心率等数据,这种方法可能会给他们的生活带来便利。

数据案例如下(见表 1),以下面的数据举个例子:通过下表中的数据,假

设一个人患有高血压、糖尿病、关节炎,但不患有心脏病,那么这个人是男的可

能性大还是女的可能性大呢?


表 1 患高血压、心脏病、 糖尿病、关节炎患者的性别分布





我们可以用朴素贝叶斯方法来解决这个问题:

如果将男女作为类型,男 C1,女 C2;

属性条件:高血压 A1,心脏病 A2,糖尿病 A3,关节炎 A4;

我们使用下列条件概率表示 A1、A2、A3、A4 属性下 Cx 的概率:

P(Cx|A1A2A3A4)。

根据贝叶斯公式,我们可以知道:

P(Cx|A1A2A3A4)=P(A1A2A3A4|Cx)P(Cx)/P(A1A2A3A4)因为有两个类别,所以只要求得 P(C1|A1A2A3A4)和 P(C2|A1A2A3A4)的

概率,然后比较哪个概率大即可。

则假设 A1A2A3A4 之间是相互之间没有联系的,那么:

P(A1A2A3A4|Cx)=P(A1|Cx)P(A2|Cx)P(A3|Cx)P(A4|Cx);

P(A1|C1)=1/3,P(A2|C1)=2/3,P(A3|C1)=2/3,P(A4|C1)

分享好友

预览全文

朴素贝叶斯方法在健康大数据中的应用.pdf

上传人:guoxiachuanyue005 2022/5/20 文件大小:547 KB

下载得到文件列表

朴素贝叶斯方法在健康大数据中的应用.pdf

相关文档