1 / 10
文档名称:

朴素贝叶斯python代码实现.docx

格式:docx   大小:37KB   页数:10页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

文档介绍:**



朴素贝叶斯
优点:在数据较少的情况下仍然有效,可以处理多类别问题
缺点:对于输入数据的准备方式较为敏感
适用数据类型:标称型数据
贝叶斯准则:
心网)=
力('州勺)0(勺)
。(勺)
p(q|x:)表示1love',1help1,^garbage','quit',111,1problems','is1,1park','stop
'flea1,'dalmation1,1licks','foodT,'not',1hin','buying','posting','has、'worthless',rate','to1,'maybe1rplease1'dog','how','stupid','so1,Ttake\・",'steak1,'ny'http://blog.csdn.net/Jay_Xio
bayes.setOfWords2Vec(myVocdbLtst,l_ist0Posts[0])
[o,G,fo,o,-i,o,%o,-i,e,o,o,o,o,o,ef-i,o,o,o,o,-i,-i,%8,%0,S%-1]
aabayes*setOfWords2Vec(myVocabLtstaListOPosts[3])
[o,e,o,i,e,e,o,色,e,-i,o,e,o,o,g,o,d,-i,i,日,o,o,o,e,0,-1,0,E>,E>,B,0]
训练算法:从词向量计算概率
[python]
viewplaincopy

#朴素贝叶斯分类器训练函数
#trainMatrix:文档矩阵,trainCategory:由每篇文档类别标签所构成的向量
deftrainNB0(trainMatrix,trainCategory):
numTrainDocs=len(trainMatrix)
numWords=len(trainMatrix[0])
pAbusive=sum(trainCategory)/float(numTrainDocs)
p0Num=zeros(numWords);
p1Num=zeros(numWords);
p0Denom=0.0;
p1Denom=0.0;
foriinrange(numTrainDocs):
iftrainCategory[i]==1:
p1Num+=trainMatrix[i]
p1Denom+=sum(trainMatrix[i])
else:
p0Num+=trainMatrix[i]
p0Denom+=sum(trainMatrix[i])
p1Vect=p1Num/p1Denom
p0Vect=p0Num/p1Denom
returnp0Vect,p1Vect,pAbusive
运行结果:
**

fronnumpyimport*
reload(bayes)
'bayes'fronTbayes+pyb>
>>>listGPosts>ListClasses=bayes.loadDataSet()
»>nyvocabList=bayes^createvocabLtst(ItstOPosts)trai.nMat=[]
>»forpostinQocinlistOPosts:
...trainMat,.ap

分享好友

预览全文

朴素贝叶斯python代码实现.docx

上传人:zhangshut 2022/5/19 文件大小:37 KB

下载得到文件列表

朴素贝叶斯python代码实现.docx

相关文档