文档介绍:该【(中职)Python编程基础与应用电子课件文本处理库的应用 】是由【春哥知识店铺】上传分享,文档一共【30】页,该文档可以免费在线阅读,需要了解更多关于【(中职)Python编程基础与应用电子课件文本处理库的应用 】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此文档到您的设备,方便您编辑和打印。正版课件内容可修改
(中职)Python编程基础与应用电子课件文本处理库的应用
文本处理库的应用
主讲:
:
《Python编程基础与应用》配套课件
contents
目
录
jieba的安装和简介
wordcloud的安装和简介
案例:可视化中文词云项目
列表的定义和索引访问
01
jieba的简介
“结巴”中文分词支持繁体分词,支持自定义词典,还支持四种分词模式:
1)精确模式,试图将句子最精确地切开,适合文本分析。
2)全模式,把句子中所有的可以成词的词语都扫描出来,速度非常快,但是不能解决歧义。
3)搜索引擎模式,在精确模式的基础上,对长词再次切分,提高召回率,适合用于搜索引擎分词。
4)paddle模式,利用PaddlePaddle深度学****框架,训练序列标注(双向GRU)网络模型实现分词。
jieba的安装
它的安装方法很简单,可以直接使用PIP进行安装:
jieba库的常用函数
范例11-1jieba库的三种分词模式
应用jieba库的三种分词模式,对字符串“jieba是优秀的中文分词第三方库”进行分词。
范例11-1jieba库的三种分词模式
它的结果如下
wordcloud的安装和简介
02