1 / 30
文档名称:

(中职)Python编程基础与应用电子课件文本处理库的应用.pptx

格式:pptx   大小:4,335KB   页数:30页
下载后只包含 1 个 PPTX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

(中职)Python编程基础与应用电子课件文本处理库的应用.pptx

上传人:春哥知识店铺 2022/9/30 文件大小:4.23 MB

下载得到文件列表

(中职)Python编程基础与应用电子课件文本处理库的应用.pptx

文档介绍

文档介绍:该【(中职)Python编程基础与应用电子课件文本处理库的应用 】是由【春哥知识店铺】上传分享,文档一共【30】页,该文档可以免费在线阅读,需要了解更多关于【(中职)Python编程基础与应用电子课件文本处理库的应用 】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此文档到您的设备,方便您编辑和打印。正版课件内容可修改
(中职)Python编程基础与应用电子课件文本处理库的应用
文本处理库的应用
主讲:
:
《Python编程基础与应用》配套课件
contents


jieba的安装和简介
wordcloud的安装和简介
案例:可视化中文词云项目
列表的定义和索引访问
01
jieba的简介
“结巴”中文分词支持繁体分词,支持自定义词典,还支持四种分词模式:
1)精确模式,试图将句子最精确地切开,适合文本分析。
2)全模式,把句子中所有的可以成词的词语都扫描出来,速度非常快,但是不能解决歧义。
3)搜索引擎模式,在精确模式的基础上,对长词再次切分,提高召回率,适合用于搜索引擎分词。
4)paddle模式,利用PaddlePaddle深度学****框架,训练序列标注(双向GRU)网络模型实现分词。
jieba的安装
它的安装方法很简单,可以直接使用PIP进行安装:
jieba库的常用函数
范例11-1jieba库的三种分词模式
应用jieba库的三种分词模式,对字符串“jieba是优秀的中文分词第三方库”进行分词。
范例11-1jieba库的三种分词模式
它的结果如下
wordcloud的安装和简介
02