1 / 10
文档名称:

关于seo的分词技术心得.doc

格式:doc   大小:1,832KB   页数:10页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

关于seo的分词技术心得.doc

上传人:文艺人生 2022/8/7 文件大小:1.79 MB

下载得到文件列表

关于seo的分词技术心得.doc

相关文档

文档介绍

文档介绍:关于seo的分词技术心得
亿推英文网站外链,亿推外贸外链推广,亿推海外外链推广,英文外链最齐全,亿推英文博客外链,英文博客推广,亿推英文博客链接推广,英文博客外链,亿推标准化英文推广,TuiGuang123
亿推已建立起完善的外
大家搜下基金净值天天与天天基金净值这个关键词,你看看搜索结果。
27-1-2315:12:4网里偷闲
再搜下天天基金和基金天天这个关键词,我们是否发现很多搜索结果都是相同的呢?
27-1-2315:13:49网里偷闲
是什么原因使到这个搜索结果都这么相同呢?
27-1-2315:14:1bb$权哥仔
什么原因呀?
27-1-2315:14:16网里偷闲
除了这点大家再重新搜索一下这些词,看看找到网页相关数是否一至呢?
27-1-2315:15:网里偷闲
搜下天天基金和基金天天这个关键词,看看找到的相关网页数有什么不同。
27-1-2315:15:15bb$权哥仔
一样.
27-1-2315:15:28bb$权哥仔
但两个词有一些排名不一样.
27-1-2315:15:43网里偷闲
为什么一样呢?很大程度上是一样的。
27-1-2315:16:7网里偷闲
说明百度的分词机制起到了作用。
27-1-2315:17:31网里偷闲
因为天天基金百度认为是两个词,我们如果去识别是否是两个词最简单的办法就是搜完天天基金这个词后看搜索结果再在天天基金两个词中间加入一个空格,如果相关结果页都是相同的,那说明这就是百度的分词了。
27-1-2315:18:15网里偷闲
比方来说广州自行俱乐部是一个词呢还是多少个呢?
27-1-2315:18:38广州-BaoWay
自行俱乐部还是自行车俱乐部
27-1-2315:18:51权哥仔
三个词.
27-1-2315:19:7广州-BaoWay
从词面上看是三个
27-1-2315:19:11网里偷闲
很可惜,百度的分词告诉我们自行车俱乐部是一个词。
27-1-2315:19:25广州-BaoWay
也可以当是二个
27-1-2315:19:5广州-BaoWay
百度的分词看成了二个
27-1-2315:2:8网里偷闲
分词的作用是为了提升搜索用户能更好的找到自己想要的东西,而进用分词机制进行缩减,或扩大范围。
27-1-2315:2:15网里偷闲
不会的。
27-1-2315:2:4网里偷闲
你试下搜下“自行车俱乐部”中间有空格的,你试下。
27-1-2315:21:5网里偷闲
你看下搜索结果,记住后再去掉空格来搜下。
27-1-2315:22:4网里偷闲
我们通过空格的方式搜索发现相关搜索页出入很大对不?
27-1-2315:22:5广州-BaoWay
那么说广州自行车俱乐部做的是“自行车俱乐部”
27-1-2315:22:57广州-BaoWay
对不
27-1-2315:23:27→ewen_box℃
可以解析一下数学当中的交集,差集,并集吗?
我知道加空格就是加或者的意思
27-1-2315:23:27网里偷闲
是的,可以做自行车俱乐部,也可以做自行车,做俱乐部相对点难些。
27-1-2316::26网里偷闲
通过关键词加空格,我们可以很清楚地识别百度的分词是