文档介绍:SEO培训需求
1、百度排名算法是怎样的,什么样的网页能获得高排名
2、如何发掘软文相关长尾关键词
3、如何优化软文关键词,使其排名靠前
4、发布外链的注意事项有哪些(哪种外链形式最有效,何种外链才是高质量外链,如何留外链才能吸引更多点击,每天发布多少个外链才属于外链建设过度会遭百度惩罚)
5、哪些不当的SEO行为会遭到百度惩罚
6、SEO常用工具有哪些,如何使用
目录:
一、为什么要做SEO
什么是SEO
SEO是指在了解搜索引擎自然排名机制的基础上,对网站进行内部及外部的调整优化,改进网站在搜索引擎中的关键词自然排名,获得更多流量,从而达成网站销售及品牌建设的目标。
为什么要做SEO
搜索流量质量高/性价比高/可扩展性/长期有效/提高网站易用性,改善用户体验
二、了解搜索引擎
搜索引擎与目录
搜索引擎工作原理
链接原理/算法
用户习惯
高级搜索指令
搜索引擎与目录
搜索引擎收录的页面数远远高于目录能收录
页面数。但搜索引擎收录的页面质量参差不齐,
对网站内容和关键词提取的准确性通常也没有目录高。
网站目录对 SEO 的最大意义是建设外部链接,像雅虎、开放目录、好 123 等都有
很高的权重,可以给被收录的网站带来一个高质量的外部链接。
搜索引擎的工作原理
爬行和抓取:spider通过跟踪链接访问网页,获得html代码存入数据库。
预处理:索引程序对抓取来的页面数据进行文字提取、分词、索引等处理,以备排名程序调用。
排名:用户输入关键词后,排名程序调用索引数据库,计算匹配度和相关性,生成搜索结果页面。
<爬行和抓取>
<预处理>
<排名>
爬行和抓取
【蜘蛛】搜索引擎用来爬行和访问页面的程序被称为蜘蛛(spider),也成为机器人(bot)。
搜索引擎【蜘蛛】访问网站页面时类似于普通用户使用的浏览器,蜘蛛程序发出页面访问请求后,服务器返回HTML代码,蜘蛛程序把收到的代码存入原始页面数据库。为了提高爬行和抓取速度,搜索引擎都是使用多个蜘蛛并发分布爬行。,,蜘蛛将遵守协议,不抓取被禁止的网址。
蜘蛛爬行的遍历策略:
深度优先
广度优先
深度广度结合
吸引蜘蛛
理论上只要时间充裕,蜘蛛可以爬行和抓取所有页面,但实际上不能,也不会这么做。
搜索引擎友好
与首页点击距离
导入链接
页面更新频率
网站页面权重
吸 引蜘 蛛
地址库/文件存储
为了避免重复爬行和抓取网址,搜索引擎会建立一个地址库。记录已经被发现还没有被抓取的页面以及已经被抓取过的页面。
地址库中的URL来源:
,从html中解析出新的URL,与地址库中的进行对比,如没有,则收录。
文件存储:
搜索引擎蜘蛛抓取的数据存入原始页面数据库。每一个URL都有一个独特的文件编号。