投递文章投递文章 投稿指南 RSS订阅RSS订阅

GZIP压缩对蜘蛛抓取的影响分析【网站SEO研究】

来源:IT堂 堂友 发布时间:2010-12-12 收藏 投稿 字体:【

  之前写过一篇终结SEO谣言的文章,彻底驳斥了同一ip会被K的论调,这一次,让我们来彻底终结Gzip压缩技术会影响蜘蛛抓取这一观点,还Gzip一个清白。

  首先,Gzip到底是个什么东西?GZIP最早由Jean-loup Gailly和Mark Adler创建,用于UNIX系统的文件压缩。我们在Linux中经常会用到后缀为.gz的文件,它们就是GZIP格式的。现今已经成为Internet 上使用非常普遍的一种数据压缩格式,或者说一种文件格式。HTTP协议上的GZIP编码是一种用来改进WEB应用程序性能的技术。大流量的WEB站点常常使用GZIP压缩技术来让用户感受更快的速度。说得更简单明了一点,Gzip就是用来压缩你的页面,它的终极目的就是加快网站的访问速度,从而提升用户体验。

  综上所述,我们得出了结论,Gzip就是加快网站访问速度,提高用户体验的一种方法,值得注意的一点是,它是一个服务器端的行为,也就是说,它是通过服务器的功能来对网页进行压缩的,而它所需要的客户端支持仅仅是浏览器需要支持Gzip,仅此而已!我们知道,市面上几乎所有主流浏览器全都支持Gzip压缩技术,而作为前端页面调试专家firefox的Yslow插件也把Gzip压缩是否开启作为一个页面是否合格的评分标准。由此看来,Gzip不是一个旁门左道的技术,而是作为一个符合W3C的标准而存在,试问这样的标准,有那个搜索引擎会去抵制呢?

  我们知道,蜘蛛抓取页面的过程,实际上是一个客户端行为,而Gzip压缩是一个服务器端的行为;蜘蛛抓取其实和普通人用浏览器浏览网站没什么区别,唯一的区别就是它读的不是经过浏览器解析过的页面,它是直接读的页面源代码。这样,问题就迎刃而解了,通过试验我们发现,经过Gzip压缩的网页和未经过Gzip压缩的网页,二者的源代码没有任何的区别。既然没有区别,那又怎么可能去影响蜘蛛抓取网页呢?

  “请谨慎开启Gzip”,这句话其实并没有错,因为它说的本来就跟蜘蛛抓取没有一毛钱的关系,这句话的原意是指,开启Gzip会消耗一些服务器的资源,换句话说,如果要使用这种压缩技术,服务器的配置一定要中上等的,小型的服务器比如虚拟主机,如果开启了Gzip会造成服务器过载,而造成系统缓慢。有的人不知道为什么就把这句话跟搜索引擎抓取联系了起来,从而误导了广大新手站长。这里分享一个不用配置服务器就可以开启Gzip 压缩的方法:

  比如你的网站首页地址是www.ittang.com/index.php,那么,你就用记事本打开index.php文件,在页面头部加上一句Ob_Start('ob_gzhandler');就搞定了。这样index.php就经过了Gzip压缩,如果你还想压缩别的php文件,那么一次打开加上代码就行了。

  造谣可耻,传谣可恨,信谣可悲,辟谣可敬!希望广大站长能够擦亮眼睛,不要轻信谣言,也希望关于SEO的谣言能够越来越少,最后希望这是最后一篇SEO谣言终结者系列文章。

顶一下
(2)
100%
踩一下
(0)
0%
本文Tags:
  • 表情:
  •    
  • 评价:
用户名: 密码: 匿名 注册
最新评论 查看所有评论
About iTtang - 联系我们  - 专题列表 - 友情链接  -  高级搜索  -  帮助中心  -  您的意见