当前位置:首页百度站长平台:巧用robots避免蜘蛛黑洞 举报文章

百度站长平台:巧用robots避免蜘蛛黑洞

作者:admin    来源:用户投稿    时间:2015.6.24   

 

  对于百度搜索引擎来说,蜘蛛黑洞特指网站通过极低的成本制造出大量参数过多,及内容雷同但具体参数不同的动态URL ,就像一个无限循环的“黑洞”将spider困住,Baiduspider浪费了大量资源抓取的却是无效网页。

  比如很多网站都有筛选功能,通过筛选功能产生的网页经常会被搜索引擎大量抓取,而这其中很大一部分检索价值不高,如“500-1000之间价格的租房”,首先网站(包括现实中)上基本没有相关资源,其次站内用户和搜索引擎用户都没有这种检索习惯。这种网页被搜索引擎大量抓取,只能是占用网站宝贵的抓取配额。那么该如何避免这种情况呢?

  我们以北京某团购网站为例,看看该网站是如何利用robots巧妙避免这种蜘蛛黑洞的:

  对于普通的筛选结果页,该网站选择使用静态链接,如:http://bj.XXXXX.com/category/zizhucan/weigongcun

  同样是条件筛选结果页,当用户选择不同排序条件后,会生成带有不同参数的动态链接,而且即使是同一种排序条件(如:都是按销量降序排列),生成的参数也都是不同的。如:http://bj.XXXXX.com/category/zizhucan/weigongcun/hot?mtt=1.index%2Fpoi.0.0.i1afqhek

  http://bj.XXXXX.com/category/zizhucan/weigongcun/hot?mtt=1.index%2Fpoi.0.0.i1afqi5c

  对于该团购网来说,只让搜索引擎抓取筛选结果页就可以了,而各种带参数的结果排序页面则通过robots规则拒绝提供给搜索引擎。

  robots.txt的文件用法中有这样一条规则:Disallow: /*?* ,即禁止搜索引擎访问网站中所有的动态页面。该网站恰是通过这种方式,对Baiduspider优先展示高质量页面、屏蔽了低质量页面,为Baiduspider提供了更友好的网站结构,避免了黑洞的形成。

  相关内容讨论请移步【学院同学汇】《巧用robots避免蜘蛛黑洞》讨论帖

好文打赏,给Ta鼓励
扫一扫用手机阅读本文
Tags:百度  站长  平台  避免  蜘蛛  黑洞  
  • 相关搜索
图片推荐
    如何将HTTP站点转换成HTTPS、及后续问题

    如何将HTTP站点转换成HTTPS、及后续问题

    文/那年那月  https及https的本地测试环境搭建。asp.net结合https的代码实现http网站转换成https网站,以及之后遇到的问题等。  一:什么是https  SSL(Securi
    90后连续创业失败者的独白:被投资人骗,团队解散

    90后连续创业失败者的独白:被投资人骗,团队解散

    在我还是个媒体实习生的时候就认识李佳了,转眼3年过去,她仍然在创业的路上坚持。  不管媒体包装得多么光鲜,但创业并不是一件容易的事,她一路上跌跌撞撞吃了不少亏,她希望和大家分享自己的创业经验。同时,也
    qq兴趣部落一天引流4000微信粉丝实操经验

    qq兴趣部落一天引流4000微信粉丝实操经验

    现在很多站长喜欢写推广类的文章,我想主要原因是这类文章的受众多,比较讨好。这也导致一系列的副作用,很多的文章只是为了博取流量,可操作性很差,甚至是有些作者本人也从来没有实践过。你自己都不去或者不能实践
    LG G4 S或将搭载骁龙615处理器 本月或发布

    LG G4 S或将搭载骁龙615处理器 本月或发布

    【Yesky新闻频道消息】 不久前,有消息称,LG正计划为大家带来一款LG G4的衍生版LG G4 S。即将发布的LG G4 S又有了新消息。据悉该机将搭载高通骁龙615处理器,GPU采用Adreno
    阿里把开了一年的“美版天猫”卖了

    阿里把开了一年的“美版天猫”卖了

    [摘要]阿里巴巴将把11Main网上商城转让给纽约一家风险投资支持的电商企业OpenSky。    腾讯科技讯 阿里巴巴集团在美国整体上市的前夕,阿里启动了国际化战略。在国际化的第一站美国,阿里集团开
你是怎么知道非凡网赚网的?
  •   
  • 联系QQ 邮箱:976382653@qq.com 微信:976382653
    在线留言
    发布软文
    广告自助购
    文章调用
    常见问题
    保存到桌面