一直以来都觉得百度没法很好的判断哪篇文章是原创首发的,因为存在这一情况,“小网站写了原创,大网站转载,spider去小网站不频繁,百度会先收录大网站,之后收录小网站”这样会让我觉得百度会认为最先收录的网站,才是原创首发的,但实际情况有时并不是这样,可能小站原创首发的,之后可能会被人转载或采集首发的站点没有最先被蜘蛛发现,所以小站原创首发的内容,可能会被百度当做是其他站点原创首发的,自己所付出的辛劳百度并不知道。
曾几何时,笔者在admin5或chinaz上投稿时,都会等我在博客内首发的文章收录后,才去投稿,就是为了避免出现这种情况。
关于这个问题,在5月20日百度站长平台在北京举办了“2013百度站长平台高端SEO俱乐部”活动中也提出了。
“问:小网站写了原创,大网站转载,spider去小网站不频繁,百度会先收录大网站,之后收录小网站,百度怎样去判断原创。”
“lee答:我们之后希望中小网站能够通过ping机制ping给百度,这样就可以从时间上进行初步区分。大网站有用户等权重积累,用户也倾向于点击大网站的链接,我们希望通过适当引导改变这种现状。”
从回答中,也可以了解到,百度应该是对最先发现的原创文章的网站,才认为是原创首发的,所以lee希望中小网站能够通过ping机制ping给百度,这样就可以从时间上进行初步区分。
这倒是不错的方法,网站有新内容发布,可以通过ping机制第一时间告知百度网站有新内容更新了,赶紧派蜘蛛来抓取。在时间上,感觉比百度sitemap工具更具优势。因为百度地图最短抓取周期为一小时,所以并不是最优的解决方案,可以让ping机制和百度地图共同使用,最大限度的加快收录速度,对于时效性新闻,越早收录,就越早带来流量。
所以建议广大站长们,可以用上ping服务,让页面收录来得更快些。毕竟这个就像百度地图一样,是网站和百度沟通的方法之一,以便百度及时进行抓取和更新,有利无弊。
个别建站程序,都有ping功能,如WordPress,就算程序没有集成ping功能的,也可以通过插件扩展,如dedecms的ping服务插件,发布文章后,可以同步ping给百度,全自动化,安装上就行,默认已经配置好的。
采集侠官方网站使用了ping服务插件,明显提升了收录量
本文首发织梦管理员之家:http://www.dedeadmin.com/?p=3939 转载请注明出处。