写在前面的话:由于seo的其中一项工作就是更新文章,优化长尾词,所以很多时候我们都要查询下发布的文章的质量,是否被收录等,我们发布的文章很多,如果一条条手动去查询的话,那将使我们的工作效率打折扣,因此我们需要一个批量查询收录的功能,同时该可能也可以记录我们的工作,如果以后作为seo主管检查专员们的工作质量也是很有必要的。
一、通常我们手动判断一个url是否被百度收录的做法是复制该URL到百度的搜索框去搜索,如果出现搜索结果,则为收录,反之,则是不收录(图1):
图1
二、如果按照这个逻辑去判断的话,我们再来看一个案例,搜索某个被百度K掉的域名,例如www.ladybeta.com,我们再来看下结果(图2):
图2
出现若干结果,程序返回是有结果的,表示该url有收录,显然,这个判断就出错了。
那么程序是否该如何去判断呢?有人说,因为我们判断文章收录的情况很多时候往往查询的都是文章地址,具体到.html了,不存在下级还有文章的,所以直接判断文章的url是否被收录了就好,大域名的就不理会了。那么是否可行呢?
三、按照这个逻辑,如果当前url被其他有收录的网页引用过,出现在其他网站的文章里面,那么搜索这个无收录的url是否会出现搜索结果呢?(图3)
图3
很显然,这个判断逻辑也是不成立的。
四、所以我们判断一个url的方法是先判断有没有结果页面,如果有结果页面,再判断有没出现“没有找到该URL。”这句语句或者“抱歉,没有找到与“www.haohao-edu.cn/Info_160237.htmljlj ”相关的网页。”这条语句。
五,至此,判断一个url是否被百度收录的逻辑应该就是就是这样了。笨人用的笨的方法,之前在构思的时候走了一点弯路,分享我的错误经验,希望对大家有帮助。
文章作者来源:恋爱七步曲www.ladybeta.com,转载请保留地址,谢谢。码字分享不容易,请大家不要去除地址,再次感谢了!