当前位置:首页Python批量查询关键词是否是指数词 举报文章

Python批量查询关键词是否是指数词

作者:admin    来源:用户投稿    时间:2016.1.25   

  简单的查询一个关键词是否为指数词,暂不能查询指数,过段时间研究下

  # -*- coding: utf-8 -*-

  import urllib2

  import urllib

  import cookielib

  import re

  import bs4

  URL_BAIDU_INDEX = u'http://www.baidu.com/';

  #https://passport.baidu.com/v2/api/?getapi&class=login&tpl=mn&tangram=true 也可以用这个

  URL_BAIDU_TOKEN = 'https://passport.baidu.com/v2/api/?getapi&tpl=pp&apiver=v3&class=login';

  URL_BAIDU_LOGIN = 'https://passport.baidu.com/v2/api/?login';

  #设置用户名、密码

  username = '';

  password = '';

  #设置cookie,这里cookiejar可自动管理,无需手动指定

  cj = cookielib.CookieJar();

  opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cj));

  urllib2.install_opener(opener);

  reqReturn = urllib2.urlopen(URL_BAIDU_INDEX);

  #获取token,

  tokenReturn = urllib2.urlopen(URL_BAIDU_TOKEN);

  matchVal = re.search(u'"token" : "(?P.*?)"',tokenReturn.read());

  tokenVal = matchVal.group('tokenVal');

  #构造登录请求参数,该请求数据是通过抓包获得,对应https://passport.baidu.com/v2/api/?login请求

  postData = {

  'username' : username,

  'password' : password,

  'u' : 'https://passport.baidu.com/',

  'tpl' : 'pp',

  'token' : tokenVal,

  'staticpage' : 'https://passport.baidu.com/static/passpc-account/html/v3Jump.html',

  'isPhone' : 'false',

  'charset' : 'UTF-8',

  'callback' : 'parent.bd__pcbs__ra48vi'

  };

  postData = urllib.urlencode(postData);

  #发送登录请求

  loginRequest = urllib2.Request(URL_BAIDU_LOGIN,postData);

  loginRequest.add_header('Accept','text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8');

  loginRequest.add_header('Accept-Encoding','gzip,deflate,sdch');

  loginRequest.add_header('Accept-Language','zh-CN,zh;q=0.8');

  loginRequest.add_header('User-Agent','Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/28.0.1500.72 Safari/537.36');

  loginRequest.add_header('Content-Type','application/x-www-form-urlencoded');

  sendPost = urllib2.urlopen(loginRequest);

  #获取指数页面

  keylist = open('key.txt','r') #查询关键词的文件

  i = '如要查看相关数据'

  for key in keylist:

  key = key.strip('\n')

  teibaUrl = 'http://index.baidu.com/?tpl=trend&word={0}'.format(key)

  content = urllib2.urlopen(teibaUrl).read();

  content = content.decode('gbk').encode('utf8');

  if i in content:

  print key,'不是指数关键词'

  else:

  print key,'指数关键词'

  喜欢python,SEO的同学可以加QQ群472779600

好文打赏,给Ta鼓励
扫一扫用手机阅读本文
Tags:批量  查询  关键  关键词  是否  是指  指数  数词  
  • 相关搜索
图片推荐
    高质量外链2016新解:做用户认可、参与、推荐的外链

    高质量外链2016新解:做用户认可、参与、推荐的外链

    这一年,小伙伴们对于网站外链建设有很多疑问。自从百度发布超链接算法升级公告之后,看到很多SEO大神对于外链对排名的作用就更加讳莫如深,而作为个人站长,大家对于外链的看法各执一词。像高质量外链、外链作用
    内容营销:99%的时间都在和用户谈恋爱

    内容营销:99%的时间都在和用户谈恋爱

    恋爱简单,相爱很难,想和用户来场天长地久的恋爱难上加难。  一、搞清楚你喜欢什么样的人(用户定位)  在谈恋爱之前,你要搞清楚自己适合找什么样的人,小鸟依人还是御姐范儿,安静的萌妹子还是有个性的女孩子
    关于移动营销,你必须知道的12个事实

    关于移动营销,你必须知道的12个事实

    去年我们协助出版了移动营销行业书《决战第三屏》。美国人写的,很全面,挺生动,也比较容易接受。所以,一本半专业的书,大卖近2万本。做出版的人,知道这是一个惊人数字。毕竟不是《盗墓笔记》。一个副产品,决战
    阿里的全球支付征战 世界上还有谁挡得住马云爸爸

    阿里的全球支付征战 世界上还有谁挡得住马云爸爸

    当年凭借支付宝,阿里一举将人们网络购物的最大和最后的担心完全解决,从而使其高歌猛进成为了中国最大的电商平台,可以说,没有支付宝的担保交易模式,中国的电商浪潮不会来得那么早那么猛烈,特别是在一个信用度全
    投融界后G20时代,构建国际化专业融资服务平台

    投融界后G20时代,构建国际化专业融资服务平台

    吉布提共和国是中非合作'一路一带'上的重要支点。浙江省是中国最早实行对外开放的省份之一,又是'一带一路'规划中圈定的重点省份,对外开放度较高。据统计,2016年上半年,浙商对'一带一路'沿线国家地区累
    如何提升自媒体的影响力?教你几招

    如何提升自媒体的影响力?教你几招

    大家好我是Form,我一直都说,不管是做什么博客或者说所有的自媒体网络,都包含了一个网络创业者的理想。我一直都不认为自媒体是随随便便的建立起来玩玩的,虽然很多人在说自己当初为什么会建立自己的博客的时候
你是怎么知道非凡网赚网的?
  •   
  • 联系QQ 邮箱:976382653@qq.com 微信:976382653
    在线留言
    发布软文
    广告自助购
    文章调用
    常见问题
    保存到桌面