当前位置:首页Python批量查询关键词是否是指数词 举报文章

Python批量查询关键词是否是指数词

作者:admin    来源:用户投稿    时间:2016.1.25   

  简单的查询一个关键词是否为指数词,暂不能查询指数,过段时间研究下

  # -*- coding: utf-8 -*-

  import urllib2

  import urllib

  import cookielib

  import re

  import bs4

  URL_BAIDU_INDEX = u'http://www.baidu.com/';

  #https://passport.baidu.com/v2/api/?getapi&class=login&tpl=mn&tangram=true 也可以用这个

  URL_BAIDU_TOKEN = 'https://passport.baidu.com/v2/api/?getapi&tpl=pp&apiver=v3&class=login';

  URL_BAIDU_LOGIN = 'https://passport.baidu.com/v2/api/?login';

  #设置用户名、密码

  username = '';

  password = '';

  #设置cookie,这里cookiejar可自动管理,无需手动指定

  cj = cookielib.CookieJar();

  opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cj));

  urllib2.install_opener(opener);

  reqReturn = urllib2.urlopen(URL_BAIDU_INDEX);

  #获取token,

  tokenReturn = urllib2.urlopen(URL_BAIDU_TOKEN);

  matchVal = re.search(u'"token" : "(?P.*?)"',tokenReturn.read());

  tokenVal = matchVal.group('tokenVal');

  #构造登录请求参数,该请求数据是通过抓包获得,对应https://passport.baidu.com/v2/api/?login请求

  postData = {

  'username' : username,

  'password' : password,

  'u' : 'https://passport.baidu.com/',

  'tpl' : 'pp',

  'token' : tokenVal,

  'staticpage' : 'https://passport.baidu.com/static/passpc-account/html/v3Jump.html',

  'isPhone' : 'false',

  'charset' : 'UTF-8',

  'callback' : 'parent.bd__pcbs__ra48vi'

  };

  postData = urllib.urlencode(postData);

  #发送登录请求

  loginRequest = urllib2.Request(URL_BAIDU_LOGIN,postData);

  loginRequest.add_header('Accept','text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8');

  loginRequest.add_header('Accept-Encoding','gzip,deflate,sdch');

  loginRequest.add_header('Accept-Language','zh-CN,zh;q=0.8');

  loginRequest.add_header('User-Agent','Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/28.0.1500.72 Safari/537.36');

  loginRequest.add_header('Content-Type','application/x-www-form-urlencoded');

  sendPost = urllib2.urlopen(loginRequest);

  #获取指数页面

  keylist = open('key.txt','r') #查询关键词的文件

  i = '如要查看相关数据'

  for key in keylist:

  key = key.strip('\n')

  teibaUrl = 'http://index.baidu.com/?tpl=trend&word={0}'.format(key)

  content = urllib2.urlopen(teibaUrl).read();

  content = content.decode('gbk').encode('utf8');

  if i in content:

  print key,'不是指数关键词'

  else:

  print key,'指数关键词'

  喜欢python,SEO的同学可以加QQ群472779600

好文打赏,给Ta鼓励
扫一扫用手机阅读本文
Tags:批量  查询  关键  关键词  是否  是指  指数  数词  
  • 相关搜索
图片推荐
    如何搭建站内信息高速,让蜘蛛风驰电掣遍览各路风景

    如何搭建站内信息高速,让蜘蛛风驰电掣遍览各路风景

    站内链接的建设一直是一个老生常谈的话题,之所以如此主要是因为,内链的建设对于时搜索引擎全面了解站点内容的唯一途径。是向搜索引擎展示自我,推销自我的 唯一手段。其重要性不言自明。再一个原因是因为,合理的
    创业分享:我的板栗如何在网上销售?

    创业分享:我的板栗如何在网上销售?

    石磊上周末参加完怀柔滑雪活动心情非常激动。  他说:没想到互联网已经发展到这种地步了,我对网络的了解只在玩玩游戏,看看新闻。现在电商、竞价、微商的发展超乎想象,原来一直闷头造车,就想走走线下供货商路子
    草根站长如何成为自媒体明星

    草根站长如何成为自媒体明星

    如今自媒体逐渐开始代替传统的媒体形式,像传统纸媒、电视媒体、报刊媒体等,所谓的草根自媒体,其实就是相对于明星自媒体人来说的。草根站长中知名度高的自媒体人也有几位,比如:卢松松、月光博客的博主等,这些曾
    百度新算法分析:外链与内容哪个重要?

    百度新算法分析:外链与内容哪个重要?

    通常我们看到此类问题如果是新手SEO或者站长都会第一时间在脑子里闪现出几个对网站优化的因素,如:网站结构、内链的设置、URL地址标准化、合理的页面布局、外链的发放、友情链接、用户体验、内容等。但是什么
    高一度网络:SEO优化行业的就业前景好不好

    高一度网络:SEO优化行业的就业前景好不好

    贵州罗蒙了解现在已然是互联网信息飞速发展的信息化大时代,越来越多的人看到了这个行业未来的发展前景,所以很多的年轻人选择去学习计算机应用领域的相关专业,为了日后谋求一个有发展前途的工作,成为核心技术人才
    一位创业者之死:创业,是否值得生命的代价

    一位创业者之死:创业,是否值得生命的代价

    硅谷的一位连续创业者,在屡败屡战、屡战屡败后最终选择了自杀。创业,是否值得付出生命的代价?  48岁的硅谷创业者乔迪舍尔曼(Jody Sherman),今年1月27日在拉斯维加斯附近饮弹自尽,消息传出
    一个优秀的微信公众号运营者需要具备哪些能力?

    一个优秀的微信公众号运营者需要具备哪些能力?

    说实话,其实运营一个微信公众号还真没那么简单,就像我们创业一样,有那么容易就成功吗?显然不是,那是不是因为不容易就不去做,难就要放弃呢?显然不是,既然这是一块肥肉,是一个新兴的机会和市场,我们更应该付
    慢公司沪江网:从社区到教育平台的蜕变

    慢公司沪江网:从社区到教育平台的蜕变

    [导读] 教育这个领域非常特殊,即使基于互联网也很难做到爆发式海量用户增长;沪江网积累了13年,才做到8千万的用户。  原文标题:十三年细耕在线教育,沪江网成功了吗?  文/王一粟  沪江网诞生时间不
你是怎么知道非凡网赚网的?
  •   
  • 联系QQ 邮箱:976382653@qq.com 微信:976382653
    在线留言
    发布软文
    广告自助购
    文章调用
    常见问题
    保存到桌面