下面以http://www.dtsyd.com/举例网站服务器日志的定义:
1、记录服务器接收客户端处理请求,并记录服务器对这条请求处理结果以.log结尾的文件。
2、服务器日志是服务器自动生成的,一般以日期命名。
3、可以用记事本直接打开,最好用EditPlus打开。防止电脑死机。
网站日志类型:
一、Apache日志——Linux系统服务器日志
二、iis日志——Windows系统服务器日志
不管是哪种日志,主要看懂以下四点:
被访问的文件地址—— cs-uri-stem
搜索引擎蜘蛛或者用户浏览器—— cs(User-Agent)
访问者的IP—— c-ip
访问状态码—— sc-status
网站日志的获取流程(以莆田蓝韵公司空间为例:服务器操作系统是Windows)
第一步:登录空间后台——控制面板——WebLog日志下载
第二步:把下载的日志用EditPlus打开, 删除一些没用的,如下图所示,整理好,保存为.txt文档(之所以保存为txt文档,是为下一步做准备,因为excel表格导入数据只能是txt文档,别的格式不支持)
第三步:用excel表格导入,表格选中在第一行第一列位置,然后按照以下步骤一步步完成就可以了。
第四步:一张完美整洁的日志就导入进来了,这样再看是不是很舒服很清晰呢
第五步:把一些不需要的删除,只需保留cs-uri-stem URI资源、c-ip 客户端IP地址、cs(User-Agent) 用户代理、sc-status 协议状态这4项就可以了
如下图所示,一目了然!
网站日志英文注释:
date 日期
time 时间
s-sitename 服务名
s-ip 服务器IP地址
cs-method 方法
cs-uri-stem URI资源
cs-uri-query URI查询
s-port 服务器端口
cs-username 用户名
c-ip 客户端IP地址
cs(User-Agent) 用户代理sc-status 协议状态
200表示成功
301永久重定向
403表示没有权限
404表示找不到该页面
500内部服务器错误
503服务器超时
sc-substatus 协议子状态
sc-win32-status Win32状态
sc-bytes 发送的字节数
cs-bytes 接收的字节数
time-taken 所用时间
网站日志分析
以下图为例
通过分析:一款俄罗斯的蜘蛛通过IP为141.8.142.145地址爬取了robots.txt这个文件,抓取成功,返回200正常。
竞争对手关键词分析
①、分析URL连接,是否是用主域名还是内页在做?
②、关键词分布位置,是分词得到的结果还是完全匹配?
③、看关键词在标题的位置,是否在首位并重复出现,网站是否在围绕着个词在做?
④、看竞争对手首页外连,网站收录情况 例如link: www.baolaiyuan.com/ , www.20ll.com/,domain:www.dtsyd.com/
⑤、看网站规模,包括网站的域名年龄,收录量,更新机制及百度快照时间。
⑥、看网站运营机构,是个人站长还是公司优化团队。
⑦、看网站内链和外链,外连是否强大,内链是否文章是否做好锚文本。
8、网站xml网站地图,行业中数据量比较大,需要将sitemap分为日志和数据分析。格式http://www.20ll.com/sitemap.xml
如果网站长时间收录有问题,那么我们可以对比网站日志中的搜索引擎蜘蛛行为,了解网站是哪方面出了问题;如果网站被封,或者被K,我们也都可以通过观察网站日志情况来了解原因出在什么地方。
以上就是福州美容培训收录案例(http://www.20ll.com/),本文由莆田蓝韵网络公司http://www.517jkw.org/提供,欢迎大家进行转载!