利用excel分析IIS服务器日志

maolai 1654次浏览 0个评论

网站日志分析是SEO一个很重要的工作,在网站常规SEO期间,要定期观测一次,并且进行统计记录分析。一个合格的站长或者seoer必须要能看懂网站的服务器日志文件,这个日志记录了网站被搜索引擎爬取的痕迹等等。

打开一个网站文本log,会看到如下大概信息(下图):

#Software: Microsoft Internet Information Services 7.5

#Version: 1.0

#Date: 2016-04-25 00:39:00

#Fields: date time s-ip cs-method cs-uri-stem cs-uri-query s-port cs-username c-ip cs(User-Agent) sc-status sc-substatus sc-win32-status time-taken

网站日志log

对于这个日志有些新手看了一头雾水。下面为大家作详细介绍:

1、#Software: Microsoft Internet Information Services 7.5

说明这个日志是ISS生成的,代表微软的Web服务器 IIS 7.5是版本号

2、#Version: 1.0

版本号:1.0

3、#Date: 2016-04-25 00:39:00

日志生成的日期、时间

4、#Fields: date time s-ip cs-method cs-uri-stem cs-uri-query s-port cs-username c-ip cs(User-Agent) sc-status sc-substatus sc-win32-status time-taken
网站日志excel表格分析
参数详解:

* date(日期) 2016-04-25

* time(时间) 00:39:00

* s-ip:服务器的IP地址

* cs-method 请求中使用的HTTP方法,GET/POST。

* cs-uri-stem URI资源,表访问的资源是当前这个文件

* cs-uri-query URI查询,具体的访问参数

* (cs-uri-stem+ cs-uri-query=实际访问的文件:/b2b_cplist.asp? catid=30)

* s-port(服务器端口) 80

* c-ip(客户端IP) 211.155.23.176(实际是网站所在服务器的IP)

* cs(User-Agent) 用户代理,客户端浏览器、操作系统(蜘蛛抓取)等情况。

* sc-status(协议状态) 记录HTTP状态代码,200表示成功,304一般表示这页面没更新,403表示没有权限,404表示找不到该页面。

* sc-substatus(协议子状态) 0

* sc-win32-status(Win32状态) 记录Windows状态代码。如果被32位的系统访问,那么这里记录的就是0,如果被64位系统访问,那么这里记录的就是64……

* ime-taken:记录操作所花费的时间,单位是毫秒。

分析:2016-04-25 01:42:27 122.114.88.183 GET /jzxzd/ - 80 - 123.125.71.56 Mozilla/5.0+(compatible;+Baiduspider/2.0;++http://www.baidu.com/search/spider.html) 200 0 0 122

百度蜘蛛在2016-04-25 01:42:27 通过80端口爬过/jzxzd/这个页面。

新建一个excel表格,把.log文件里的文件粘贴到新建的excel表格里面。复制之后,全选A,在工具栏里选择数据→分列,如下图所示:

选择分隔符号,点击下一步:选择空格、Tab键前面的钩,点击完成。(如下图所示)网站的iis日志就这样被拆分出来了,之后自己再调整一下表格的列宽、升降序等即可。
用excel表格分析网站的iis日志

本日志分析excel文件下载地址http://pan.baidu.com/s/1nvaSwCL


本文由MAOLAI博客编辑整理发布,欢迎分享,转载请注明出处!
发表我的评论
取消评论

表情 贴图 加粗 删除线 居中 斜体 签到

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址