登录

个人博客网站日志404状态码分析详解

网站建设 maolai 2862次浏览 3个评论 扫描二维码

网站日志是记录web服务器接收处理请求以及运行时错误等各种原始信息的以“.log”结尾的文件。通过网站日志分析可以清楚的知道用户在什么IP、什么时间、用什么操作系统、什么浏览器、什么分辨率显示器的情况下访问了你网站的哪个页面,是否访问成功等等。同时,对网站日志分析是seoer必需要掌握的一项基本的技能。

经常查看网站日志的都知道里面的404状态码。日志里404为分两种,一种是用户状态码404,一种是蜘蛛状态码404。对于搜索引擎蜘蛛抓取的404比较好处理,多数直接到网站程序页面找出去掉,然后去百度站长提死链就可以了。而对于用户状态码404,代表用户访问的页面,网站本身不存在的链接(即文件夹或者路径都是不存在的)。用户的搜索行为我们是无法控制的,出现少量404也没什么影响。但是网站出现大量的用户状态码404(几百多),而且每天观察都有,那就要注意了,你的网站可能被搞了。

以下是个人博客网站日志分析情况,通过5天的分析的观察,用户状态码404每天都有500多条以上(相对于别人网站每天几千404来说是比较少的),即文件夹或者路径都是不存在。这就可能有人能过工具恶意扫描我的网站,用户访问输入多数很少错误的。

网络日志404

爱站网站日志分析

对于连续出现大量用户状态码404,有以下几种可能:1、别人在找你网站的漏洞(如网站登录地址、密码破解等)2、可能在仿你的网站。3、恶意镜像你的网站。4,其他,总之都是不怀好意的。

而个人博客根据网络日志分析与百度统计结合查看,如下图所示从入口页面的链接可以看出被别人恶意镜像,最近我也没有在本地进行127.0.0.1测试。这里可以找出404所对应的IP地址查询来源。

百度统计来源

百度统计页面入口

现在的个人博客小站要么被别人仿站,要么被别人镜像这两种最多。所以要经常观察自己的个人网站,同时做好网站安全防护。更多信息,欢迎讨论。


本文由maolai编辑整理发布,转载请注明个人博客网站日志404状态码分析详解!如果本文对你有帮助,可打赏博主,鼓励博主继续写作!
喜欢 (0)
[maolai]
分享 (0)
maolai
关于作者:
无折腾,不生活。一个爱折腾,爱分享的90后,欢迎你认识我,我是MAOLAI。
发表我的评论
取消评论
表情 贴图 加粗 删除线 居中 斜体 签到

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址
(3)个小伙伴在吐槽
  1. 还好了,我的博客主题自己写好了404的,当然,不是很难看,所以也没有修改它了
  2. 很不错的样子⊙0⊙
    广告任务网2016-11-07 14:11 回复
  3. 相当不错,自愧不如!
    增达任务网2016-10-28 15:51 回复