网站日志是什么,引用百度百科的定义“网站日志是记录web服务器接收处理请求以及运行时错误等各种原始信息的以·log结尾的文件,确切的讲,应该是服务器日志。”通过这个定义可以了解到网站日志记录了最全的网站运行信息,主要包括访客信息(比如访客ip、用什么浏览器、操作系统、访问时间等等)、蜘蛛对网站的抓取情况(抓取了哪些目录、都有哪些蜘蛛等等)、运行错误信息(主要是看一些http状态码)。
那这么多信息,我们需要重点关注的有哪几个点呢?
一、蜘蛛抓取情况
1、都有哪些蜘蛛来访问
看一下主流的蜘蛛是否有访问网站,如果没有的话,可能是被网站屏蔽了,可以检查下网站的robots文件设置。
2、抓取了哪些目录
统计蜘蛛对网站目录的抓取情况,网站各层级目录是否抓取正常,一些需要重点推广的目录是否有抓取,如果没有抓取的话则需要对网站内链进行调整或者增加外链,提升栏目权重,引导蜘蛛抓取。另外,蜘蛛可能会抓取一些无意义的目录,比如我们不希望搜索引擎了解的信息,这时候就可以把这些目录屏蔽掉。
3、抓取了哪些页面
统计蜘蛛对网站页面的抓取情况,通过一段时间的观察你会发现蜘蛛经常抓取的一些页面,分析蜘蛛为什么喜欢这些页面,这些页面跟其它页面相比有什么不同,有没有其它页面可以借鉴的地方。此外,还可以通过分析页面抓取情况,了解到网站的一些问题,比如重复页面问题、url规范化问题等等。
4、蜘蛛访问次数、停留时间、抓取量
蜘蛛频繁访问网站,说明喜欢网站,经常来看看网站内容是否有更新,对网站来说是一件好事。如果十天半个月才来一次,那网站内容可能得更新勤快点了,另外还要多增加一些外链,引导蜘蛛访问网站。停留时间长短可以反映蜘蛛对网站的喜欢程度,需要注意的一点是,如果停留时间长,但是抓取量低的就有问题了,可能是蜘蛛对网站内容抓取困难,或者网站内容质量偏低导致的。这三个指标要综合起来看,才会得到比较有价值的信息。
二、http状态码
主要关注的有404、500、302之类的。404就不用说了,最好定期整理死链接,并提交到站长平台。如果经常出现500,可能是服务器的问题,比如内容太多,服务器无法满足需求,超负荷运转了,就会出现超时、无法访问的情况。302是暂时重定向,这个要具体看下是什么问题,搜索引擎比较喜欢301,如果可以的话就做成301的。
三、网站安全情况
通过日志分析,还可以及时了解到网站是否安全,像作者本人优化的一个站点,是通过日志分析才发现被挂了黑链的。分析日志的时候如果发现一些不存在的目录,或者一些奇怪的页面,就要仔细去分析一下,很可能就是有问题的。
以上就是作者本人在网站日志分析方面的一些心得体会,希望能够帮助到大家。网站日志分析是需要长期坚持的工作,一朝一夕可能发现不了问题,贵在坚持。
题外话:网站日志分析肯定少不了日志分析工具,该如何选择日志分析工具呢,个人认为主要还是得用着顺手的,一些主流的日志分析工具基本都可以满足需求,工具不分好坏,各有千秋,我就比较喜欢金花跟光年一块用,各取所长嘛。
定制网站:顾名思义就是你想要什样的就做成什么样的,由客户来提出要求,从前期制作到后期完善修改。模板网站:由服务商提供一些可供浏览的网站样式...
仿站是我们很是熟悉的一个建站流程。根据您对网上某个网站的极其认可,喜欢,然后对它进行风格的仿制以及功能的仿制,以快速达到对方的水平,这就是...
模板加密的不能仿,有一些模板会把一些参数写到JS里面,然后通过复杂的JS控制一些特效和布局这种大部分都有相关的验证,及时本地能运行,但发布到网...
问:我设置了301跳转,多久可以生效? 答:目前搜索引擎无法承诺301跳转的生效时间,因为站长感受到的生效时间会受多因素影响,比如Baiduspider再次抓取...
个人仿站基本各行业都会有,无非就是哪些类型仿的多,哪些类型仿的少而已。下面给大家介绍下一些常见的个人仿站类型。一、流量类站点,一般包括影...
仿站是一种什么样的概念?仿站 顾名思意就是仿制别人的网站。为什么要仿别人的网站呢?因为如果不仿制,那么找网络公司设计一个网站,首先美工要把...