IIS日志文件中的内容显示了无论是搜索引擎还是用户登录你的网站服务器后留下的跟踪记录。IIS日志的数据对一个SEO从业者来说至关重要,学习看懂IIS日志学会分析IIS日志并根据日志内容及时调整网站优化策略,那么我们来研究下日志文件的作用。
IIS日志文件中主要记录是“谁”访问了你的网站,主要显示内容为:用户(包含搜索引擎蜘蛛)在什么时间通过你服务器的哪个端口访问了网站域名下的哪个路径,通过访问这个路径后服务器状态码为多少,通过状态码蜘蛛做了哪些相应的动作。每个服务器或空间的日志文件夹名称都不一样,一般是log文件夹或logfile文件夹,通过FTP登录下载就可以。最常见的状态码为:200(成功访问并下载页面显示下载kb数量)、301(永久重定向)、304(访问页面无变动)、400(错误请求)、403 (服务器拒绝请求)、404(死链接)、500(服务器内部错误)、503 (服务不可用)等等。这些状态码对于SEO优化人员必须熟记于心,并会按照状态码及时作出调整。
一个网站正式上线后的第一项工作就是提交自己的网站网址和说明到搜索引擎登陆口,一般搜索引擎收到提交的网址后就会自动派出蜘蛛程序(或机器人程序)到你的网站进行爬行。当然这是最理想的状态,一般情况下还需要你去布蜘蛛诱饵来吸引蜘蛛爬取你的网站地址。那么当蜘蛛到达你的网站并开始沿首页进行爬取后就会留下日志记录。我们通过查看日志记录就可以知道哪些搜索引擎在什么时候通过哪些蜘蛛IP服务器爬取了你哪些网站下的路径,并每天查看爬取的变化。
网站上线初期每天都要更新网站内容,添加新的文章来丰富网站,只有当蜘蛛来爬取了你的网站才会下载并返回搜索引擎服务器进行分析和索引,但是爬取不等于一定会收录,网站收录有很多的条件我们这里不去研究,但没有爬取什么都无从谈起。当蜘蛛来爬取你网站后留下的日志可以分析到蜘蛛到底爬取了哪些路径,还有哪些路径是没有被爬取的,这个时候就是你调整网站站内优化和外链建设的最好指导。
搜索引擎蜘蛛其实也扮演者用户的角色来访问你的网站,网站初期蜘蛛的访问频率会很低,但随着网站不断的获取权重后蜘蛛的访问频率就会增加,通过不同的服务器状态码来判断你网站的健康程度,如果你的网站出现经常性的服务器不稳定、大量404死链接、网站更新频率很慢的话,蜘蛛会模仿用户判定网站用户体验不好,如果不及时调整带来的后果就是网站降权。这也就是很多人网站降权了却找不到原因的所在。
每天IIS日志显示蜘蛛爬取量在增加的时候也就恭喜你的网站进入了不断成长壮大的阶段,反之蜘蛛爬取的数量在逐步降低的话网站就需要作出调整,一般蜘蛛爬取频率变少爬取路径变少后降权也就随之降临,也就是为什么权重高的网站每天每小时每分钟都有蜘蛛来爬取网站数据,当高权重网站更新了一篇新文章后为什么会被搜索引擎迅速收录。
了解和解读IIS日志关乎到网站的生死存亡,通过分析日志就能够尽量避免降权,只有把握了蜘蛛的动态才能让你的网站权重更高,网站关键词排名更好。每个服务器的操作系统都不一样,相应的日志文件显示方式也不尽相同,当总体的爬行数据非常相似,网站的用户体验和发展就掌握在你的手中。