为什么那么多seo强调将动态页面静态化?
那是由于之前的引擎爬虫技术并不太完善,网站程序不合理和故意造成蜘蛛陷阱,导致爬行索引时进入死循环。鉴于此种情况,搜索引擎为避免发生这种现象,故减少对动态url的读取。
渐渐地随着搜索引擎的完善,这种现象基本已经得到了解决,谷歌现在对这种动态地址的抓取己经相当成功,百度也还不错,只是有待加强。但是,对于那些带过多环境变量(query string)的动态地址仍不够理想。
静态页面在搜索引擎友好方面有什么优势?
对于各引擎而言,静态页面还是比动态url更具友好性。但是到底差距有多大呢?其实很小。要缩小这个差距,就看你会不会把握内链策略。
动态url静态化:伪静态
动态url在网站目录中并不存在具体的文件,而是根据用户请求,从数据库中返回请求的结果。我们可以把这个过程模拟成静态页面或目录,就是常见的“伪静态”。
目前主流的很多程序都支持伪静态,我们也可以根据需要,对程序进行diy,再对网站环境进行相应设置。apache下mod_rewrite的重写模块就能很轻松的实现,windows环境下也有rewrite组件。
网站动态url做好站内优化的相关策略
1、导航很重要
完善的站内导航,有利于spider高效率的爬行。整站尽可能做到:从首页出发,较重要的位置,不超过3次点击就能到达;最重要的位置,应该在首页出现相应的链接;必要时,可以单独制作一个静态导航页。
2、制作网站地图
首先网站内应该有一个网站地图页面,将常用位置在这个页面中做上链接,用户可以最快的了解网站结构,搜索引擎spider可以快速高效的对网站爬行;其次xml格式的网站地图目前已经不仅适用于google,应尽可能的保持xml地图更新;最后,建议制作一份url列表(urllist.html和urllist.txt),对网站是有益而无害的。
3、url统一、规范
同一url出现多个版本(如read.php?id=1和read.php?id=1&page=1),同一位置出现多个url形式(如list.php?companyname=xxx和list.php?companyid=123),及大小写问题等都可能导致在搜索引擎中出现相似页面,从而影响网站在搜索引擎中的表现。