尽管如今如大主要搜索引擎也都在尽力提高Spider的容错能力,让其可以在HTML代码出现一般性错误时不至影响对内容的收集。但很多时候,仍然会发生如漏了一个关闭标签导致整个页面的内容被忽略的情况。
另一方面,合法有效的HTML也可以保证Web页面可以在多种浏览器下被正确解释,避免同一个页面在IE下显示正常在Mozilla下却严重变形的情况(当然,不能完全避免),这对于提高网站的可用性方面也是有着极大好处的。
如何验证HTML代码的合法有效?
Internet有很多类似的免费服务可以帮我们验证网页代码是否合法有效,其中最著名的即是 W3C HTML Validator ,这是由W3C( World Wide Web Consortium:万维网联盟)官方推出的免费服务项目,在其页面上只需输入待验证的HTML地址或者上传一个在本地机上的HTML文件即可,其会很快返回校验结果,是否无误,如有错误分别为哪些及如何改进等。
同时,W3C HTML Validator也提供对CSS文件的验证服务。
一定要通过W3C的验证么?
对这个问题的答案则不那么绝对。
理论上说,合法的HTML代码能够使搜索引擎的Spider在更容易地收集网站页面的内容信息。但另一方面,并不是所有的HTML代码错误都会影响到Spider的爬行,也即是说,HTML存在少量的错误对Spider来说也是可接受的,那么,一定要通过W3C认证么?
另一方面,如在Mark Daoust的测试中,甚至暗喻(未肯定地下结论)存在少量HTML代码错误在页面在Google排名中能更占优势,当然这存在很大争议,但至少证明了存在少量HTML代码错误并不影响网页在SERP中的排名。
个人观点,如果您对HTML相对不那么熟悉的话,倒也不必强求非得100%通过W3C的验证,毕竟把更多的时间与精力放到真正应该努力的方向如创建内容与链接才是根本,但要保证HTML代码中不存在大的严重性错误。当然,如果您对HTML语言较为精通,那么,何妨稍花点功夫以确保其完全无误呢?因此,我们要做的倒不一定非得通过W3C认证,但至少要保证其在各种浏览器下显示正常,保证搜索引擎的Spider能够正常分析。
提高HTML代码的效率
前文我们提说过很多所见即所得编辑器造成的HTML冗余臃肿问题,这种情况在很多中文网站相当普遍。所见即所得编辑器如FrontPage、Dreamweaver,尤其在其对一个网页进行修改的时候,往往会产生很多不必要的冗余代码。当页面的HTML文件在存在大量的冗余代码时,文件便会变得臃肿,这不但会降低网页的打开速度,损害到网页的效率,同时也会严重影响到相当网页的搜索引擎排名。
与其把精力投入到一定通过W3C认证上,个人认为,倒不如把更多的精力放到精减代码上,如引入CSS等,以实现代码的干净简洁。这样的优化效果会更明显。









