工具简介

蜘蛛模拟器工具可以模拟百度、Google或者其它搜索引擎的Spider,以搜索引擎蜘蛛的方式抓取网页上的内容或链接。可以帮助您对一篇网页的内容或链接做出直观地分析。
通常来讲,您在网页上所看到的内容(网页上所显示的内容)与搜索引擎蜘蛛(Spider)所能抓取的内容是不一样的。也就是说我们通过Flash、图片或Javascript等客户端渲染方法所展示的内容及其中所包含的链接搜索引擎是无法抓取到的。
蜘蛛模拟器的作用也便在此,以搜索引擎的视角抓取并分析您的网页。

HTML标签优化

1、 静态页面 将信息页面和频道、网站首页改为静态页面,有利于搜索引擎更快更好的收录。
2、 页面标题(Page Title)的关键词优化 将信息页面和频道、网站首页改为静态页面,有利于搜索引擎更快更好的收录。
3、 Meta标签的优化(过去搜索引擎优化的重要手法,现在已经不是关键因素,但仍不可忽略) 主要包括:Meta description、Meta keywords的设置。关键字密度要适度,通常为2%-8%,也就是说你的关键字必须在页面中出现若干次,或者在搜索引擎允许的范围内,要避免堆砌关键字。
4、针对Google制作Sitemaps Google的sitemaps是对原来robots.txt的扩展,它使用 XML格式来记录整个网站的信息并供Google读取,使搜索引擎能更快更全面的收录网站的内容。可以使用Google提供的Sitemap生成器制作(需要技术人员制作):也可以由技术部人员制作更全面的Sitemaps。
5、 图片的关键词优化 图片的替代关键词也不要忽略,其另外一方面的作用是,当图片不能显示的时候,可以给访问者一个替代解释语句。
6、 避免表格的嵌套 假如表格嵌套太多,搜索引擎通常只读取3个<table>的嵌套,如果太多,会造成部分有用信息没有被检测到。
7、 采用web标准进行网站重构 尽量使网站的代码符合W3C的HTML 4.0或XHTML 1.0规范。通过XML+CSS技术进行网站重构,减少不表格及冗余代码,提高网站页面的扩展性,兼容性,可以使更多浏览器支持。
8、 网站结构的扁平化规划 目录和内容结构最好不要超过3层,如果有超过三层的,最好通过子域名来调整和简化结构层数。另外目录命名的规范做法是使用英文而不是拼音字母。
9、 页面容量的合理化 合理的页面容量会提升网页的显示速度,增加对搜索引擎蜘蛛程序的友好度。同时建议js脚本和css脚本尽量用链接文件。
10、外部文件策略 把javascript文件和css文件分别放在js和css外部文件中。这样做的好处是把重要的页面内容放到页面顶部,同时能缩小文件大小。有利于搜索引擎快速准确地抓取页面  重要内容。其他的字体(FONT)和格式化标签也尽量少用,建议采用CSS定义。
11、外部链接 尽可能多地让其他跟你主题相关的网站链接本站,同时尽量同PR值更高的网站进行相互链接。如果网站提供与主题相关的导出链接,被搜索引擎认为有丰富的与主题相关的内容,也有利于排名,例如各类招商网站、投融资网站的概念。另外避免链接不顾质量的大面积撒网,对搜索引擎而言宁少要精。
12、网站地图 网站自身的网站地图是搜索引擎更全面索引收录你的网站的重要因素。建议制作基于文本的网站地图,内含网站所有栏目、子栏目。网站地图的三大因素:文本、链接、关键词,都极其有利于搜索引擎抓取主要页面内容。特别是动态生成目录网站尤其需要 创建网站地图。
13、图像热点 除AltaVista、Google明确支持图像热点链接外,其他引擎暂不支持。当“蜘蛛” 程序遇到这种结构时,就会无法辨别。因此尽量不要设置图像热点(Image Map)链接。
14、FLASH应用 FLASH由于不含文字信息,应尽量用于功能展示和广告,少用于网站栏目和页面。
15、JS脚本 在不支持JS脚本的浏览器里 <NOSCRIPT> 标签会起到重要提示作用,对搜索引擎的Spider搜索也会有帮助。
16、Frame框架 Frame标签会被搜索忽略,尽量少用,如果一定要用,则应正确使用Noframe标签, 在<Noframe>></Noframe>区域中包含指向frame页的链接或带有关键词的描述文本,同时在框架以外的区域也出现关键词文本。
17、资讯的内部链接 有助提高网站排名和PR值,例如相关资讯、推荐资讯等。

功能简介

查看搜索引擎蜘蛛抓取站点时所获得到的内容,并对站点中的关键词分布进行评估。

TOP