工具简介

robots.txt是网站管理者可以声明该网站中不想被搜索引擎访问的部分,或者只收录指定的内容,Robots.txt语法检测工具根据robots.txt协议和语法,用户检查网站的robots.txt是否符合规范。

检测robots.txt 生成robots.txt

限制目录:

Sitemap:

检索间隔:

所有搜索引擎:

国内搜索引擎
国外搜索引擎
Ask/Teoma 默认 允许 拒绝
Alexa/Wayback 默认 允许 拒绝
MSN Search 默认 允许 拒绝
Scrub The Web 默认 允许 拒绝
GigaBlast 默认 允许 拒绝
特殊搜索引擎(机器人)
Google Image 默认 允许 拒绝
Google Mobile 默认 允许 拒绝
Yahoo MM 默认 允许 拒绝
Yahoo Blogs 默认 允许 拒绝
MSN PicSearch 默认 允许 拒绝
复制
重置
生成
robots.txt是什么

robots.txt是一个协议,而不是一个命令。robots.txt是搜索引擎中访问网站的时候要查看的第一个文件。
robots.txt文件告诉蜘蛛程序在服务器上什么文件是可以被查看的,也可以指定sitemap的路径。当一个搜索蜘蛛访问一个站点时,它会首先检查该站点根目录下是否存在robots.txt,如果存在,
搜索机器人就会按照该文件中的内容来确定访问的范围;如果该文件不存在,所有的搜索蜘蛛将能够访问网站上所有没有被口令保护的页面。
Google和百度官方建议,仅当您的网站包含不希望被搜索引擎收录的内容时,才需要使用robots.txt文件。如果您希望搜索引擎收录网站上所有内容,请勿建立robots.txt文件。 robots.txt必须放置在一个站点的根目录下,而且文件名必须全部小写。robots.txt必须遵循robots.txt协议使用标准语法,严格按照用法来编写,不然会造成搜索引擎无法访问你的网站。

功能简介

检测网站的robots.txt内容,防止错误的配置填写,也可以在线生成robots.txt。

TOP