WordPress网站robots.txt文件写法

09-05 | 夜光 | IT记录

wordpress的robots.txt文件写法:

写好后以robots.txt保存为UTF-8编码(不是unicode)放在网站根目录。

如果有网站地图,在最后一行加上 Sitemap: 网站地图地址

一:这是我的robots.txt文件

User-agent: *
Disallow: /wp-admin
Disallow: /wp-includes
Disallow: /wp-content
Disallow: /author/
Disallow: /zone/
Disallow: /*/trackback
Disallow: /feed
Disallow: /*/feed
Disallow: /comments/feed
Disallow: /*/comments/feed
Disallow: /*/comment-page-*
Disallow: /gallery
Disallow: /*gallery*
Disallow: /album
Disallow: /*album*
Disallow: /*?*
Disallow: /*.jpg$
Disallow: /*.png$
Disallow: /*.gif$
Disallow: /*.bmp$
Disallow: /*.ico$
Disallow: /*.mp3$
Disallow: /*.wma$
Disallow: /*.rmvb$
Disallow: /*.flv$
Disallow: /*.mp4$
Disallow: /*.swf$
Disallow: /*.pdf$
Disallow: /*.php$
Disallow: /*.js$
Disallow: /*.css$
Disallow: /*.rar$
Disallow: /*.zip$

Sitemap: sitemap.xml.gz

二:允许所有的robot访问

User-agent: *
Disallow:

三:禁止所有搜索引擎访问

User-agent: *
Disallow: /

四:只禁止Baiduspider访问(淘宝网的做法)

User-agent: Baiduspider
Disallow: /

五:只允许Baiduspider访问

User-agent: Baiduspider
Disallow:
User-agent: *
Disallow: /

六:robots.txt文件的一些写法

User-agent: *
#禁止所有搜索引擎蜘蛛抓取以下目录
Disallow: /cgi-bin/
Disallow: /z/j/
Disallow: /z/c/
Disallow: /stats/
Disallow: /dh_
Disallow: /wp-admin/
Disallow: /wp-includes/
Disallow: /contact/
Disallow: /tag/
Disallow: /wp-content/b
Disallow: /wp-content/p
Disallow: /wp-content/themes/askapache/4
Disallow: /wp-content/themes/askapache/c
Disallow: /wp-content/themes/askapache/d
Disallow: /wp-content/themes/askapache/f
Disallow: /wp-content/themes/askapache/h
Disallow: /wp-content/themes/askapache/in
Disallow: /wp-content/themes/askapache/p
Disallow: /wp-content/themes/askapache/s
Disallow: /trackback/
Disallow: /*?*
Disallow: */trackback/

#允许谷歌adsense蜘蛛进入
User-agent: Mediapartners-Google*
Disallow: /*?*
Allow: /z/
Allow: /about/
Allow: /contact/
Allow: /wp-content/
Allow: /tag/
Allow: /manual/*
Allow: /docs/*
Allow: /*.php$
Allow: /*.js$
Allow: /*.inc$
Allow: /*.css$
Allow: /*.gz$
Allow: /*.cgi$
Allow: /*.wmv$
Allow: /*.cgi$
Allow: /*.xhtml$
Allow: /*.php*
Allow: /*.gif$
Allow: /*.jpg$
Allow: /*.png$

User-agent: Googlebot
#禁止谷歌网页蜘蛛抓取以下扩展名的文件
Disallow: /*.php$
Disallow: /*.js$
Disallow: /*.inc$
Disallow: /*.css$
Disallow: /*.gz$
Disallow: /*.cgi$
Disallow: /*.wmv$
Disallow: /*.png$
Disallow: /*.gif$
Disallow: /*.jpg$
Disallow: /*.cgi$
Disallow: /*.xhtml$
Disallow: /*.php*
Disallow: */trackback*
Disallow: /*?*
Disallow: /z/
Disallow: /wp-*
Allow: /wp-content/uploads/

#允许谷歌的图片蜘蛛抓取图片
User-agent: Googlebot-Image
Allow: /*

本文标签: ,
本文链接: wordpress-robots-txt/
版权所有: 玻璃泉, 转载请注明本文出处。

10个评论

  1. 新朋友来访 欢迎常来坐坐

  2. 比较麻烦,默认就好了,呵呵。

  3. 不需要限制额

  4. 这东西写不好会带来一些麻烦

  5. 过来学习了..
    不是很懂

  6. 学习啦,我的部分就是参考博主的写法

  7. 你这个限制的够多的。直接Disallow:/WP-
    不就限制所有WP开头的文件了?
    那个冒号和空格之间需不需要空格捏?

  8. 那就是说。除了会限制所有WP开头的文件和文件夹以外,还会限制所有与WP开头的文章?