wordpress的robots.txt文件写法:
写好后以robots.txt保存为UTF-8编码(不是unicode)放在网站根目录。
如果有网站地图,在最后一行加上 Sitemap: 网站地图地址
一:这是我的robots.txt文件
User-agent: *
Disallow: /wp-admin
Disallow: /wp-includes
Disallow: /wp-content
Disallow: /author/
Disallow: /zone/
Disallow: /*/trackback
Disallow: /feed
Disallow: /*/feed
Disallow: /comments/feed
Disallow: /*/comments/feed
Disallow: /*/comment-page-*
Disallow: /gallery
Disallow: /*gallery*
Disallow: /album
Disallow: /*album*
Disallow: /*?*
Disallow: /*.jpg$
Disallow: /*.png$
Disallow: /*.gif$
Disallow: /*.bmp$
Disallow: /*.ico$
Disallow: /*.mp3$
Disallow: /*.wma$
Disallow: /*.rmvb$
Disallow: /*.flv$
Disallow: /*.mp4$
Disallow: /*.swf$
Disallow: /*.pdf$
Disallow: /*.php$
Disallow: /*.js$
Disallow: /*.css$
Disallow: /*.rar$
Disallow: /*.zip$
Sitemap: sitemap.xml.gz
二:允许所有的robot访问
User-agent: *
Disallow:
三:禁止所有搜索引擎访问
User-agent: *
Disallow: /
四:只禁止Baiduspider访问(淘宝网的做法)
User-agent: Baiduspider
Disallow: /
五:只允许Baiduspider访问
User-agent: Baiduspider
Disallow:
User-agent: *
Disallow: /
六:robots.txt文件的一些写法
User-agent: *
#禁止所有搜索引擎蜘蛛抓取以下目录
Disallow: /cgi-bin/
Disallow: /z/j/
Disallow: /z/c/
Disallow: /stats/
Disallow: /dh_
Disallow: /wp-admin/
Disallow: /wp-includes/
Disallow: /contact/
Disallow: /tag/
Disallow: /wp-content/b
Disallow: /wp-content/p
Disallow: /wp-content/themes/askapache/4
Disallow: /wp-content/themes/askapache/c
Disallow: /wp-content/themes/askapache/d
Disallow: /wp-content/themes/askapache/f
Disallow: /wp-content/themes/askapache/h
Disallow: /wp-content/themes/askapache/in
Disallow: /wp-content/themes/askapache/p
Disallow: /wp-content/themes/askapache/s
Disallow: /trackback/
Disallow: /*?*
Disallow: */trackback/
#允许谷歌adsense蜘蛛进入
User-agent: Mediapartners-Google*
Disallow: /*?*
Allow: /z/
Allow: /about/
Allow: /contact/
Allow: /wp-content/
Allow: /tag/
Allow: /manual/*
Allow: /docs/*
Allow: /*.php$
Allow: /*.js$
Allow: /*.inc$
Allow: /*.css$
Allow: /*.gz$
Allow: /*.cgi$
Allow: /*.wmv$
Allow: /*.cgi$
Allow: /*.xhtml$
Allow: /*.php*
Allow: /*.gif$
Allow: /*.jpg$
Allow: /*.png$
User-agent: Googlebot
#禁止谷歌网页蜘蛛抓取以下扩展名的文件
Disallow: /*.php$
Disallow: /*.js$
Disallow: /*.inc$
Disallow: /*.css$
Disallow: /*.gz$
Disallow: /*.cgi$
Disallow: /*.wmv$
Disallow: /*.png$
Disallow: /*.gif$
Disallow: /*.jpg$
Disallow: /*.cgi$
Disallow: /*.xhtml$
Disallow: /*.php*
Disallow: */trackback*
Disallow: /*?*
Disallow: /z/
Disallow: /wp-*
Allow: /wp-content/uploads/
#允许谷歌的图片蜘蛛抓取图片
User-agent: Googlebot-Image
Allow: /*
新朋友来访 欢迎常来坐坐
比较麻烦,默认就好了,呵呵。
不需要限制额
这东西写不好会带来一些麻烦
过来学习了..
不是很懂
学习啦,我的部分就是参考博主的写法
你这个限制的够多的。直接Disallow:/WP-
不就限制所有WP开头的文件了?
那个冒号和空格之间需不需要空格捏?
@阿旭奇意网
那如果某篇文章的别名是“wp-”开头呢?不就被误屏蔽了?
那就是说。除了会限制所有WP开头的文件和文件夹以外,还会限制所有与WP开头的文章?
@阿旭奇意网
当然~