WordPress大牛也未必知道的Robots.txt优化规范-WordPress主题

摘要:wordpress企业新人站长通常没有听过robots.txt,现在复制到百度搜索一下相关的解决吧,如果你不想复制那大挖…

wordpress企业新人站长通常没有听过robots.txt,现在复制到百度搜索一下相关的解决吧,如果你不想复制那大挖用一句话为您解释一下robots.txt的作用,他的作用就是当搜索引擎进入到你的网站时候,会第一时候检索robots.txt文件。

所以可想而知如果你的站点内没有robots.txt,搜索引擎会多么失望。当搜索蜘蛛未发现robots.txt文件,会随机产生一个404错误日志在服务器上,从而增加服务器的负担,因此robots.txt文件重要程度大家一定不能忽视。那接下来的问题是,它为什么要检索robots.txt文件,robots.txt里面是放了什么内容呢。下面听大挖慢慢全方位的讲解。

在我们建站时WordPress会自动生成一个robots.txt文件,默认在浏览器中输入:http://你的域名/robots.txt,会显示如下内容:

这段代码的意思是告诉搜索引擎不要抓取哪些后台文件文件。

但这是远远不够的,这里大挖分享一段比较完整的WordPress站点robots.txt给大家内容如下,大家可以直接覆盖到文件里自用
里面详情的描述了哪些后台文件不可读

下面分别解释一下各项代码的作用给大家方便理解:

1、Disallow: /wp-admin/、Disallow: /wp-content/和Disallow: /wp-includes/

用于告诉搜索引擎不要抓取后台程序文件页面。

2、Disallow: /*/comment-page-*和Disallow: /*?replytocom=*

禁止搜索引擎抓取评论分页等相关链接。

3、Disallow: /category/*/page/和Disallow: /tag/*/page/

禁止搜索引擎抓取收录分类和标签的分页。

4、Disallow: /*/trackback

禁止搜索引擎抓取收录trackback等垃圾信息

5、Disallow: /feed、Disallow: /*/feed和Disallow: /comments/feed

禁止搜索引擎抓取收录feed链接,feed只用于订阅本站,与搜索引擎无关。

6、Disallow: /?s=*和Disallow: /*/?s=*\

禁止搜索引擎抓取站内搜索结果

7、Disallow: /attachment/

禁止搜索引擎抓取附件页面,比如毫无意义的图片附件页面。

上面只是些基本的写法,当然还有很多,但是对于新手wordpress站长来讲已经够用了。

来源:http://www.wazhuti.com/1169.html

微信公众号
手机浏览(小程序)
0
分享到:
没有账号? 忘记密码?