什么是robots?网站的robots怎么写?
一般来说,网站或多或少都存在一些对排名没意义甚至有害的页面。对于SEO技术站长来说是不希望被搜索引擎检索的。而robots.txt文件则承担了站长这个意愿的表达功能。那,什么是robots?网站的robots怎么写?

什么是robots?当蜘蛛访问网站会优先抓取robots.txt,遵循站长配置的规则不再抓取不利于SEO的内容。
什么是robots?robots.txt文件位置
robots文件往往放置于根目录下
什么是robots?robots.txt文件格式
Disallow:该项的值用于描述不希望被访问的一组URL
Allow:该项的值用于描述希望被访问的一组URL
User-agent:该项的值用于描述搜索引擎robot的名字
例如:
User-Agent:YisouSpider // 配置YisouSpider
Disallow: / // 不允许YisouSpider抓取网站任何内容
User-Agent:* // 配置所有搜索引擎
Allow: / // 允许抓取网站任何内容

更多
Disallow: /abc //禁止抓取含abc目录及子目录的所有页面
注意:有些地方注释为“禁止抓取abc目录及子目录中的内容”百度官方有举例,”Disallow:/help”禁止robot访问/help.html、/helpabc.html、/help/index.html
Disallow: /abc/ //禁止抓取含abc目录的所有页面
百度官方有举例,”Disallow:/help/”则允许robot访问/help.html、/helpabc.html,不能访问/help/index.html。
robots.txt通配符的使用
“*” 匹配0或多个任意字符
“$” 匹配行结束符。
举例:
Disallow: /*?* //禁止抓取网站中所有的动态页面
Disallow: /*.htm$ // 禁止抓取所有以.htm为后缀的URL页面 /abc.htm/index 不匹配
区别于Disallow: /*.htm // /abc.htm/index 也匹配
更多robots.txt,可以参照百度站长站长平台关于robots.txt
什么是robots?网站哪些内容不建议被抓取
对于这个一般取决于内容是否利于SEO的原则。例如,我博客的搜索结果页,没做好优化的tags页都禁止抓取了。而对于企业站来说,如果不打算可以优化公司名称的关键词,关于、联系、企业新闻等一些内容都可以考虑禁止
还有一点值得注意的事,有很多站长反馈说百度不遵循robots.txt协议,抓取不该抓取的内容。思享也感觉不是很靠谱,所以也可以考虑在一些页面设置meta name=”robots”

什么是robots?以上就是相关内容介绍,百度的解释理解起来或许有所偏差,如果有不对,大家可以指正、交流。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 3561739510@qq.com 举报,一经查实,本站将立刻删除。
转载请注明来自专注SEO技术,教程,推广 – 优化,本文标题:《什么是robots?网站的robots怎么写?》
2. 本站不保证所提供所有下载的资源的准确性、安全性和完整性,资源仅供下载学习之用!如有链接无法下载、失效或广告,请联系客服处理,有奖励!
3. 您必须在下载后的24个小时之内,从您的电脑中彻底删除上述内容资源!如用于商业或者非法用途,与本站无关,一切后果请用户自负!
4. 如果您也有好的资源或教程,您可以投稿发布,成功分享后有RB奖励和额外RMB收入!
磊宇堂正在使用的服务器 维护管理由磊宇云服务器提供支持
磊宇堂 » 什么是robots?网站的robots怎么写?
