非凡资讯

网络营销培训资讯>上海非凡教育网络营销培训班带你学习网站robots.txt文件的用法

上海非凡教育网络营销培训班带你学习网站robots.txt文件的用法
发布日期:2020/3/25 15:17:26    上海非凡教育网络营销培训班 60 分享
上海网络营销师培训
网络营销培训
老师提醒站长同学们如果网站中有不希望搜索引擎收录的内容,可以使用robots.txt文件,它的语法可以禁止或允许URL抓取,则遵守robots.txt协议的就会按你的设置处理,不仅节省带宽和服务器资源,还可以用它这个方法来消除复制网页等。
 
主流搜索引擎都遵守 robots 文件指令,robots.txt 禁止爬取的文件搜索引擎将不访问、不爬取。但要注意的是,被 robots 文件禁止爬取的 URL 还是可能出现在搜索结果中。只要有导入链接指向这个 URL,搜索引擎就知道这个 URL 的存在。虽然不会抓取页面内容,但是可能以下面几种形式显示在搜索结果中:
1、只显示 URL,没有标题、描述,谷歌常这样处理。
2、显示开放目录或雅虎等重要目录收录的标题和描述。
3、导入链接的锚文字显示为标题和描述,百度常这样处理。
 
要想使 URL 完全不出现在搜索结果中,需要使用页面上的 meta robots 标签。
 
robots.txt的生效时间
 
搜索引擎机器人基本会一到两天检查一次robots.txt文件有没有更新。如果更改了规则,禁止了已收录的内容,那么只是以后不再检索了,原来收录的内容可能要最多要数月时间才能删除。
 
书写 robots 文件时需要注意以下细节:
1、一定不要写绝对路径,就是不要带网站域名,用/代替即可。
2、注意 robots 文件中的所有符号都是在英文状态下写的,比如 Disallow: /admin/ 中的:是英文状态下的。
3、注意空格,例如 Disallow: /admin/ 中:后面紧跟着一个空格。
4、注意大小写,例如 Disallow: /admin/ 中 Disallow 的D是大写的。
5、robots 是有生效时间的,是由百度决定的,几天或者两个月以内,所以一定不要随便屏蔽整站。
6、还有一点要弄清楚,Disallow: /help 的意思是禁止蜘蛛访问 /help.html、/helpabc.html、/help/index.html 等所有带 help 的文件及文件夹;Disallow:/help/ 则是禁止蜘蛛访问 /help/index.html 这种形式的路径,允许访问 /help.html、/helpabc.html。
上海网络营销培训学校

本文来源:网络。整理:网络营销培训学校。更多资讯【请关注微信号:feifanxueyuan】(版权声明:推送文章和图片我们都会注明作者和来源,除非无法确认。部分文章和图片推送时未能与原作者取得联系,若涉及版权,烦请原作者联系小编更正,谢谢!)
相关文章:
上海常熟路网络营销大师培训机构有哪些
上海漕河泾网络营销师培训班多少钱,学完网络营销达到这些技能能力
上海宜山路新媒体运营培训学校哪个好,新媒体营销优势有哪些
上海闵行网络营销师培训班多少钱,网络营销主要优势有哪些
上海莘庄网络营销培训中心哪家好,网络营销基本职能有哪些
免费试听热门课程
在线客服
免费试听
最新活动
学费查询
开班查询
就业薪资