robots.txt10条注意事项与概念197
关于robots.txt文件的10条注意事项:
1、如果未创建robots.txt文件,则代表默认网站所有文件向所有搜索引擎开放爬取。
2、必须命名为:robots.txt,都是小写,robot后面加"s"。
3、robots.txt必须放置在一个站点的根目录下。
通过如https://www.jisuseo.cn/robots.txt 可以成功访问到,则说明本站的放置正确。
4、一般情况下,robots.txt里只写着两个函数:User-agent和 Disallow。
5、空格换行等不能弄错,可复制这个页面并修改为自己的。点击
6、有几个禁止,就得有几个Disallow函数,并分行描述。
7、至少要有一个Disallow函数,如果都允许收录,则写: Disallow:
如果都不允许收录,则写:Disallow: / (注:只是差一个斜杆)。
8、允许有多个User-agent,如果对所有爬取蜘蛛生效,则用“*”星号表示。
9、robtos.txt文件内可以放上Sitemap文件地址,方便告诉搜索引擎Sitemap文件地址。
10、网站运营过程中,可以根据情况对robots.txt文件进行更新,屏蔽一些不要搜索引擎抓取的文件地址。
举例两个常见屏蔽规则:
User-agent: * 星号说明允许所有搜索引擎收录
Disallow: /search.html 说明 https://www.jisuseo.cn/search.html 这个页面禁止搜索引擎抓取。
Disallow: /index.php? 说明类似这样的页面https://www.jisuseo.cn/index.php?search=%E5%A5%BD&action=search&searchcategory=%25 禁止搜索引擎抓取。
robots.txt概念
如果我们网站内有某些特殊的文件不让搜索引擎收录,那怎么办?
答案是:使用一个叫做robots.txt的文件。
robots.txt文件告诉搜索引擎本网站哪些文件是允许搜索引擎蜘蛛抓取,哪些不允许抓取。
搜索引擎蜘蛛访问网站任何文件之前,需先访问robots.txt文件,然后抓取robots.txt文件允许的路径,跳过其禁止的路径。
总结:robots.txt是一个简单的.txt文件,用以告诉搜索引擎哪些网页可以收录,哪些不允许收录。
2022-03-09
上一篇:简单学习SEO基础要求有哪些?
最新文章
![SEO新手必备基础知识[1524字]](https://cdn.shapao.cn/images/text.png)
SEO新手必备基础知识[1524字]
https://www.jisuseo.cn/21564.html
![优化SEO布局[1353字]](https://cdn.shapao.cn/images/text.png)
优化SEO布局[1353字]
https://www.jisuseo.cn/21563.html
![如何优化网站布局来提升SEO排名[1480字]](https://cdn.shapao.cn/images/text.png)
如何优化网站布局来提升SEO排名[1480字]
https://www.jisuseo.cn/21562.html
![如何对新建网站进行SEO优化?[1292字]](https://cdn.shapao.cn/images/text.png)
如何对新建网站进行SEO优化?[1292字]
https://www.jisuseo.cn/21561.html
![如何提高网站访问量?SEO新手入门教程![1264字]](https://cdn.shapao.cn/images/text.png)
如何提高网站访问量?SEO新手入门教程![1264字]
https://www.jisuseo.cn/21560.html
热门文章

油管youtube视频无法打开的原因
https://www.jisuseo.cn/9544.html

站内站的作用和使用技巧
https://www.jisuseo.cn/186.html

百度蜘蛛的鉴别方法
百度真假蜘蛛IP如何识别?判断百度蜘蛛的鉴别方法

常见元标签有哪些?
https://www.jisuseo.cn/385.html

被搜索引擎严重惩罚的网站怎么处理?
https://www.jisuseo.cn/343.html