你不知道的robots文件那些事

2019-10-06 13:10:00 A5创业网 分享

  各种互联网项目,新手可操作,几乎都是0门槛

robots.txt文件,是每一个引擎蜘蛛到你的网站之后要寻找和访问的第一个文件,robots.txt是你对引擎制定的一个如 何索引你的网站的规则。通过该文件,引擎就可以知道在你的网站中哪些文件是可以被索引的,哪些文件是被拒绝索引的。我们就可以很方便地控制引擎索引网站内容了。 在很多网站中,站长们都忽略了使用robots.txt文件。

因为很多站长都认为,自己的网站没有什么秘密可言,而且自己也不太会使用robots.txt的语法,因此一旦写错了会带来更多的麻烦,还不如不用。 其实这样的做法是不对的。如果蜘蛛在某个网站上访问了一个不存在的URL,那么就会记录下一条404信息(网页不存在),而robots.txt作为蜘蛛访问网站的第一个文件,一旦引擎找不到这个文件,也会在它的索引服务器上记录下一条404信息。如果这样的404信息过多,那么引擎蜘蛛就会认为该网站价值较低,从而降低对该网站的“印象分”,这就是我们经常会听到的“降低权重”。

“权重”是一个影响网站在引擎排名中非常重要的因素,如果网站的权重高,那么引擎蜘蛛也会频繁地访问该网站,而且网站排名也好。如果权重低,那么引擎蜘蛛对于网站的访问次数也相应的要少,同时网站排名较差。而网站的权重是由很多条件所积累的,404信息就是很重要的一条,因此不得不重视。 虽然在百度的帮助文件中,有这样的一句话“请注意,仅当您的网站包含不希望被引擎收录的内容时,才需要使用robots.txt文件。如果您希望引擎收录网站上的所有内容,请 勿建立robots.txt文件”。

实际上百度只是担心由于网站管理员不懂得robots.txt语法,导致引擎蜘蛛无法正常抓取网站,才这样写的。建立robots.txt文件还是必需的,哪怕这个robots.txt文件是一个空白的文本文档都可以。因为我们的网站毕竟不是仅仅会被百度收录,同时也会被其他引擎收录,上传一个空白的robots.txt文件,至少不会导致一条404信息的产生。

本文来源:裕顺网络www.ahyushun.com如有转载请注明出处

声明:本站部分资源来源于网络,版权归平台彩票app所有,如作者或来源机构不同意本站转载采用,请通知我们,我们将第一时间删除内容。本站刊载文章出于传递更多信息之目的,所刊文章观点仅代表作者本人观点,并不意味着本站赞同作者观点或证实其描述,其原创性及对文章内容的真实性、完整性、及时性本站亦不作任何保证或承诺,请读者仅作参考。
编辑: