欢迎来到权重SEO优化网
首页 > SEO优化内容

网站优化的人应该知道Robots

2022-05-14 15:00:00   来源:权重SEO优化网    点击:
作者:admin
      小编今天想分享的是文件优化。做seo.cn/tag/wangzhanyouhua/ target=_blank class=infotextkey>网站优化的人应该知道Robots.txt嗯,我们可以直接与搜索引擎蜘蛛交谈,告诉蜘蛛哪些内容可以捕获,哪些内容不能捕获。这与我们今天要谈论的文件优化有关。  

一、站内优化  

Robot.txt用法详解及robot.txt问题汇总  

(1)为什么设置?Robots.txt?  

在进行seo操作时,我们需要告诉搜索引擎哪些页面重要,哪些页面不重要。蜘蛛可以抓取重要的页面。屏蔽不重要的页面可以减轻网站服务器的负担。  

(2)一些常见的问题和知识点  

蜘蛛在发现一个网站的时候,是抓取网站的Robots.txt文件(当然是官方说的,有时候不遵守);  

建议设置所有网站Robots.txt如果你认为网站上的所有内容都很重要,你可以建立一个空的robots.txt文件;  

(3)在robots.txt网站地图设置在文件中  

你可以在robots.txt中添加网站的地图,告诉蜘蛛网站地图所在的地址。  

(4)Robots.txt的顺序  

蜘蛛协议中,Disallow与Allow这是一个非常重要的问题,如果设置错误,可能会导致抓取错误。  

引擎蜘蛛程序将成功匹配个人Allow或Disallow确定是否访问某个URL,一个例子可以让你更清楚:  

User-agent:*2.Allow:/seojc/bbs3.Disallow:/seojc/在这种情况下,蜘蛛/seojc/bbs但是/seojc/无法捕获目录的文件。这样,蜘蛛就可以访问特定目录的一部分url。  

让我们观察下调位置。  

User-agent:*2.Disallow:/根目录下的文件夹/3.Allow:/seojc/bbs/seojc/如果目录出现在线,则禁止在目录下捕获所有文件,则第二行Allow无效,因为禁止在线捕获seojc目录下的所有文件,bbs目录正好位于seowhy所以匹配不成功。  

(5)Robots.txt路径问题  

蜘蛛协议中,Allow和Disallow后面有两种路径形式,即链接和相对链接。链接是完整的URL形式,相对链接只针对根目录。这是记住。  

(6)斜杠问题  

Disallow:/seojc禁止抓取seoic本目录下的所有文件,如:seojc.1.html、seojc/rmjc.php不允许抓;  

Disallow:/seojc/表示禁止抓取seojc本目录下的文件允许捕获seojc.1.html,但不允许抓取seojc/rmjc.php。

以上就是网站优化的人应该知道Robots的全部内容,

www.pr-seo.cn

权重SEO优化网

您好,请关注上方二维码

回复关键词“SEO诊断”

即可诊断出网站目前实际优化情况!

并根据您的网站情况为您制定最

佳的SEO优化方案!