百度Sitemap支持哪些格式
百度Sitemap支持哪些格式
百度Sitemap协议支持三种格式:文本格式xml格式、Sitemap索引格式可根据自身情况选择任何格式组织sitemap。具体格式说明及示例如下:
txt文本格式
在一个txt文本列出了需要向百度提交的链接地址txt通过站长平台提交文本文件
- http://www.example.com/repaste/101562698_5230191316.html
- http://www.example.com/repaste/101586283_5230215075.html
- http://www.example.com/repaste/101639435_5230310576.html
本文件应遵循以下指南:
- 每行文本文件必须有一个网站。网站上没有换行。
- 除网站列表外不得包含任何信息。
- 你必须写一个完整的网站,包括 http。
- 每个文本文件最多可以包含 50,000 网站应小于10MB(10、485、760字节)。如果网站包含的网站超过了 50,000 将列表分成多个文本文件,然后分别添加每个文件。
- 需要使用文本文件 UTF-8 编码或GBK编码。
xml格式
单个xml数据格式如下:
- <?xml?version="1.0"?encoding="utf-8"?>
- <!--?XML文件需以utf-8编码-->
- <urlset>
- <!--必填标签-->
- ???<url>
- ???<!--必须填写标签,这是特定链接的定义入口,每个数据都应该使用<url>和</url>包含在里面是必要的-->
- ???<loc>http://https://www.4xseo.com/sitemap.html</loc>
- ???<!--必填,URL链接地址的长度不得超过256字节-->
- ???<lastmod>2009-12-14</lastmod>
- ???<!--该标签可用于指定链接的最终更新时间-->
- ???<changefreq>daily</changefreq>
- ???<!--不能提交标签,用这个标签告诉链接可能出现的更新频率-->
- ???<priority>0.8</priority>
- ???<!--该标签可用于指定该链接相对于其他链接的优先权比,而无需提交该标签0.0-1.0之间-->
- ???</url>
- ???<url>
- ???<loc>http://https://www.4xseo.com/blog/476/</loc>
- ???<lastmod>2010-05-01</lastmod>
- ???<changefreq>daily</changefreq>
- ???<priority>0.8</priority>
- ???</url>
- </urlset>
上述Sitemap向百度提交一个url:https://www.4xseo.com/sitemap.html
若有多条url,列出上述格式重复之间的所有片段URL地址,打包到一个xml向站长平台提交文件。
Sitemap索引格式
如需大量提交sitemap可以列出文件sitemap在索引文件中,然后提交索引文件。您不需要单独提交每个文件。
- <?xml?version="1.0"?encoding="utf-8"?>
- <!--?XML文件需以utf-8编码-->
- <sitemapindex>
- <!--必填,以?<sitemapindex>?以开始标记为开始,以开始标记为开始</sitemapindex>?结束标记为结束-->
- ???<sitemap>
- ???<!--必填,以<sitemap>提交一个标签sitemap文件-->
- ???<loc>http://example.com/ext/xmlsitemap/add/201201/index_20120106.xml</loc>
- ???<!--必填,识别sitemap的位置-->
- ???<lastmod>2009-12-14</lastmod>
- ???<!--选填,识别相对sitemap修改文件的时间-->
- ???</sitemap>
- ???<!--必填,封闭标签-->
- </sitemapindex>
- <!--必填,封闭标签-->
有多个Sitemap,列出上述格式重复之间的所有片段Sitemap向站长平台提交地址。
创建Sitemap有哪些注意事项?
第一,一个Sitemap文件中包含的网站不得超过 5 文件大小不得超过一万份, 10 MB。如果您的Sitemap如果超过这些限值,请将其分个小的Sitemap。这些限制有助于确保您的网络服务器不会因为提供大文件而超载。
第二,一个网站支持提交sitemap文件数量必须小于5万份,超过5万份将不再处理,并显示链接数超提示。
第三,如果验证了网站的主域,Sitemap该文件可以包含网站主域下的所有网站。
如何提交Sitemap
第一步是制作需要提交的网页列表Sitemap请阅读百度文件格式Sitemap协议支持哪些格式?
第二步,将Sitemap文件放在网站目录下。例如,您的网站是example.com,你做了一个sitemap_example.xml的Sitemap文件,将sitemap_example.xml上传至网站根目录即example.com/sitemap_example.xml
第三步是登录百度站长平台,确保提交Sitemap数据网站已验证归属。
第四步,进入Sitemap工具,点击添加新数据URL填写抓取周期和列表Sitemap文件地址
最后,提交后,可以Sitemap在列表中看到提交Sitemap文件,如果Sitemap文件中有新的网站链接。选择文件后,点击更新选项,即提交更新的网站链接。
什么是移动Sitemap协议,如何提交移动Sitemap协议
百度推出了移动Sitemap该协议用于将网站提交给移动搜索。百度移动Sitemap协议是标准Sitemap在协议的基础上,增加了标签,它有四个值:
- <mobile:mobile/>?:移动网页
- <mobile:mobile?type="mobile"/>?:移动网页
- <mobile:mobile?type="pc,mobile"/>:自适应网页
- <mobile:mobile?type="htmladapt"/>:代码适配
无上述标签表示为PC网页
下面的例子相当于向百度移动搜索提交了一个移动网页:http://m.example.com/index.html,向PC搜索提交了一个传统的网页:http://www.example.com/index.html,同时向移动搜索和PC搜索提交了一个自适配的网页http://www.example.com/autoadapt.html:
- <?xml?version="1.0"?encoding="UTF-8"??>
- <urlset?xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
- xmlns:mobile="http://www.baidu.com/schemas/sitemap-mobile/1/">
- <url>
- <loc>http://m.example.com/index.html</loc>
- <mobile:mobile?type="mobile"/>
- <lastmod>2009-12-14</lastmod>
- <changefreq>daily</changefreq>
- <priority>0.8</priority>
- </url>
- <url>
- <loc>http://www.example.com/index.html</loc>
- <lastmod>2009-12-14</lastmod>
- <changefreq>daily</changefreq>
- <priority>0.8</priority>
- </url>
- <url>
- <loc>http://www.example.com/autoadapt.html</loc>
- <mobile:mobile?type="pc,mobile"/>
- <lastmod>2009-12-14</lastmod>
- <changefreq>daily</changefreq>
- <priority>0.8</priority>
- </url>
- <url>
- <loc>http://www.example.com/htmladapt.html</loc>
- <mobile:mobile?type="htmladapt"/>
- <lastmod>2009-12-14</lastmod>
- <changefreq>daily</changefreq>
- <priority>0.8</priority>
- </url>
- </urlset>
按照移动Sitemap协议做好Sitemap后,在Sitemap点击工具添加新数据提交,并提交普通数据Sitemap方式一致。
提交时填写的周期是什么意思?
百度Spider会参考设置周期抓取Sitemap请根据文件Sitemap更新文件内容(例如添加新文件)url)设置。请注意若url不变而仅是url相应的页面内容更新(如论坛帖子页面有新的回复),不在此更新范围内。Sitemap该工具不能解决页面更新问题。
Sitemap百度提交后能处理多久?
Sitemap数据提交后,百度一般会在1小时内开始处理。在以后的调度抓取中,如果你sitemap支持etag,我们会更频繁地抓取sitemap文件,以便及时发现内容更新;否则,抓取周期会更长。
提交的Sitemap百度会抓并收录吗?
百度不能保证所有提交的数据都会被捕获和收录。是否包含与页面质量有关。
我可以压缩我的 Sitemap 它们是否需要使用? gzip 压缩?
是的。请使用 gzip 压缩 Sitemap。不管压缩与否,Sitemap 应该小于 10MB(10、485、759字节)。
XML格式的 Sitemap 中,“priority提示会影响我的网页在搜索结果中的排名吗?
不会。Sitemap 中的“priority该提示仅表明该网站比您自己网站上的其他网站更重要,不会影响网页在搜索结果中的排名。
网址在 Sitemap 中间的位置会影响它的使用吗?
不,网站在 Sitemap 中间的位置不会影响百度的识别或使用。
Sitemap中提交的url能否包含中文?
建议不要包含中文,因为转码问题。
URL列表—XML格式及规范说明:
标签名称 | 标签说明 | 标签类型 | 标签限制 | 可选/必选 | 举例 |
urlset | |||||
url | url标记每个信息的开始和结束 | / | / | 可选 最多出现50000次 | |
url | |||||
loc | 该数据的存储地址 | 任意URL | 一个字符的最小长度 最大长度为256个字符 符合正则表达式(http://)(. ) | 必选 | http://www.baidu.com/ |
lastmod | 指数据的最新更新时间 | 日期或日期时间 | 格式为:YYYY-MM-DD[Thh:mm:ss], T可以在日期和时间之间分隔,只能提供部分日期 | 可选 | 2013-01-01 |
changefreq | 指本条数据的更新频率 | 字符串 | 有效值为: always、hourly、daily、weekly、monthly、yearly、never | 可选 | always |
priority | 用于指定该链接相对于其他链接的优先权比值,该值为0.0-1.0之间 | 小数 | 大于等于0.0 小于等于1.0 | 可选 | 1.0 |
XML格式举例
- <?xml?version="1.0"?encoding="UTF-8"?>
- <urlset>
- <!--?urlset,urlset至少用来标记整个文档的开头1最多出现次1次?-->
- ???<url>
- ???<!--?url,url标记每个信息的开始和结束,至少出现0最多出现次50000次?-->
- ???<loc>http://www.baidu.com/</loc>
- ???<!--?loc,该数据的存储地址至少出现1最多出现次1次,类型为URL地址,最小长度1最大长度的字符256一个字符必须符合正则表达式(http://)(. )?-->
- ???<lastmod>2013-01-01</lastmod>
- ???<!--?lastmod,指数据的最新更新时间,至少出现0次?最多出现1第二,类型为日期或日期,格式为YYYY-MM-DD日期或格式为YYYY-MM-DDThh:mm:ss日期时间(请注意日期和时间之间的T”分隔)?-->
- ???<changefreq>always</changefreq>
- ???<!--?changefreq,指数据的更新频率,至少出现0最多出现次1类型为字符串,有效值为:always、hourly、daily、weekly、monthly、yearly、never?-->
- ???<priority>1.0</priority>
- ???<!--?priority,该值用于指定该链接相对于其他链接的优先权比0.0-1.0至少在两者之间0最多出现次1类型为小数,最小值为(含)0.0?最大值为(含)1.0?-->
- ???</url>
- </urlset>
摘自:http://zhanzhang.baidu.com/site/format
全文转载:百度地图XML格式及规范说明全攻略。
以上就是百度Sitemap支持哪些格式的全部内容,