首页 >  SEO >  SEO知识 >  正文

sitemap超详细超实用的教程

 作者:潘某人SEO
1724

Sitemap(即站点地图),常见的是以XML 文件,在其中列出网站中的网址以及关于每个网址的其他元数据(上次更新的时间、更改的频率以及相对于网站上其他网址的重要程度为何等),可以帮助搜索引擎更加全面高效的抓取网站内容,是SEO优化中保证内容收录的重要的手段之一。
Sitemap的配置是非常简单的,但是如果想要获得最大SEO效果,那么Sitemap的制作还是存在很多技巧的,今天为大家总结一份全面详细的sitemap网站地图的保姆级教程,内容又长又实用记得先搜藏。

sitemap的重要性

sitemap对于收录是有着非常重要并且不可替代的作用,比如百度搜索引擎目前的提交方式有:手动提交、API提交、sitemap提交。手动提交和API提交是共用额度的,一般是每日10万条提交额度,但是这两者是不被允许提交相同的链接。
很多站点对于不收录的内容会进行反复提交,有这种行为的要尽快避免,如果站点长期这么操作会降低站点的提交额度,甚至会影响正常的抓取。很多时候提交之后,搜索引擎已经抓取了,但是只是没有建立索引而已。
对于链接的二次抓取应该通过sitemap提交实现,如内容的更新链接的抓取;同时对于一些站点每日内容生成量巨大无法及时手动提交、或者超出额度的时候,那么sitemap提交是最有效的解决途径。

Sitemap支持的格式

Sitemap支持txt和xml文件两种格式,txt格式最为简单,但是无法带任何参数,功能性较差;推荐大家使用xml文件格式sitemap,今天的重点也放在xml格式的网站地图。

  • txt文件格式
https://www.chateach.com
https://www.chateach.com/seo
https://www.chateach.com/it
https://www.chateach.com/news
1
2
3
4

txt文件格式sitemap网站地图的例子就非常简单,如上述所示,将需要被搜索引擎抓取的url(不能出现网址之外的任何信息),每行一个网址保存在txt文件即可,文本文件必需使用 UTF-8 编码或GBK编码。每个文本文件最多可包含 50,000 个网址,并且应小于10MB(10,485,760字节),因为转码问题建议url最好不要包含中文。

  • xml文件格式
<?xml version="1.0" encoding="utf-8"?>
<!-- XML文件需以utf-8编码-->
<urlset>
<!--必填标签-->
    <url>
        <loc>https://www.chateach.com</loc>
        <lastmod>2023-1-1</lastmod>
        <changefreq>daily</changefreq>
        <priority>0.8</priority>
    </url>
</urlset>
1
2
3
4
5
6
7
8
9
10
11

xml文件格式的sitemap如上所示,将需要的被搜索引擎抓取的链接以<url></url>标签遍历到<urlset></urlset>之间即可。下面对立面的标签进行下解释说明:

  • <loc></loc>标签:必填标签,这是具体某一个链接的定义入口,需要抓取的url链接,带上请求头http、https,URL链接地址,长度不得超过256字节。
  • <lastmod></lastmod>标签:可以略的标签,用来指定该链接的最后更新时间,此日期应采用 W3C Datetime 格式,使用 YYYY-MM-DD,例子:“2023-1-1”,如果该链接发布之后基本不更新的可以直接省略这个标签。
  • <changefreq></changefreq>标签:可以略的标签,用于指定页面可能发生更改的频率,允许的值有always、hourly、daily、weekly、monthly、yearly、never,值“always”应当用于描述每次访问时都会改变的文档,而“never”是永远不发生改变,如果网站内容存在时效性会定期更新的建议加上这个标签,并且按照更新频次填写对应值。但搜索引擎不一定会按照定义的更新时间来抓取,但可以为搜索引擎提供一定参考。
  • <priority></priority>标签:可以略的标签,用于指定网址的优先级与您网站上其他网址的优先级相关。有效值范围从 0.0 到 1.0,一个网页的默认优先级为 0.5。此处的权值不影响排名,仅对搜索引擎提供当前链接在站点中的重要度。
<?xml version="1.0" encoding="utf-8"?>
<urlset>
    <url>
        <loc>https://www.chateach.com</loc>
        <lastmod>2023-1-1</lastmod>
        <changefreq>daily</changefreq>
        <priority>1.0</priority>
    </url>
    <url>
        <loc>https://www.chateach.com/seo</loc>
        <lastmod>2023-1-1</lastmod>
        <changefreq>daily</changefreq>
        <priority>1.0</priority>
    </url>
    <url>
        <loc>https://www.chateach.com/it</loc>
        <lastmod>2023-1-1</lastmod>
        <changefreq>daily</changefreq>
        <priority>0.9</priority>
    </url>
    <url>
        <loc>https://www.chateach.com/news</loc>
        <lastmod>2023-1-1</lastmod>
        <changefreq>daily</changefreq>
        <priority>0.8</priority>
    </url>
</urlset>
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27

以上是xml格式sitemap的例子,url排序可以更新内容更新时间倒序排列,对于搜索引擎更加友好,可以更高效地抓取最新的内容。
与txt格式同样xml格式每个文本文件最多可包含 50,000 个网址,且文件大小不得超过 10 MB,因为转码问题建议url最好不要包含中文。如果超出这个数量就需要进行分割成多个文件。并且可以尽量数量少一点,避免对服务器造成压力,同时可以增加搜索引擎抓取sitemap文件时解析的成功率。

Sitemap 进阶版

上述sitemap文件格式可以通用常见的搜索引擎的sitemap,如百度、360、搜狗、谷歌、必应等。但是对于百度搜索引擎的sitemap还有更加高级玩法。根据站点的适配方式不同sitemap的格式也有不同,更加精细的配置sitemap,可以帮助百度搜索引擎更好的抓取各端的内容。
上述sitemap文件格式可以通用常见的搜索引擎的sitemap,如百度、360、搜狗、谷歌、必应等。但是对于百度搜索引擎的sitemap还有更加高级玩法。根据站点的适配方式不同sitemap的格式也有不同,更加精细的配置sitemap,可以帮助百度搜索引擎更好的抓取各端的内容。

适配类型

百度推出了移动Sitemap协议,用于将网址提交给移动搜索收录。百度移动Sitemap协议是在标准Sitemap协议基础上制定的,增加了标签,它有四种取值:

  1. 上述sitemap通用型,也即为PC页
  2. <mobile:mobile/ > :移动网页
  3. <mobile:mobile type=“pc,mobile”/>:自适应网页
  4. <mobile:mobile type=“htmladapt”/>:代码适配
<?xml version="1.0" encoding="utf-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
xmlns:mobile="http://www.baidu.com/schemas/sitemap-mobile/1/">
    <url> 
        <loc>https://www.chateach.com</loc>
        <mobile:mobile type="pc,mobile"/>
        <lastmod>2023-1-1</lastmod>
        <changefreq>daily</changefreq>
        <priority>1.0</priority>
    </url>
    <url>
        <loc>https://www.chateach.com/seo</loc>
        <mobile:mobile type="pc,mobile"/>
        <lastmod>2023-1-1</lastmod>
        <changefreq>daily</changefreq>
        <priority>1.0</priority>
    </url>
    <url>
        <loc>https://www.chateach.com/it</loc>
        <mobile:mobile type="pc,mobile"/>
        <lastmod>2023-1-1</lastmod>
        <changefreq>daily</changefreq>
        <priority>0.9</priority>
    </url>
    <url>
        <loc>https://www.chateach.com/news</loc>
        <mobile:mobile type="pc,mobile"/>
        <lastmod>2023-1-1</lastmod>
        <changefreq>daily</changefreq>
        <priority>0.8</priority>
    </url>
</urlset>
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32

存在移动适配的站点,百度的sitemap可以参照上述例子,与通用网站地图的区别在于<urlset >不同以及每条链接多了<mobile:mobile type=“”>标签,根据站点的适配方式来选择对应的mobile标签。百度搜索引擎的几个适配方式的具体解析可以参照《百度搜索移动适配》。

sitemap文件访问

首先必须确保sitemap文件可以通过url直接访问,不能有任何的跳转或者权限上的限制, 否则会导致搜索引擎无法成功抓取。并且sitemap文件的访问必须保证加载速度及稳定性。
所以如果站点的sitemap数据量比较庞大,建议把sitemap文件给静态化,提升速度同时降低对数据库造成压力,但是当有新内容生成的时候就需要及时的更新;但是如果数量级不大可以通过动态的方式实现。
sitemap的访问地址必须复杂,层级可以适当的复杂先,并且地址命名不能有规律,同时sitemap访问地址对外必须严格保密,除了提交的时候用到,任何地方不得出现。目的是为了防止sitemap地址被他人发现之后对站点的内容进行采集,站点列表页面无序化之后,sitemap的就成了最有效抓取全站内容的途径。

sitemap的提交

sitemap的提交
登录百度搜索资源平台,并且是已经完成当前站点域名的绑定的账号,按上图操作,将sitemap文件地址在此处提交,对于大多数账号每天限制提交10条,累计不超过200条,这个额度会根据站点质量动态调整。
需要注意的是若链接存在跳转关系,请直接提交跳转后链接。如网站换域名,需提交新域名资源;进行HTTPS改造页面,请提交HTTPS资源。
sitemap提交之后,一般在1小时内会开始处理。在以后的调度抓取中,如果您的sitemap支持etag,会更频繁抓取sitemap文件,从而及时发现内容更新;否则抓取的周期会比较长。快的话当日就会进行抓取,最慢的情况在1周左右,并且sitemap抓取之后,搜索引擎会定期进行重新抓取来实现对sitemap网站地图的新内容进行抓取,频次一般是周级,因此站点有新内容生成的时候一定要及时更新sitemap文件。
并且新提交的sitemap文件比定期抓取的时间会更快,也可以把新内容放在一个全新的sitemap文件进行提交。抓取之后删除,把新增的内容归档到对应的sitemap文件中。以上是百度搜索引擎sitemap的提交方式,其余的搜索引擎也是同样的提交方法,但是其他搜索引擎使用通用型的sitemap文件即可。

申明:以上内容仅代表个人观点,仅供学习参考 本站图片来源于站点原创或CC0协议图库站点或已获得VRF授权的图库站点 版权申明:本文为博主原创,未经授权任何个人或组织单位不得复制、转载、摘编以及其它形式的应用! 本文地址:https://www.chateach.com/seo/seozhishi/965sitemap
相关文章
  • 网站优化要不要制作sitemap

    sitemap,网站地图

    网站优化到底需不要要制作sitemap地图呢?sitemap地图的作用又是什么呢?可以提升网站的收录速度吗?

    1450
    • sitemap
    • 网站地图
  • 如何快速的生成sitemap网站地图

    sitemap,如何制作,网站地图

    如何快速的生成sitemap网站地图,我们不能依靠工具来实现,因为逻辑上就走不通,其实通过数据库可以快速有效的生成最有价值的sitemap网站地图。

    1440
    • sitemap
    • 如何制作
    • 网站地图
  • robots文件里该不该加上sitemap地址

    robots里放sitemap

    robots文件里该不该加上sitemap地址,有种说法就是搜索引擎抓取一个网站首先会抓取robots文件,这样把sitemap地址写在robots文件里,这样搜索引擎可以地址直接的对网站地图进行抓取,可以加快链接收录的速度,真相并不是这样

    2037
    • robots里放sitemap
  • 网站地图sitemap的注意事项

    sitemap注意事项,网站地图

    链接提交是站长们每天都会去做的事情,sitemap提交的注意事项,虽然说sitemap提交收录速度不是最快的,但是功能却是最强大的。

    786
    • sitemap注意事项
    • 网站地图
  • ETag提升sitemap抓取速度频次

    ETag,sitemap,链接提交

    sitemap快速更新抓取,ETag提升sitemap抓取速度频次,sitemap是大家提交url的主要途径之一,但是sitemap最大的一个问题就是抓取速度比较慢,

    1010
    • ETag
    • sitemap
    • 链接提交
  • 网站地图sitemap制作与提交详细教程

    网站地图,sitemap

    sitemap如何处理,如何提交,移动动端和pc端是否需要都提交sitemap还是提交一次就可以了呢?那么仔细看完这篇文章,你将不再有这个疑虑。大多数搜索引擎都支持文本格式和xml格式的形式的地图,站点可以根据站点的需求随便选择一种。但是不推荐大家使用文本格式的sitemap方式提交,而是推荐使用xml格式的网站地图。

    1299
    • 网站地图
    • sitemap
  • 如何查看sitemap文件提交配额

    sitemap提交配额

    为了提升站点提交的优质资源的处理效率,搜索资源平台对平台工具的sitemap文件提交配额进行限制,包括“资源提交-普通收录-sitemap提交”、“链接提交-死链提交”。平台将基于站点资源质量和搜索用户喜欢程度综合评估计算站点提交配额,站点不同,提交配额也可能不同。

    746
    • sitemap提交配额
  • 百度几种链接推送方式对比

    百度链接推送

    网站内容如果想要实现快速收录,那么及时的提交新内容链接是直接有效的方法。对于百度搜索来说链接提交方式是比较丰富的,大致分类主动提交、自动提交、手动提交和sitemap提交,那么你知道这四种提交方式有什么区别呢?哪张方式可以更快使内容收录呢?

    1490
    • 百度链接推送
  • 收录工具常见问题解析

    收录工具

    今天讲一下百度收录工具那些事,今年百度搜索引擎的收录工具发生很大的变化。首先自动提交功能下线了,手动提交不再支持未认证站点链接的提交,sitemap不再支持索引型,并且每日提交的数量也有了限制。

    1131
    • 收录工具
  • 你的网站提交配额被回收了吗?

    提交配额,百度seo

    ​2023-9-22百度搜索资源平台发布了关于《关于回收网站提交配额的通知》,将对对非实名账户内站点、低质站点关停sitemap提交能力并调整API每日推送额度。那么站点如何检查站点配额、如何查看配额数量、如何恢复配额。

    839
    • 提交配额
    • 百度seo
  • 百度搜索无法提交链接怎么解决?

    百度搜索,seo,链接提交

    近期大家应该发现了百度搜索资源平台的大多数的站点api提交额度基本都将为的10条,并且无法提交sitemap,为什么会出现这种情况,又应该如何解决链接提交的问题呢?

    1103
    • 百度搜索
    • seo
    • 链接提交
  • 新站突然排名突然消失的原因

    新站排名消失

    新站突然排名突然消失的原因?有一些建过站的站长可能会碰到这样的一种现象,就是自己刚刚建好的一个网站,经过自己努力好不容易有了点,甚至是很不错,但是突然某一天自己的网站竟然毫无征兆的排名全无,

    2167
    • 新站排名消失
  • 做seo优化排名赚钱吗?

    seo优化赚钱吗

    做seo优化排名赚钱吗?seo优化现在还好做吗?搜索引擎是个大市场,如果想在市场里买东西,就要打广告,所以seo优化不会过时,并且会是一个赚钱的行业。不论是以后做什么行业,我都觉得seo都是不可或缺的技术,因为任何行业都需要做广告推广,而seo则是经济实惠的选择。

    1934
    • seo优化赚钱吗
  • 适用各种编程语言网站的百度API链接推送方法

    api推送,百度SEO,curl提交

    主动提交也叫API提交,是通过api接口调用来实现连接的推送,非常的便捷高效。只需简单的几行代码就可以实现秒提交数万的链接,还是非常给力,但是就是需要一定编程能力。不过当你看到这篇文章时,就需要恭喜你得到一种傻瓜式的API提交方法,无需编程开发能力,也无需对网站做任何的修改。

    1711
    • api推送
    • 百度SEO
    • curl提交
  • SEO已死?还是你没搞懂SEO

    SEO已死,

    SEO还值得做吗?9成以上的站点的SEO优化基本不会有很好的效果,基本都是已失败告终,你知道为什么吗?

    650
    • SEO已死
  • 百度如何提交链接,快速收录

    seo链接提交,如何加快收录

    百度的4种链接提交方式的介绍,他们之间的区别,以及各自的特点,对于seo优化用哪一种提交方式可以花更少的时间,但是可以获得更快的收录速度,提高推送效率,增加网站的收录总数。

    7508
    • seo链接提交
    • 如何加快收录
  • 冷门关键词才是大多数网站的出路

    冷门关键词,网站优化

    对于很多站点尤其是新站经常会遇到不收录得问题,或者即使是收录了,排名也非常的不理想很难获得理想的流量,就有了一种SEO优化做不下去,想要放弃的感觉。

    762
    • 冷门关键词
    • 网站优化
  • SEO优化有没有更好的捷径

    seo优化捷径

    SEO优化有没有更好的捷径,SEO优化没有捷径SEO优化营销推行掩盖面广,多渠道,多范畴,多查找引擎渠道展现,一切的事物都是平衡的,多劳多得,没有什么捷径。最多是少走点弯路

    1565
    • seo优化捷径
-- 这已经是底线了,看看别的把! --