错误博客( cuowu.com )发布于 2019-05-30 11:08:28

网站地图

很多网站底部或顶部会放置1~2个网站地图,一个是为了让用户方面浏览网站,另外一个是为了搜索引擎蜘蛛可以快速并全面抓取网站内容。本小节错误君带来的HTML地图和XML地图。

网站地图分类

网站地图分两种:HTML网站地图和XML网站地图。

HTML网站地图

1)HTML网站地图简介

HTML网站地图主要是方便用户快速对网站的结构和内容进行了解和查询需要的内容。当然,搜索引擎的蜘蛛也可以跟踪HTML网站地图爬行到网站的全部或部分。一般英文为sitemap.html,s为小写。

2)HTML地图用法

一般放在底部或顶部,让用户查找需要的内容会很方便。就好比全站导航一样,一般网站有程序自动生成HTML地图,也可以自行设计。一般是点开是一个页面,里面有很详细的网站导航。

HTML地图

或者是像下图这种鼠标放上去就会显示出来的网站地图的对用户也是非常友好的。

鼠标放上去就会显示出来的网站地图

XML网站地图

1)XML网站地图简介

XML版本的网站地图主要列出需要搜索引擎收录的网页链接,供搜索引擎蜘蛛爬行与抓取,便于更及时的收录。一般写为Sitemap.xml S为大写。

2)XML地图的作用

  • 告知网络爬虫页面优先级;
  • 告诉网络爬虫页面链接;
  • 告诉网络爬虫页面更新时间。

3)XML网站地图写法

XML网站地图由XML标签组成,文本必须为utf8编码,列出一个个需要被网站收录的页面的URL。

标准版本的XML网站代码如下:

<?xml version=”1.0″ encoding=”UTF-8″?>

<urlset xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9”

<url>

<loc>https://www.xxkt.org/3036</loc>

<lastmod>2018-03-19T09:23:34+00:00</lastmod>

<changefreq>hourly</changefreq>

<priority>0.7</priority>

<image:image>

<image:loc>https://www.xxkt.org/wp-content/uploads/2018/03/11-6.jpg</image:loc>

<image:title><![CDATA[11]]></image:title>

</image:image>

</url>

<urlset>

多个要收录的URL,可以在标签内多添加几组<url></url>

<?xml>声明XML格式、XML版本和utf8编码。

<urlset>标签是必须的,声明sitemap版本。

<url>标签是必须的,是下面<loc>标签的母标签。

<loc>标签是必须的,包含这页面的完整URL。

<lastmod>是可选标签,表示页面最后一次更新时间。

<changefreq>是可选标签,代表页面的更新频率。always一直变动;hourly每小时;daily每天;weekly每星期;monthly每月;yearly每年;never从来不。

页面的更新频率对搜索引擎来说只是一个提示,因为搜索引擎不会认为页面的更新频率就是站长自己标识的那样。

<priority>是可选标签,标识URL的相对重要性。范围在0到1.0之间。网站地图中的priority表达的是该页面的优先级,范围是0~1.0之间,一般默认为0.5,1.0表示页面非常重要。

PS:priority是什么意思?priority,是英文中优先、优先权、优先次序以及优先考虑的事。

XML网站地图文件最多可以容纳五万URL,且不能超过10MB。如果多余五万URL或体积大于10MB,就使用网站地图索引文件,分成多个网站地图文件,最多有1000个XML网站地图文件。


2020年错误博客亲测项目系列

错误教程( cuowu.com )专注网推培训、SEO培训和网赚培训,微信/电话:13722793092

关注微信公众号:第一时间获得错误博客最新教程,让我们一起成长!

公众号二维码