如何衡量百度搜索引擎网页质量的维度?
网页质量是衡量网页满足用户需求的能力,是搜索引擎确定结果排名的重要依据。在网页资源内容与用户需求相关的基础上,内容是否完整、页面是否美观、对用户是否友好、来源是否知名等因素共同决定了网页质量。
对于搜索引擎,向用户呈现的网页质量直接影响最终的搜索效果和用户需求满足;对于大多数站长来说,提高整体网页质量有助于在搜索引擎中获得良好的排名和显示,从而吸引更多的用户和流量。
百度搜索综合用户对不同网页的实际感受,制定了一套评价网页质量的标准。基于这一标准,调整百度搜索的集、排名和显示环境,为高质量网页提供更多的收集和显示机会,抑制一些影响用户体验、欺骗搜索引擎的劣质网页。
目前,只有7%的有7%的网页能够达到高质量的标准。作为一个中国搜索引擎,百度希望从互联网生态的角度与网站管理员合作,建立一个良好的互联网生态系统,更好地为网民服务,更好地发展高质量的内容网站。
测量网页质量的维度
百度搜索引擎在衡量网页质量时,会从以下三个维度综合考虑给出质量评分。这些影响网页质量判断的维度特征将一一介绍:
内容质量
浏览体验
可访问性
访问流畅、内容质量高、浏览体验好的网页质量高;相反,任何维度的问题都会影响网页的整体质量。让我们详细介绍这三个维度。
网页的主要内容是网页的价值,是满足用户需求的前提。百度搜索引擎对网页内容质量的评价主要取决于其主要内容的质量,以及主要内容是否能让用户满意。
百度搜索引擎在判断不同网页的内容价值时,需要注意的点也不同,如:
2、商品页面:是否提供完整、真实的商品信息和有效的购买入口。
3、问答页:是否提供有参考价值的答案。
4、下载页面是否提供下载入口,是否有限制,资源是否有效。
5、文档页面:用户是否可以阅读,是否有权限制。
6、搜索结果页:搜索结果是否与标题有关。
百度搜索引擎考虑网页内容质量的维度很多,重要的是:成本;内容完整;信息真实、有效、安全。让我们举一个例子来感受百度搜索引擎如何对网页的内容质量进行分类。请站长比较网站的页面,从搜索引擎和用户的角度给自己打分:
一、内容质量好:
百度搜索引擎认为内容质量好的网页花费了更多的时间和精力编辑,并倾注了编辑的经验和专业知识;内容清晰、完整、丰富;资源有效、高质量;信息真实有效;安全无毒;对用户没有任何作弊行为和意图。对于这部分网页,百度搜索引擎将提高其在用户面前展示的可能性。
专业医疗机构发布的医疗专题页面内容丰富;
专业工程师术问题的专业工程师发表的专业文章;
在专业视频网站上,播放清晰流畅的正版电影或影视全集页面;
有名B2C在网站上,一个完整有效的商品购买页面;
著名新闻站原创或编辑的热点新闻报道;
二、内容质量:
内容质量中等的网页往往能满足用户需求,但未花费较多时间和精力进行制作编辑,不能体现出编者的经验和专业知识;内容完整但并不丰富;资源有效但质量欠佳;信息虽真实有效但属采集得来;安全无毒;不含作弊行为和意图。在互联网中,中等质量网页其实是一个比较大的数量集合,种类面貌也繁杂多样,百度搜索引擎在评价这类网页时往往还要考虑其它非常多因素。在这里,我们仅部分举例来让各位感受一下:
论坛网站上的普通帖子;
普通问答网页;
无版权信息的普通电影播放页面
收集著名小说网站的盗版小说页面。
三、内容质量差:
百度搜索引擎认为主要内容信息较少,或没有有效信息,信息过期属于内容质量差的网页,对用户没有实质性的帮助,应该减少其展示的机会。同时,如果这类网页在一个网站中的比例太大,也会影响百度搜索引擎对网站的评级,特别是UGC网站、电子商务网站、黄页网站应特别注意过期和无效网页的管理。
已下架的商品页,或已过期的团购页;
招聘、交易页面已过期;
如视频被删除,软件下载后无法使用,资源已经失效。
四、没有内容质量可言:
没有内容质量的网页是指制作成本低、劣质的网页;从其他地方收集的内容在线放置,没有至少编辑和整理;挂木马等病毒;包含作弊或意图;完全不能满足用户的需求,甚至包含欺骗内容的网页。
问答页有问无答,或回答完全不能解决问题;
网站搜索结果页面,但没有给出相关信息
除上述网页外,欺骗用户和搜索引擎的网页在无内容质量的集合中占很高的比例。百度搜索引擎对作弊网页的定义是:不满足用户需求,通过不当手段欺骗用户和搜索引擎获利的网页。目前,这部分网页在互联网上仍然很少,但作弊网页的价值是负面的,对用户非常有害。搜索引擎坚决打击这类网页。
5.测量网页质量的维度-浏览体验
不同质量的网页会给用户带来很大的浏览体验差距,高质量的网页应该是积极的。用户希望看到干净易读的网页,排版混乱,广告过多会影响用户对网页主要内容的获取。在百度搜索引擎网页质量体系中,用户获取网页主要内容的成本与浏览体验成反比,即获取成本越高,浏览体验越低。面对内容质量相似的网页,浏览体验较好的人更容易获得更高的排名,而对于浏览体验较差的网页,百度搜索引擎会降低显示的概率,甚至拒绝包括在内。
影响用户浏览体验的因素有很多。目前,百度搜索引擎主要从内容排版和广告影响两个方面考虑网页。
内容排版
当用户进入网页时,他们看到的是内容排版。排版决定了用户对网页的印象和获取内容的成本。
广告影响
百度搜索引擎了解到,网站的生存和发展需要财政支持,并在网页上放置合法的广告支持态度。网页应以满足用户需求为主题,即主要内容与广告一起满足用户需求,内容优先,广告补充,而不是让广告成为网页的主题。
让我们举一个例子来感受百度搜索引擎如何对网页的浏览体验进行分类。站长可以比较和测试他的网站浏览体验:
1、良好的浏览体验:
排版合理,布局美观,易于阅读和浏览;
内容占据网页的重要地位;
什么是广告可以通过页面标签或页面布局清晰区分;
2、浏览体验差:
页面布局和广告放置影响用户获取主要内容,增加用户获取信息的成本,使用户厌恶。包括但不限于以下情况:
正文内容不换行或不分段,用户阅读困难;
字体与背景颜色相似,难以区分内容;
广告阻挡主要内容;或者在一般分辨率下,第一屏是广告,看不到主要内容;
弹窗广告太多;
影响阅读的浮动广告太多
点击链接时,出现超出预期的弹出窗口;
广告与内容混淆,难以区分;
测量网页质量的维度-可访问性
用户希望快速从搜索引擎获取所需的信息,百度搜索引擎尽可能为用户提供一次性直接获取所有信息的网页结果。百度搜索引擎认为,无法直接获取主要内容的网页对用户不友好,会根据情况调整显示概率。
百度搜索引擎将从正常开放、权限限制和有效性三个方面判断网页的可访问性。对于可以正常访问的网页,可以参与正常排序;对于有权限限制的网页,可以通过其他维度观察;对于无效的网页,显示机制将减少,甚至从数据库中删除。
1、网页可以正常访问
可以直接访问所有主要内容的网页,无权限制。
2、网页有权限制
这类网页有两种:开放权限和获取资源权限
1)打开权限
指打开网页都需要登录权限,没有权限完全无法看到具体内容,普通用户无法获取或获取成本很高,百度搜索引擎会降低其展现机率。不包括以登录为主要功能的网页。
2)获取资源的权限
指获取网页的主要内容,如文档、软件、视频等,需要权限或安装插件才能获得完整的内容。此时将分为三种情况:
提供高质、正版内容的网站,由于内容建设成本很高,尽管查看全文或下载时需要权限或安装插件,但属于用户预期之内,百度搜索引擎也不认为权限行为对用户造成伤害,给予与正常可访问页面相同的对待。
对于一些非高质量、非真实的资源,来自用户转载甚至机器收集,成本低,内容不独特,用户获取资源有权限制——需要用户注册登录或付费查看,百度搜索引擎将根据具体情况决定是否调整显示。
还有一些视频,下载资源页面,也许自己的资源质量还不错,但需要安装非常不受欢迎的插件才能正常访问,比如安装xx百度搜索引擎怀疑大片播放器有恶意倾向。
六、网页失效
它通常是指死链和主要资源无效的网页。百度搜索引擎认为,这部分网页不能提供有价值的信息。如果网站上有太多这样的网页,也会影响百度搜索引擎的含和评级。建议站长设置此类网页,及时登录百度站长平台,使用死链提交工具通知百度搜索引擎。
包括但不限于:
404、403、503等网页;
程序代码报错网页;
被删除的论坛帖子和被删除的视频页面(主要出现在UGC站点)
以上就是如何衡量百度搜索引擎网页质量的维度?的全部内容,