北京SEO优化

小楠老师
北京SEO优化学习网

有效索引讲解

    有效索引和缓存机制现在百度抓取到本地并进行索引的网页已经以千亿计,如果每一个用户提交查询时,百度搜索从这几千亿个网页中进行检索,相信不论百度的服务器集群多么牛,都不能快速响应每天这么多网友的搜索查询。即使勉强能够应付用户的搜索,反应速度和效率也会非常低下。既为了节省资源又为了提升响应速度,搜索引擎一般会引入有效索引和缓存模块。


    何为有效索引


    面对如此巨大数量的网页,任何一个常规关键词都可能匹配出几万、几十万甚至上亿的网页。但是大部分用户一般都只浏览搜索结果的前三页,这样搜索引擎就没有必要每次搜索时都对全部的索引文件进行检索,只需要对一个适当数量范围内的索引文件进行检索就可以了。并且搜索引擎一般不会把检索到的所有相关网页都呈现给用户,而只是呈现部分结果,比如,百度最多呈现760个结果,Google最多呈现1000个结果。所以搜索引擎只要建立一个能够满足大众搜索请求的小范围网页索引集合也就是有效索引就可以了。


    稍微有过SEO经验的朋友应该就有这种经验:一个新网站的网页,搜索网页的URL发现百度是收录的,但是搜索网页包含网站品牌词的Title却搜索不到。对于老网站来说这是降权的现象,对于新网站来说就是这个新网页的权重比较低,并没有参与排名计算。例如在百度中搜索,我们搜索某一篇原创点评的URL,,百度已经收录了。但是直接搜索该页面的Title时,在百度搜索结果中却找不到这个页面,并且为了使得这个搜索词和网页建立唯一的对应关系,搜索词为网页的Title而不只是文章标题,。理论上全互联网只有这一个网页最符合搜索请求,百度既然已经索引,那么就应该在搜索结果第一的位置呈现出来,但是百度并没有这么做。


    百度搜索URL和百度搜索网页Title如果百度是在已索引的全部文件中进行检索,肯定就会把这个网页呈现出来了(权重正常的网站都可以)。搜索Title时,百度并没有呈现出这个网页,代表这个网页并没有在百度的有效索引库中。出现这种情况一般是两种原因:该网页的权重太低,或者该网站已被降权。有很多网站的首页都是这种情况,直接搜索域名是有收录的,如果只是搜索目标关键词却没有排名,那可能是算法微调或更新。但是如果搜索几乎是独一无二的Title都找不到网站,那就要小心了,可能是被降权了,或者是降权的前兆。这个例子就体现出了搜索引擎拥有“有效索引”的模块,但是搜索引擎内部可能不叫有效索引,可能是叫“一级索引数据”“初始子集”之类的名字。


    从这里也可以看出搜索引擎的“有效索引”应该是和网页权重挂钩的,有效索引库中是权重正常参与搜索排名的网页,其他低权重的网页可能就被列入了“无效索引”或“快照库”中,以备他用。当然在真实的大型搜索引擎中的索引库级别肯定不会只有“有效”和“无效”索引库两个级别,而是有一个多级别并伴随很复杂算法的索引系统。另外,也有可能搜索引擎并没有对索引进行明确分类,而是搜索用户只需要一小部分网页,搜索引擎只需要从整个索引库中抽取按照重要程度排序后比较靠前的一些网页来进行检索、排序和呈现就可以了,也就是说有些网页没有参与到排序并不是一定被归为“无效索引”,而只是暂时权重不是很高,两者还是有本质区别的。


    在SEO工作中,提升网站和网页的权重是一个很重要的工作,并且提升网站的有效收录也是一个很重要的工作方向。这里的“有效收录”指的是在搜索引擎中不仅仅搜索内容标题和网页Title有排名,搜索网页所涉及的关键词也会有相关排名,并且可以带来搜索流量的网页。


提交反馈或者评论清添加老师QQ:3384634250
特别声明:文章摘自网络或由作者自行整理;本文仅供交流学习,,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。若无意侵犯到您的知识产权作品或损害了您的利益,烦请发送邮件与我们取得联系3384634250@qq.com,我们会及时修改或删除。
cache
Processed in 0.008510 Second.