座机:020-87634691 28996560

广州网站建设公司

更多>>
更多>>
更多>>

搜索引擎面对的挑战

2015-01-30 资讯分类:SEO优化

    总体来说,搜索引擎主要会面对一下几个方面的挑战。
   1.页面抓取需要快而全面
   互联网是一个动态的内容网络,每天有无数页面被更新、创建。无数用户在网站上发布内容、沟通联系。要返回最有用的内容,搜索引擎就要抓取最新的页面。但是由于页面数量巨大,搜索引擎蜘蛛更新一次数据库中的页面要花很多时间。搜索引擎刚诞生时,这个抓取周期往往以几个月来计算。
   2.海量数据存储
   一些大型网站单是一个网站就有百万千万个页面,可以想象网上所有网站的页面加起来是一个什么数据量。搜索引擎蜘蛛抓取页面后,还必须有效存储这些数据,数据结构必须合理,具备极高的扩展性,写入及访问速度要求很高。
    3.索引处理快速有效,具可扩展性
    搜索引擎页面数据抓取和存储后,还要进行索引处理,包括链接关系的计算、正向索引、倒排索引等。由于数据库中页面数量大,进行PR之类的迭代计算也是耗时费力的。要想及时提供相关又及时的搜索结果,仅仅抓取没有用,还必须进行大量索引计算。由于随时都有新数据、新页面加入,因此搜索处理也要具备很好的扩展性。
    4.查询处理快速准确
    查询是普通用户唯一能看到的搜索引擎工作步骤。用户在搜索框输入关键词,单击“搜索”按钮后,通常不到一秒钟就会看到搜索结果。表面最简单的过程,实际上涉及非常复杂的后台处理。在最后的查询阶段,最重要的难题是怎样在不到一秒钟的时间内,快速从几十万、几百万,甚至几千万包含搜索词的页面中,找到最合理、最相关的1000个页面,并且按照相关性、权威性排列。
    5.判断用户意图及人工智能

    搜索引擎目前正在致力于基于用户搜索习惯及历史数据的了解上,判断搜索意图,返回更相关的结果、以后搜索引擎是否能达到人工智能水平,真正了解用户搜索词的意义和目的,让我们拭目以待。


广州网站建设| 广州网站制作| 广州网站建设公司| 广州网站制作公司

浏览量:3700

上一篇:李彦宏超链分析专利

下一篇:什么是SEO