错误博客( cuowu.com )发布于 2019-06-10 18:55:02

信息检索随机存取

信息检索随机存取教程。

要对文档进行快速检索,以便对一个搜索的结果生成网页摘要,文档存储需要能够支持随机存取。然而,与关系数据库相比,只需要一个相对简单的查找标准。我们需要一个数据库,使我们能够根据URL得到文档的内容。

最简单的处理这种查找的方式是使用散列。对URL使用散列函数可以得到一个数值,利用这个数值可以找到所需要的数据。对于小规模的系统,散列函数可以告诉我们哪一个文件含有这个文档。对于大规模的系统,散列函数可以告诉我们哪一个服务器含有这个文档。一旦文档的位置限定在一个单独的文件中时,就可以使用B-Tree或者排序的数据结构,找到文档数据在文件中的偏移位置。

随机文章

红动中国(Office曲别针终于要复活了)
小小课堂:百度蜘蛛是什么?抓取页面的工作原理_百度SEO教程
六、社群文化人情味
DNF一把鬼剑士绝版史诗-若不被削弱一个技能秒超时空漩涡
dnf双龙魔影剑多少钱?dnf黑光是什么?剑魂60版本神器
LOL天使姐妹重做预告分析:凯尔改动幅度相对较大
LOL测试服2月12日希维尔加强 劫技能改动上线
地下城与勇士春节副本完美结局打法分享

错误教程( cuowu.com )专注网推培训、SEO培训、抖音培训和网赚培训,微信/电话:13722793092

关注微信公众号:第一时间获得错误博客最新教程,让我们一起成长!

公众号二维码