错误博客( cuowu.com )发布于 2019-06-10 18:55:02

信息检索随机存取

信息检索随机存取教程。

要对文档进行快速检索,以便对一个搜索的结果生成网页摘要,文档存储需要能够支持随机存取。然而,与关系数据库相比,只需要一个相对简单的查找标准。我们需要一个数据库,使我们能够根据URL得到文档的内容。

最简单的处理这种查找的方式是使用散列。对URL使用散列函数可以得到一个数值,利用这个数值可以找到所需要的数据。对于小规模的系统,散列函数可以告诉我们哪一个文件含有这个文档。对于大规模的系统,散列函数可以告诉我们哪一个服务器含有这个文档。一旦文档的位置限定在一个单独的文件中时,就可以使用B-Tree或者排序的数据结构,找到文档数据在文件中的偏移位置。


2020年错误博客亲测项目系列

错误教程( cuowu.com )专注网推培训、SEO培训和网赚培训,微信/电话:13722793092

关注微信公众号:第一时间获得错误博客最新教程,让我们一起成长!

公众号二维码