错误博客( cuowu.com )发布于 2019-06-10 18:55:02
信息检索随机存取
信息检索随机存取教程。
要对文档进行快速检索,以便对一个搜索的结果生成网页摘要,文档存储需要能够支持随机存取。然而,与关系数据库相比,只需要一个相对简单的查找标准。我们需要一个数据库,使我们能够根据URL得到文档的内容。
最简单的处理这种查找的方式是使用散列。对URL使用散列函数可以得到一个数值,利用这个数值可以找到所需要的数据。对于小规模的系统,散列函数可以告诉我们哪一个文件含有这个文档。对于大规模的系统,散列函数可以告诉我们哪一个服务器含有这个文档。一旦文档的位置限定在一个单独的文件中时,就可以使用B-Tree或者排序的数据结构,找到文档数据在文件中的偏移位置。
2020年错误博客亲测项目系列
- 亲测看新闻视频赚钱项目 - 长期稳定
- 亲测币圈项目 - 零撸暴利

发表评论