信息检索教程

本套信息检索教程由错误教程网( www.cuowu.com )转载至书籍《搜索引擎-信息检索实战》,是一套非常适合初学者系统了解信息检索知识的优质教程。本教程免费提供,并未做用作商业用途,如有侵犯您的权益,请联系我们,以便及时删除。

《搜索引擎和信息检索》主要讲述搜索引擎和信息检索的关系。内容包括:什么是信息索引、重要问题、搜索引擎、搜索工程师等。

一、搜索引擎和信息检索

1.1 信息检索是什么

1.2 信息检索重要问题

1.3 信息检索应用-搜索引擎

1.4 搜索工程师

《搜索引擎的架构》章节主要内容有什么是软件架构、基本的构件、文本采集、文本转换、索引的创建、用户交互、排序、评价、搜索引擎是如何工作的。

二、搜索引擎的架构

2.1 什么是软件架构

2.2 搜索引擎的基本构件

2.3 搜索引擎文本采集

2.4 搜索引擎文本转换

2.5 搜索引擎索引的创建

2.6 搜索引擎用户交互

2.7 搜索引擎索引排序

2.8 搜索引擎评价组件

《信息采集和信息源》章节内容包括:确定搜索的内容、网络信息爬取、抓取网页、网络爬虫、时新性、面向主题的信息采集、深层网络、网站地图、分布式信息采集、文档和电子邮件的信息采集、文档信息源、转换问题、存储文档、使用数据库系统、随机存取、压缩和大规模文件、更新、BigTable、重复检测和去除噪声等。

三、信息采集和信息源

3.1 确定搜索的内容

3.2 网络信息爬取

3.3 信息采集抓取网页

3.4 信息检索网络爬虫

3.5 信息检索时新性

3.6 面向主题的信息采集

3.7 信息检索深层网络

3.8 信息采集网站地图

3.9 分布式信息采集

3.10 文档和电子邮件采集

3.11 文档信息源

3.12 信息检索文本转换问题

3.13 搜索引擎存储文档

3.14 搜索引擎数据库系统

3.15 信息检索随机存取

3.16 压缩和大规模文件

3.17 爬虫与页面更新

3.18 BigTable架构

3.19 信息检索重复检测

3.20 页面去除噪声


2019年互联网最赚钱的项目推荐 - 趣分类

  • 趣分类APP - 一款以垃圾分类主题的区块链项目。只要踏实肯干,均可轻松月入过万!有意者咨询,免费项目指导。

错误教程( cuowu.com )专注网推培训、SEO培训和网赚培训,微信/电话:13722793092

关注微信公众号:第一时间获得错误博客最新教程,让我们一起成长!

公众号二维码