摘要和理解:
- 建立一个搜索引擎大致需要做这样几件事:自动下载尽可能多的网页;建立快速有效地索引;根据相关性对网页进行公平准确的排序。
- 所有的搜索产品都提炼成下载、索引、排序这三种基本服务。这就是搜索的“道”。所有的搜索服务都可以在这三个基本服务的基础上很快实现,这就是搜索的“术”。
- 索引
图书馆的索引卡片
自动把用户的查询语句转换成布尔运算的算式
最简单的索引结构是用一个很长的的二进制数表示一个关键字是否出现在每篇文献中。
0100100011000001.......
表示第二、第五、第九、第十、第十六篇文献包含这个关键字