文档章节

信息检索中,索引的本质

翟志军
 翟志军
发布于 2015/06/09 06:55
字数 2020
阅读 3987
收藏 95

如有不正确的或者理解不到位的地方,欢迎斧正。

信息检索问题

首先我们来看问题域。每一种技术产物都是为解决某类问题。不从问题域出发,我们就很难理解为什么它是这样的。就像那些没学过“程序语言”设计的人,只能被程序语言牵着走。

信息检索背后的模型其实很简单:就是从大量的信息中找出需要的信息。这类问题有个更专业的名字:信息检索(Information Retrieval)。生活中,这样的问题数不胜数:

  • 我们怎么能快速地找出某个单词在书中第几页呢?

  • 如果没有搜索引擎和目录,在大型图书馆如何找到我们要的书?

  • 找房人通过