文档章节

《数学之美》—简单之美-布尔代数和搜索引擎

小木fan
 小木fan
发布于 2017/08/04 11:07
字数 245
阅读 1
收藏 0

摘要和理解:

  1. 建立一个搜索引擎大致需要做这样几件事:自动下载尽可能多的网页;建立快速有效地索引;根据相关性对网页进行公平准确的排序。
  2. 所有的搜索产品都提炼成下载索引排序这三种基本服务。这就是搜索的“道”。所有的搜索服务都可以在这三个基本服务的基础上很快实现,这就是搜索的“术”。
  3. 索引

        图书馆的索引卡片

        自动把用户的查询语句转换成布尔运算的算式

        最简单的索引结构是用一个很长的的二进制数表示一个关键字是否出现在每篇文献中。

        0100100011000001.......

        表示第二、第五、第九、第十、第十六篇文献包含这个关键字

 

 

 

© 著作权归作者所有

小木fan
粉丝 1
博文 52
码字总数 13186
作品 0
绵阳
私信 提问
加载中

评论(0)

大数据、机器学习及人工智能必读书目——《数学之美》

  计分析、机器学习即人工智能必读书目系列之数学之美      我们已经进入了全新的数据时代,大数据、云计算、物联网、机器学习、人工智能等等一系列技术纷至沓来,数据的管理和应用已经...

爱编程爱统计
2017/09/09
0
0
2018-10-22-今日得到-《数学之美》

今天分享的主题来自得到的每天听本书系列之《数学之美》 关于作者 吴军,得到App专栏《吴军的谷歌方法论》主理人。计算机科学家,硅谷投资人,著名自然语言处理专家和搜索专家。曾先后供职于...

韬声依旧在路上
2018/10/24
0
0
机器学习算法(优化)之二:期望最大化(EM)算法

EM算法概述 (1)数学之美的作者吴军将EM算法称之为上帝的算法,EM算法也是大家公认的机器学习十大经典算法之一。EM是一种专门用于求解参数极大似然估计的迭代算法,具有良好的收敛性和每次迭...

osc_tnuf49vy
2018/02/01
2
0
数学之美 第1章 文字和语言 vs 数字和信息

参考书籍:《数学之美》 吴军著 语言和数学的产生都是为了同一个目的:记录和传播信息 1. 文字的起源:当语言和词汇积累到一定程度(记不住)的时候,产生了高效记录信息的需求——>文字。 ...

osc_avpo3z9q
2019/01/16
2
0
数据挖掘学习图谱

接下来的三个月打算用来攻下数据挖掘这一座大山。可以算是从零基础开始入门,希望我的课表能给将来的学习者提供一些学习上的捷径。 1. 数学基础 机器学习必要的数学基础主要包括:多元微积分...

李雷岗
2016/11/24
34
0

没有更多内容

加载失败,请刷新页面

加载更多

Python基础-04元组

4.元组     元组的主要特性为: 1.元组在创建之后,具有不可以更改的特性,因此不能直接给元组的元素赋值 2.元组的元素类型可以为任意类型,如字典、字符串、列表等 3.元组常用于在程序的整...

osc_b2jll5m6
21分钟前
19
0
怎么在流程图中插入超链接?迅捷画图带你两步解决!

怎么在流程图中插入超链接?如何在WORD中插入超链接很多人都知道,但是对于陌生的流程图,很多人在进行流程图展示和讲解的时候,都会选择提前将需要的网页打开,然后手动进行更换。 这种手动...

真不莲
21分钟前
12
0
直播中音视频处理的一般流程

数据采集→数据编码→数据传输(流媒体服务器) →解码数据→播放显示 1、数据采集: 摄像机及拾音器收集视频及音频数据,此时得到的为原始数据 涉及技术或协议: 摄像机:CCD、CMOS 拾音器:声...

图玩智能科技
22分钟前
17
0
IntelliJ中的main函数和System.out.println()快捷键

https://blog.csdn.net/shijiebei2009/article/details/44726433

诗书易经
22分钟前
15
0
python 数据可视化实战(1)折线图绘制

  本篇博客新开一个数据分析后的数据可视化的例子讲解,每一篇博客是一个例子。   这节课学习如何绘制一个折线图。题目如下:   代码如下: import matplotlib.pyplot as pltimport m...

osc_xdc1vjza
22分钟前
8
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部