文档章节

《数学之美》—简单之美-布尔代数和搜索引擎

小木fan
 小木fan
发布于 2017/08/04 11:07
字数 245
阅读 0
收藏 0

摘要和理解:

  1. 建立一个搜索引擎大致需要做这样几件事:自动下载尽可能多的网页;建立快速有效地索引;根据相关性对网页进行公平准确的排序。
  2. 所有的搜索产品都提炼成下载索引排序这三种基本服务。这就是搜索的“道”。所有的搜索服务都可以在这三个基本服务的基础上很快实现,这就是搜索的“术”。
  3. 索引

        图书馆的索引卡片

        自动把用户的查询语句转换成布尔运算的算式

        最简单的索引结构是用一个很长的的二进制数表示一个关键字是否出现在每篇文献中。

        0100100011000001.......

        表示第二、第五、第九、第十、第十六篇文献包含这个关键字

 

 

 

© 著作权归作者所有

共有 人打赏支持
小木fan
粉丝 1
博文 52
码字总数 13186
作品 0
绵阳
私信 提问
大数据、机器学习及人工智能必读书目——《数学之美》

  计分析、机器学习即人工智能必读书目系列之数学之美      我们已经进入了全新的数据时代,大数据、云计算、物联网、机器学习、人工智能等等一系列技术纷至沓来,数据的管理和应用已经...

爱编程爱统计
2017/09/09
0
0
2018-10-22-今日得到-《数学之美》

今天分享的主题来自得到的每天听本书系列之《数学之美》 关于作者 吴军,得到App专栏《吴军的谷歌方法论》主理人。计算机科学家,硅谷投资人,著名自然语言处理专家和搜索专家。曾先后供职于...

韬声依旧在路上
10/24
0
0
数据挖掘学习图谱

接下来的三个月打算用来攻下数据挖掘这一座大山。可以算是从零基础开始入门,希望我的课表能给将来的学习者提供一些学习上的捷径。 1. 数学基础 机器学习必要的数学基础主要包括:多元微积分...

李雷岗
2016/11/24
4
0
吴军:Google 中日韩文搜索算法的主要设计者,因《浪潮之巅》享誉业界 | CNCC 2018

雷锋网 AI 科技评论按:作为一位计算机科学家,吴军博士有两个最为人所知的身份,一是他是当前 Google 中日韩文搜索算法的主要设计者,曾一度为 Google 贡献了整个代码库 0.7% 的代码;另一是...

丛末
09/12
0
0
go语言文件汇总

归并排序及go语言实现 堆排序算法及go语言实现 Go语言基础学习(一)变量 【Leetcode】:Counting Bits问题 in Go语言 基于go语言的心跳响应 【Leetcode】:Single Number III问题 in Go语言 ...

d_watson
2016/04/15
127
2

没有更多内容

加载失败,请刷新页面

加载更多

deepin中配置robot framework环境

本文永久更新地址:https://my.oschina.net/bysu/blog/2989005 【若要到岸,请摇船:开源中国 不最醉不龟归】 1.在终端中输入pip,回车,如果提示没有该命令,则先安转pip sudo apt-get inst...

不最醉不龟归
42分钟前
3
0
OSChina 周日乱弹 —— 钱不还,我就当你人不在了

Osc乱弹歌单(2018)请戳(这里) 【今日歌曲】 @莱布妮子 :分享Bigleaf的单曲《小鹿》 《小鹿》- Bigleaf 手机党少年们想听歌,请使劲儿戳(这里) 周日在家做什么? 做手工呀, @poorfis...

小小编辑
今天
136
4
EOS docker开发环境

使用eos docker镜像是部署本地EOS开发环境的最轻松愉快的方法。使用官方提供的eos docker镜像,你可以快速建立一个eos开发环境,可以迅速启动开发节点和钱包服务器、创建账户、编写智能合约....

汇智网教程
今天
21
0
《唐史原来超有趣》的读后感优秀范文3700字

《唐史原来超有趣》的读后感优秀范文3700字: 作者:花若离。我今天分享的内容《唐史原来超有趣》这本书的读后感,我将这本书看了一遍之后就束之高阁了,不过里面的内容一直在在脑海中回放,...

原创小博客
今天
30
0
IC-CAD Methodology知识图谱

CAD (Computer Aided Design),计算机辅助设计,指利用计算机及其图形设备帮助设计人员进行设计工作,这个定义同样可以用来近似描述IC公司CAD工程师这个岗位的工作。 早期IC公司的CAD岗位最初...

李艳青1987
今天
40
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部