文档章节

《数学之美》—简单之美-布尔代数和搜索引擎

小木fan
 小木fan
发布于 2017/08/04 11:07
字数 245
阅读 0
收藏 0
点赞 0
评论 0

摘要和理解:

  1. 建立一个搜索引擎大致需要做这样几件事:自动下载尽可能多的网页;建立快速有效地索引;根据相关性对网页进行公平准确的排序。
  2. 所有的搜索产品都提炼成下载索引排序这三种基本服务。这就是搜索的“道”。所有的搜索服务都可以在这三个基本服务的基础上很快实现,这就是搜索的“术”。
  3. 索引

        图书馆的索引卡片

        自动把用户的查询语句转换成布尔运算的算式

        最简单的索引结构是用一个很长的的二进制数表示一个关键字是否出现在每篇文献中。

        0100100011000001.......

        表示第二、第五、第九、第十、第十六篇文献包含这个关键字

 

 

 

© 著作权归作者所有

共有 人打赏支持
小木fan
粉丝 1
博文 51
码字总数 13186
作品 0
绵阳
大数据、机器学习及人工智能必读书目——《数学之美》

  计分析、机器学习即人工智能必读书目系列之数学之美      我们已经进入了全新的数据时代,大数据、云计算、物联网、机器学习、人工智能等等一系列技术纷至沓来,数据的管理和应用已经...

爱编程爱统计 ⋅ 2017/09/09 ⋅ 0

数学之美 读书笔记

1.1 统计语言模型 香农(Claude Shannon)就提出了用数学的办法处理自然语言。首先成功利用数学方法解决自然语言处理问题的是语音和语言处理大师贾里尼克 (Fred Jelinek)。事实证明,统计语言模...

wzz ⋅ 2014/07/22 ⋅ 0

2012年终碎语,编程之美

一 年又很快过去了,今年从之前的设计师转型到Android程序员。期间也经历了许多的坎坎坷坷,从一个行业到另一个行业的过渡。很多人都觉得设计是需要美学,在自学java/Android期间,越发觉得架...

Patata ⋅ 2013/01/01 ⋅ 0

数据挖掘学习图谱

接下来的三个月打算用来攻下数据挖掘这一座大山。可以算是从零基础开始入门,希望我的课表能给将来的学习者提供一些学习上的捷径。 1. 数学基础 机器学习必要的数学基础主要包括:多元微积分...

李雷岗 ⋅ 2016/11/24 ⋅ 0

go语言文件汇总

归并排序及go语言实现 堆排序算法及go语言实现 Go语言基础学习(一)变量 【Leetcode】:Counting Bits问题 in Go语言 基于go语言的心跳响应 【Leetcode】:Single Number III问题 in Go语言 ...

d_watson ⋅ 2016/04/15 ⋅ 2

MySQL 创建高性能索引-->空间索引(R—Tree),全文索引

MyISAM表支持空间索引 可以用作地理数据存储。和B-Tree索引不同,这类索引无须前缀查询。 可以有效地使用任意维度来组合查询 。必须使用MySQL的GIS相关函数如MBRCONTAINS()等来维护数据。 全...

@ccny ⋅ 2015/11/09 ⋅ 0

【算法】数据结构与算法之美,解剖艺术

Preface   因为最近一直在搞硬件的东西,所以暂时没管自己专业的东西,昨晚一童鞋问到一个网络里面的算法时,突然发现自己的强项,已然不是强项了,于是总结了一下   硬件的东西,其实是...

wbf961127 ⋅ 2017/11/08 ⋅ 0

如何确定网页和查询的相关性

本文分为两部分 搜索关键词权重的科学度量TF-IDF 利用python的工具包计算文本的TF-IDF 1. 搜索关键词权重的科学度量TF-IDF 查询:原子能的应用 首先进行分词:原子能、的、应用 根据直觉知道...

技术mix呢 ⋅ 2017/10/11 ⋅ 0

数学之美札记:文字和语言 vs 数字和信息

数学、文字和自然语言一样,都是信息的载体,他们之间有着天然的联系。语言和数学的产生都是为了同一样目的——记录和传播信息。本文是《数学之美》第一章札记。 1798年,拿破仑远征军中,皮...

Realfighter ⋅ 2015/05/27 ⋅ 0

迅搜全文搜索引擎--XunSearch

迅搜(xunsearch)是采用 C/C++ 基于 xapian 和 scws 开发的全文搜索引擎解决方案,提供 PHP 语言的开发接口。支持海量数据高速检索,功能强大,简单易用! 本项目旨在帮助一般开发者针对既有的...

hightman ⋅ 2011/09/10 ⋅ 5

没有更多内容

加载失败,请刷新页面

加载更多

下一页

linux 安装docker

通过以下命令下载安装docker wget -qO- https://get.docker.com | sh 执行以上命令后输出以下内容说明安装成功,注意红框中的内容,docker安装成功后默认只有root能使用,红框中给出的提示是...

haoyuehong ⋅ 18分钟前 ⋅ 0

482. License Key Formatting - LeetCode

Question 482. License Key Formatting Solution 思路:字符串转化为char数组,从后遍历,如果是大写字母就转化为小写字母,如果是-就忽略,如果遍历了k个字符(排除-)就追加一个-。 Java实现...

yysue ⋅ 37分钟前 ⋅ 0

聊聊spring cloud gateway的LoadBalancerClientFilter

序 本文主要研究一下spring cloud gateway的LoadBalancerClientFilter GatewayLoadBalancerClientAutoConfiguration spring-cloud-gateway-core-2.0.0.RELEASE-sources.jar!/org/springfram......

go4it ⋅ 今天 ⋅ 0

详解:Nginx反代实现Kibana登录认证功能

Kibana 5.5 版后,已不支持认证功能,也就是说,直接打开页面就能管理,想想都不安全,不过官方提供了 X-Pack 认证,但有时间限制。毕竟X-Pack是商业版。 下面我将操作如何使用Nginx反向代理...

问题终结者 ⋅ 今天 ⋅ 0

002、nginx配置虚拟主机

一、nginx配置虚拟主机可分为三种方式,分别为: 1、基于域名的虚拟主机,通过域名来区分虚拟主机——应用:外部网站 2、基于端口的虚拟主机,通过端口来区分虚拟主机——应用:公司内部网站...

北岩 ⋅ 今天 ⋅ 0

shell脚本之死循环写法

最近在学习写shell脚本,在练习if while等流程控制时,突然它们的死循环写法是怎么样的?经过百度与亲测记录如下: for死循环 #! /bin/bashfor ((;;));do date sleep 1d...

hensemlee ⋅ 今天 ⋅ 0

苹果的ARKit2.0有多可怕,看了就知道

序言 ARKit主要由三部分组成: 跟踪(Tracking) 跟踪是ARKit的核心组件之一,其提供了设备在物理世界中的位置与方向信息,并对物体进行跟踪,如人脸。 2.场景理解(Scene Understanding) 场...

_小迷糊 ⋅ 今天 ⋅ 0

5.1 vim介绍 5.2 vim移动光标 5.3 ,5.4vim一般模式下移动光标,复制粘贴

vim命令 vim是vi的一个升级版;vim可以显示文字的颜色 安装vim这一个包vim-enhanced 如果不知道安装包,可以使用 命令下面命令来查看vim命令是那个包安装的。 [root@linux-128 ~]# yum prov...

Linux_老吴 ⋅ 今天 ⋅ 0

vim一般模式

vim 是什么 vim是什么 ? 在之前接触Linux,编辑网卡配置文件的时候我们用过了vi ,vim简单说就是vi的升级版,它跟vi一样是Linux系统中的一个文本编辑工具。 如果系统中没有vim ,需要安装一...

李超小牛子 ⋅ 今天 ⋅ 0

docker实战

构建企业级Docker虚拟化平台实战 重点剖析虚拟化和云计算概念; 分析Docker虚拟化的概念和原理; 从0开始实战Docker虚拟化平台; 基于Docker构建Nginx WEB服务器和CentOS虚拟机; 基于开源监...

寰宇01 ⋅ 今天 ⋅ 0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

返回顶部
顶部