加载中
搜索引擎(0xFE)--- 用机器学习再谈排序

今天,说说如何用机器学习的办法来进行排序(商品本身的属性排序)。

推荐系统技术之文本相似性计算(二)

主题模型是目前也比较流行的文本分类的方法了,他主要解决的是文章的分类问题,就是这篇文章属于哪个类别

2017/01/16 11:43
28
推荐系统技术之文本相似性计算(一)

推荐系统分为两种,一种是基于用户的,根据某个用户的特性推荐一些东西,还有一种是根据内容,推荐一些相似的内容,或者是两种的结合,任何推荐系统,仔细分析下来,都属于这两种情况的组合。

2017/01/16 11:41
149
坑系列 --- 时间和空间的平衡

这是坑系列的最后一弹了,这篇文章非常长,希望你能看完,要是看完有很酣畅的感觉就最好了。

坑系列 —— 缓存+哈希=高并发?

今天继续坑系列,高可用已经讲过了,当前互联网时代,怎么少的了高并发呢?高并发和高可用一样, 已经变成各个系统的标配了,如果你的系统QPS没有个大几千上万,都不好意思跟人打招呼,虽然可...

坑系列 --- 高可用架构的银弹

之前那篇文章写出来以后我就觉得会有很多不同的意见,哈哈,那只代表我个人的意见啊,欢迎讨论。

坑系列 --- 重构过程中的过度设计

这个系列是坑系列,会说一些在系统设计,系统架构上的坑,这些都是我想到哪说到哪,有像这篇一样比较宏观的坑,后面的文章也会有到具体技术细节的(比如某个函数,某个系统调用)坑,总之,到...

2016/12/08 00:35
12
用Golang写一个搜索引擎(0x09)— 数据增,删,改

今天的文章会比较短,很快就能看完。 按照步骤,说完段层以后,应该就开始涉及到索引层了,但我想说的是一个分布式的搜索引擎,所以除了索引层以外,还有个分片层,这两个概念是紧密联系在一...

2016/05/09 17:48
42
用Golang写一个搜索引擎(0x08)

我觉得这个标题应该改改了,我写下来其实是告诉大家怎么写一个搜索引擎,并没有涉及太多的Golang的东西,我觉得这样也挺好,熟悉了原理,用什么实现其实并不重要了,而且说说原理比说代码更实...

用Golang写一个搜索引擎(0xFF)

今天这一篇的序号是0xFF,算是外篇吧,和Golang没什么关系,和代码也没什么关系,今天说说搜索引擎的排序吧。

2016/04/27 14:47
39
用Golang写一个搜索引擎(0x07)

文章中的奇怪词语和用空格隔开的是oschina识别的敏感词,彻底醉了。。。。 最近各种技术盛会太多,朋友圈各种刷屏,有厂商发的各种广告,有讲师发的各种自拍,各种参会的朋友们各种自拍,好不...

2016/04/26 01:51
1K
用Golang写一个搜索引擎(0x06)

不知不觉写到第七篇了,按这个节奏,估计得写到15到20篇左右才能写完,希望自己能坚持下去,之前写代码的时候很多东西并没有想得那么细致,现在每写一篇文章还要查一些资料,确保文章的准确性...

2016/04/26 01:40
19
用Golang写一个搜索引擎(0x05)

上面我们已经说过了一些倒排索引的东西,并且也知道了如何来实现一个倒排索引完成检索功能,那么检索完了以后如何排序呢,这一篇简单的说一下倒排索引的文本相关性排序,因为排序实在是太复杂...

2016/04/26 01:36
10
用Golang写一个搜索引擎 (0x04)

本篇较长较枯燥,请保持耐心看完。 前面两章介绍了一下倒排索引以及倒排索引字典的两种存储结构,分别是跳跃表和哈希表,本篇我们介绍另一种数据结构,他也被大量使用在信息检索领域,我在g...

2016/04/26 01:34
22
用Golang写一个搜索引擎(0x03)

前面已经说了倒排索引的基本原理了,原理非常简单,也很好理解,关键是如何设计第二个倒排表,倒排表的第二列也很好设计,第一列就是关键了,为了满足快速查找的性能,设计第一列的结构,我们...

2016/04/26 01:28
11
用Golang写一个搜索引擎(0x02)

这一篇,我们来说说搜索引擎最核心的技术,倒排索引技术,倒排索引可能需要分成几篇文章才说得完,我们先会说说倒排索引的技术原理,然后会讲讲怎么用一些数据结构和算法来实现一个倒排索引,...

2016/04/26 01:24
23
文本相似度计算-JaccardSimilarity和哈希签名函数

在目前这个信息过载的星球上,文本的相似度计算应用前景还是比较广泛的,他可以让人们过滤掉很多相似的新闻,比如在搜索引擎上,相似度太高的页面,只需要展示一个就行了,还有就是,考试的时...

2016/04/26 01:24
669
一种没有语料字典的分词方法

前几天在网上闲逛,看到一篇美文,说的是怎么在没有语料库的情况下从文本中提取中文词汇,理论部分讲得比较多,但都还是很浅显易懂的,其中涉及一部分信息论的理论,其实只要大学开过信息论这...

2016/04/26 01:24
379
从零开始,写一个搜索引擎 (0x01)

第零部分我们已经列了一个提纲了,这一篇文章开始要详细说说了。 搜索引擎基本概念 在说搜索引擎架构分层之前,我们先确定几个搜索引擎的概念。 文档,搜索引擎的基本数据单元,比如一张网页...

2016/04/26 01:24
185

没有更多内容

加载失败,请刷新页面

返回顶部
顶部