加载中
再谈使用开源软件搭建数据分析平台

三年前,我写了这篇博客使用开源软件快速搭建数据分析平台, 当时收到了许多的反馈,有50个点赞和300+的收藏。到现在我还能收到一些关于dataplay2的问题。在过去的三年,开源社区和新技术的发...

图解机器学习

警告:多图杀猫! 每当提到机器学习,大家总是被其中的各种各样的算法和方法搞晕,觉得无从下手。确实,机器学习的各种套路确实不少,但是如果掌握了正确的路径和方法,其实还是有迹可循的,...

2017/09/28 13:15
4.5K
大数据搜索选开源还是商业软件?ElasticSearch 对比 Splunk

本文就架构,功能,产品线,概念等方面就ElasticSearch和Splunk做了一下全方位的对比,希望能够大家在制定大数据搜索方案的时候有所帮助。 简介 ElasticSearch (1)(2)是一个基于Lucene的...

2017/06/19 16:31
3.1K
使用开源软件快速搭建数据分析平台

本文介绍了如何使用开源软件迅速的搭建一个数据分析平台,包含数据导入,变形,分析,预测,可视化。

2016/03/03 22:38
17.5K
大数据系统数据采集产品的架构分析

任何完整的大数据平台,一般包括以下的几个过程: 数据采集 数据存储 数据处理 数据展现(可视化,报表和监控) 其中,数据采集是所有数据系统必不可少的,随着大数据越来越被重视,数据采集...

2015/10/31 20:32
4.5K
使用Python进行并发编程

让计算机程序并发的运行是一个经常被讨论的话题,今天我想讨论一下Python下的各种并发方式。 并发方式 线程(Thread) 多线程几乎是每一个程序猿在使用每一种语言时都会首先想到用于解决并发...

探索Javascript异步编程

异步编程带来的问题在客户端Javascript中并不明显,但随着服务器端Javascript越来越广的被使用,大量的异步IO操作使得该问题变得明显。许多不同的方法都可以解决这个问题,本文讨论了一些方法...

2014/05/22 12:49
4.3K
Python 与 Javascript 之比较

本文比较了Python和Javascript在概念,语法,类型等方面的差异

刚哥谈架构 (一) 软件架构的定义

“天波易谢,寸暑难留”。转眼在软件行业摸爬滚打已经就近二十年,从事软件架构工作也快十年了。曾子曰:“吾日三省吾身”。人要提高自己,需要对自己犯过的错误进行反省,作为一个老软件工程...

08/18 09:25
0
机器学习模型可解释性实战-预测世界杯当场最佳

笔者在之前的一篇博客《谈谈机器学习模型的可解释性》介绍了机器学习可解释性的基本概念,那么今天我们就来看看如何具体的利用这些可解释的工具来对一个真实的模型进行可解释性的分析。 本文...

08/15 07:02
3
一文读懂微服务监控之分布式追踪

现在越来越多的应用迁移到基于微服务的云原生的架构之上,微服务架构很强大,但是同时也带来了很多的挑战,尤其是如何对应用进行调试,如何监控多个服务间的调用关系和状态。如何有效的对微服...

08/08 05:56
44
谈谈机器学习模型的可解释性

随着AI和机器学习的发展,越来越多的决策会交给自动化的机器学习算法来做。但是当我们把一些非常重要的决定交给机器的时候,我们真的放心么?当波音飞机忽略驾驶员的指令,决定义无反顾的冲向...

07/02 03:01
1K
在浏览器中进行深度学习:TensorFlow.js (十二)异常检测算法

异常检测是机器学习领域常见的应用场景,例如金融领域里的信用卡欺诈,企业安全领域里的非法入侵,IT运维里预测设备的维护时间点等。我们今天就来看看异常检测的基本概念,算法,然后看看如何...

05/29 14:53
1K
在浏览器中进行深度学习:TensorFlow.js (十一)时间序列预测

时间序列是对某一个或者一组变量 x(t) 进行观察测量,将在一系列时刻 t1,t2,⋯,tn 所得到的离散数字组成的序列集合。 时间序列预测的机器学习的一种常见应用,例如预测股票和金融产品价格走势...

在浏览器中进行深度学习:TensorFlow.js (十)构建一个推荐系统

推荐系统是机器学习的一个常见应用场景,它用于预测用户对物品的“评分”或“偏好”。通常推荐系统产生推荐列表的方式通常有两种: 协同过滤以及基于内容推荐,或者基于个性化推荐。协同过滤...

05/07 11:27
306
在浏览器中进行深度学习:TensorFlow.js (九)训练词向量 Word Embedding

词向量,英文名叫Word Embedding,在自然语言处理中,用于抽取语言模型中的特征,简单来说,就是把单词用一个向量来表示。最著名的Word Embedding模型应该是托马斯·米科洛夫(Tomas Mikolov...

03/18 15:41
372
是时候把你的Python2应用迁移到Python3了

到2020年一月1日,Python2.7将不再受到官方维护,小伙伴,程序猿,工程狮们,是时候将你们的Python2迁移到Python3了。因为距这一天只有10个月了! 许多的开源项目已经准备好离python2而去了:...

02/24 14:27
84
自动机器学习简述(AutoML)

为什么需要自动机器学习 对于机器学习的新用户而言,使用机器学习算法的一个主要的障碍就是算法的性能受许多的设计决策影响。随着深度学习的流行,工程师需要选择相应的神经网络架构,训练过...

02/19 02:46
2.6K
重构机器学习算法的知识体系 - 《终极算法》读书笔记

最近有幸从图书馆借阅了Pedro Domingos的《The Master Alogrithm》一书,这本书的中文翻译叫《终极算法》,台湾版本叫《大演算》。英文原版的豆瓣评分是8.4,而中文翻译只有7.2。豆瓣用户对于...

2018/12/20 05:31
1K
在浏览器中进行深度学习:TensorFlow.js (八)生成对抗网络 (GAN)

Generative Adversarial Network 是深度学习中非常有趣的一种方法。GAN最早源自Ian Goodfellow的这篇论文。LeCun对GAN给出了极高的评价: “There are many interesting recent development...

2018/10/18 03:05
334

没有更多内容

加载失败,请刷新页面

返回顶部
顶部