加载中
使用开源软件快速搭建数据分析平台

本文介绍了如何使用开源软件迅速的搭建一个数据分析平台,包含数据导入,变形,分析,预测,可视化。

2016/03/03 22:38
11.1W
自动机器学习简述(AutoML)

为什么需要自动机器学习 对于机器学习的新用户而言,使用机器学习算法的一个主要的障碍就是算法的性能受许多的设计决策影响。随着深度学习的流行,工程师需要选择相应的神经网络架构,训练过...

2019/02/19 02:46
9.1W
轻松扩展你的机器学习能力 : Kubeflow

提起机器学习,尤其是深度学习,大家可能会对诸如Tensorflow,Pytorch,Caffee的工具耳熟能详。但其实在实际的机器学习的生命周期中,训练模型(上述工具主要解决的问题)只是整个机器学习生...

2018/09/17 02:40
8.2W
在浏览器中进行深度学习:TensorFlow.js (一)基本概念

作为deeplearn.js的继任者,tensoflow.js 支持在浏览器或者nodejs中利用JavaScript来运行深度学习。并且能够支持GPU和现有的Tensorflow的模型。该项目的首页上有几个很酷炫的演示。作为热爱机...

2018/04/06 03:17
6.7W
可用于Clickhouse的五个开源图形客户端

俄罗斯搜索巨头Yandex开发的面向列存的关系型数据库。ClickHouse是过去两年中OLAP领域中非常热门,并于2016年开源。典型的用户包括著名的公司,例如字节,新浪和腾讯。 从DBEngine给出的趋势...

谈谈机器学习模型的部署

随着机器学习的广泛应用,如何高效的把训练好的机器学习的模型部署到生产环境,正在被越来越多的工具所支持。我们今天就来看一看不同的工具是如何解决这个问题的。 上图的过程是一个数据科学...

刚哥谈架构(十三)大数据软件开源版图

开源一词最初是指开源软件(OSS)。开源软件是源代码可以任意获取的计算机软件,任何人都能查看、修改和分发他们认为合适的代码。 开源软件依托同行评审和社区生产,皆以分散、协作的方式开发...

再谈使用开源软件搭建数据分析平台

三年前,我写了这篇博客使用开源软件快速搭建数据分析平台, 当时收到了许多的反馈,有50个点赞和300+的收藏。到现在我还能收到一些关于dataplay2的问题。在过去的三年,开源社区和新技术的发...

刚哥谈架构 (五) 谈谈数据库架构

无论是构建什么样的应用,大都离不开数据。而在应用的架构设计中,如何设计数据库,使用什么类型的数据库,就是一个架构师必须了解的。所有的数据库的共同点都是以某种方式存储数据,以某种接...

2020/02/17 06:12
3.5W
刚哥谈架构 (九) 开源关系型数据库架构

我之前跟大家分享了数据库架构(刚哥谈架构 (五) 谈谈数据库架构),今天我们来讨论一下数据库中最为常见的关系型数据库的架构。 我们把主要的开源关系型数据库分为三类,来分别了解一下它...

Pyflow : 一个基于工作流的编程模型(Flow Based Programing) 工具

Flow Based Programing 是由J. Paul Rodker Morrison在很早以前提出的一种编程范式。 维基百科对FBP的定义如下: In computer programming, flow-based programming (FBP) is a programming...

2018/05/28 05:16
3.2W
图解机器学习

警告:多图杀猫! 每当提到机器学习,大家总是被其中的各种各样的算法和方法搞晕,觉得无从下手。确实,机器学习的各种套路确实不少,但是如果掌握了正确的路径和方法,其实还是有迹可循的,...

2017/09/28 13:15
3W
刚哥谈架构(七)- 为你的应用选择合适的API

架构师的主要活动是做出正确的技术决策。选择何使得API是一项重要的技术决策。那么今天就看看API的选择问题。 应用程序编程接口(API)是一种计算接口,它定义了多个软件中介之间的交互。它定...

2020/06/17 08:04
3W
Python 与 Javascript 之比较

本文比较了Python和Javascript在概念,语法,类型等方面的差异

刚哥谈架构(六)-大数据的文件存储

上一次我们谈到了各种类型的数据库,今天我们来谈谈在大数据,尤其是Hadoop栈下的数据和文件的存储。 我们知道为了解决大数据的存储和处理问题,google最先设计了推出了Map/Reduce的算法,而...

刚哥谈架构 (三)软件架构的道与术

秦孝公在位期间致力于恢复秦国的霸业,他因此颁布著名的求贤令, 商鞅3次游说秦孝公,第一次讲的是尧、舜、禹、汤的帝道。上古时期,百姓安居乐业。秦孝公听着听着睡着了。商鞅离开之后,秦孝...

2019/09/08 07:49
2.3W
Elasticsearch和Clickhouse基本查询对比

Elasticsearch 是一个实时的分布式搜索分析引擎,它的底层是构建在Lucene之上的。简单来说是通过扩展Lucene的搜索能力,使其具有分布式的功能。ES通常会和其它两个开源组件logstash(日志采集...

微前端,将微服务理念扩展到前端开发

由多个可以独立发布功能的团队构建现代Web应用程序的技术,策略和方法。 什么是微前端? “微前端”一词最早于2016年底在ThoughtWorks Technology Radar中提出。它将微服务的概念扩展到了前端...

2021/04/14 14:09
2.2W
机器学习管理平台 MLFlow

最近工作很忙,博客一直都没有更新。抽时间给大家介绍一下Databrick开源的机器学习管理平台-MLFlow。 谈起Databrick,相信即使是不熟悉机器学习和大数据的工程湿们也都有所了解,它由Spark的...

2018/07/21 05:11
2.1W
容器集群管理平台的比较

容器化和微服务是当前最热话题,不久之前,笔者(据说因为现在都不用笔了,“笔者”的称谓已经不合适了,因为输入用键盘,叫“键人”更为合适)参加QCon上海一个微服务监控的Session,场面爆...

没有更多内容

加载失败,请刷新页面

返回顶部
顶部