加载中
掌握这五大技能,你就能去应聘数据分析师

数据分析的目的是把隐没在一大批看来杂乱无章的数据中的信息集中、萃取和提炼出来,以找出所研究对象的内在规律。几年前, 数据分析还是一个比较鲜见的职业。而今天,无论各行各业,它无处不在...

现阶段大数据算法的困境是什么?

2013年,美国有一起充满争议的案子,一个因为偷窃罪被判刑的男人把威斯康星法院告了。原因是他被判整整8年有期徒刑,不是因为他的罪行,也不是因为法官的判断,而是因为一个AI(人工智能)认为...

带你从算法原理看推荐策略

推荐算法简介 目前的推荐算法一般分为四大类: 协同过滤推荐算法 基于内容的推荐算法 混合推荐算法 流行度推荐算法 协同过滤的推荐算法 协同过滤推荐算法应该算是一种用的最多的推荐算法,它...

全面解析Bot框架:从机器人平台的区别到知名框架

科技巨头诸如 Facebook 和微软已经大规模发布了 Bot 框架,旨在量产聊天机器人。在 Facebook Messenger 上开发了超过 11,000 个聊天机器人,并且有近 23,000 个开发人员注册了 Facebook 机器...

BATJ、网易等一线公司是怎样做大数据风控的?

大数据风控目前应该是前沿技术在金融领域的最成熟应用,相对于智能投顾、区块链等还在初期的金融科技应用,大数据风控目前已经在业界逐步普及,从BATJ这样的大企业,到交易规模比较大的网贷平...

02/25 16:24
1
数据及大数据的本质到底是什么?

最近几年,数据问题进入哲学视野。对于哲学家们探索的数据本质特征,我们可以从以下几个方面来把握。 数据与大数据 技术进步,主要是计算机、网络和各种类型的传感器以及云技术、分布式计算与...

02/22 17:39
0
大数据最核心的关键技术——32个算法

奥地利符号计算研究所的Christoph Koutschan博士在自己的页面上发布了一篇文章,提到他做了一个调查,参与者大多数是计算机科学家,他请这些科学家投票选出最重要的算法,以下是这次调查的结...

扫盲!为什么说 Storm 比 Hadoop 快?

storm的网络直传、内存计算,其时延必然比hadoop的通过hdfs传输低得多;当计算模型比较适合流式时,storm的流式处理,省去了批处理的收集数据的时间;因为storm是服务型的作业,也省去了作业调...

Hbase教程:通过BulkLoad快速将海量数据导入到Hbase

本文将针对这个问题介绍如何通过Hbase的BulkLoad方法来快速将海量数据导入到Hbase中。 在第一次建立Hbase表的时候,我们可能需要往里面一次性导入大量的初始化数据。我们很自然地想到将数据一...

深度解析数据挖掘中的数据理解和预处理

很多人说,数据准备工作真是个“体力活”,耗时耗力不说,还异常的枯燥无味。建模之前的数据处理确实是平淡的,它往往不需要多高的智商,多牛的编程技巧,多么高大上的统计模型。但是,它却能...

怎样用OpenStack构建Hadoop和Spark系统

OpenStack Sahara是个命令行工具,通过简化流程,跟踪复杂的细节,使Hadoop和 Spark的安装、部署变得更加简单。 OpenStack如何构建Hadoop和Spark系统 OpenStack是一种云操作系统,用于提供虚...

深度学习硬件架构简述

深度学习具有极高的计算需求, 要对深度学习应用进行开发并商业化,就需要找到合适的硬件配置。目前,在开发用于深度学习应用的高效硬件平台这一领域,竞争十分激烈。这里将介绍具体的硬件要...

02/18 14:57
0
深度解析大数据处理系统关键层次架构

在数据存储层,还有很多类似的系统和某些系统的变种,这里,仅仅列出较为出名的几个。 一、数据存储层 宽泛地讲,据对一致性(consistency)要求的强弱不同,分布式数据存储策略,可分为ACID和...

利用数据仓库优化数据分析?

在整个数据分析流程中,数据处理的时间往往要占据70%以上!这个数字有没有让你震惊呢?为了提高分析效率和质量,借用数据仓库进行数据分析是一个很好的选择,详细的工作方法本文都有所介绍。...

02/17 13:48
0
搞大数据必知的处理框架技术,你的项目应该使用哪种?

大数据是收集、整理、处理大容量数据集,并从中获得见解所需的非传统战略和技术的总称。虽然处理数据所需的计算能力或存储容量早已超过一台计算机的上限,但这种计算类型的普遍性、规模,以及...

在大数据时代,传统的数据处理方法还适用吗?

大数据环境下的数据处理需求 大数据环境下数据来源非常丰富且数据类型多样,存储和分析挖掘的数据量庞大,对数据展现的要求较高,并且很看重数据处理的高效性和可用性。 传统数据处理方法的不...

02/15 20:45
0
全面解析大数据框架的区别

简介 大数据是收集、整理、处理大容量数据集,并从中获得见解所需的非传统战略和技术的总称。虽然处理数据所需的计算能力或存储容量早已超过一台计算机的上限,但这种计算类型的普遍性、规模...

Hadoop工具让数据仓库迁移更轻松

对于大数据管理和分析应用程序云服务,用户的关注度正不断增长,而为了应对这一趋势,供应商已经开始努力简化Hadoop的云部署流程,并试图降低云端Hadoop的购买价格。 如何简化Hadoop云部署 ...

谈谈自己初学hadoop的心路历程

在学习hadoop之前,我就明确了要致力于大数据行业,成为优秀的大数据研发工程师的目标,有了大目标之后要分几步走,然后每一步不断细分,采用大事化小的方法去学习hadoop。下面开始叙述我是如...

HBase最佳实践——读性能优化策略

任何系统都会有各种各样的问题,有些是系统本身设计问题,有些却是使用姿势问题。HBase也一样,在真实生产线上大家或多或少都会遇到很多问题,有些是HBase还需要完善的,有些是我们确实对它了...

没有更多内容

加载失败,请刷新页面

返回顶部
顶部