加载中
大数据平台架构设计探究

本文首发于 vivo互联网技术 微信公众号 链接:https://mp.weixin.qq.com/s/npRRRDqNUHNjbybliFxOxA 作者:刘延江 近年来,随着IT技术与大数据、机器学习、算法方向的不断发展,越来越多的企业...

2019/12/23 10:21
1.6W
【大数据】SparkSql连接查询中的谓词下推处理(一)

本文首发于 vivo互联网技术 微信公众号 https://mp.weixin.qq.com/s/YPN85WBNcnhk8xKjTPTa2g 作者:李勇 目录: 1.SparkSql 2.连接查询和连接条件 3.谓词下推 4.内连接查询中的谓词下推规则 ...

谈谈统计学正态分布阈值原理在数据分析工作中的运用

一、背景 0.0 神说,要有正态分布,于是就有了正态分布。 0.1 神看正态分布是好的,就让随机误差都随了正态分布。 0.2 正态分布的奇妙之处,就是许多看似随机事件竟然服从一个表达式就能表达...

2021/01/20 10:56
294
一文了解 Consistent Hash

本文首发于 vivo互联网技术 微信公众号 链接:https://mp.weixin.qq.com/s/LGLqEOlGExKob8xEXXWckQ 作者:钱幸川 在分布式环境下面,我们经常会通过一定的规则来进行数据分布的定义,本文描述...

2019/11/25 14:07
1.5K
Spark 数据倾斜及其解决方案

本文首发于 vivo互联网技术 微信公众号 https://mp.weixin.qq.com/s/lqMu6lfk-Ny1ZHYruEeBdA 作者简介:郑志彬,毕业于华南理工大学计算机科学与技术(双语班)。先后从事过电子商务、开放平...

2019/12/30 10:41
4.2K
分布式集群如何实现高效的数据分布

一、前言 随着互联网的发展,用户产生的数据越来越多,企业面临着庞大数据的存储问题,目前市面上主流的分布式大数据文件系统,都是对数据切片打散,通过离散方法将数据散列在集群的所有节点...

2020/11/18 11:28
1.2K
vivo 调用链 Agent 原理及实践

一、项目背景 2017年,vivo互联网研发团队认为调用链系统对实际业务具有较大的价值,于是开始了研发工作。3年的时间,调用链系统整体框架不断演进……本文将介绍vivo调用链系统 Agent 技术原...

2020/11/23 10:17
3.1K
vivo 云服务海量数据存储架构演进与实践

一、写在开头 vivo 云服务提供给用户备份手机上的联系人、短信、便签、书签等数据的能力,底层存储采用 MySQL 数据库进行数据存储。 随着 vivo 云服务业务发展,云服务用户量增长迅速,存储在...

2020/11/16 10:10
1K
前端科普系列(2):Node.js 换个角度看世界

本文首发于 vivo互联网技术 微信公众号 链接: https://mp.weixin.qq.com/s/fPNMaeNYgU3eJsh0SLMRRg 作者:孔垂亮 【前端科普系列】往期精彩内容: 《前端科普系列(1):前端简史》主要介绍...

2020/03/12 10:02
1.3K
Kafka 原理和实战

本文首发于 vivo互联网技术 微信公众号 https://mp.weixin.qq.com/s/bV8AhqAjQp4a_iXRfobkCQ 作者简介:郑志彬,毕业于华南理工大学计算机科学与技术(双语班)。先后从事过电子商务、开放平...

2019/08/19 18:09
764

没有更多内容

加载失败,请刷新页面

没有更多内容

返回顶部
顶部