加载中
修改git用户名和邮箱以及密码

查看当前用户名和邮箱: git config user.name git config user.email 修改方法 git config --global user.name "zhangsan(新的用户名)" git config --global user.email "123456@qq.com(新的...

git
09/17 09:58
0
count(1) 与 count(*) 比较

1. count(1) and count(*) 当表的数据量大些时,对表作分析之后,使用count(1)还要比使用count(*)用时多了! 从执行计划来看,count(1)和count(*)的效果是一样的。 但是在表做过分析之后,c...

09/16 23:55
54
用户留存率分析详解

无论是出售食品杂货、金融服务还是健身会籍,只有当新客户完成了再次购买时,才能称作是成功获客,而用来反映上述行为的指标被称为客户留存率。这是影响营收的关键指标之一,因为每当客户留存...

04/08 12:58
302
训练集、验证集和测试集

通常在训练机器学习模型的时候,我们会将数据划分为训练集、验证集和测试集。一般来说,训练集:验证集:测试集的划分比例为6:2:2。对原始数据进行三个集合的划分,是为了能够选出效果(可以...

HIVE分析窗口函数系列

Hive中提供了越来越多的分析函数,用于完成负责的统计分析。抽时间将所有的分析窗口函数理一遍,将陆续发布。 今天先看几个基础的,SUM、AVG、MIN、MAX、COUNT。 用于实现分组内所有和连续累...

2019/03/15 11:22
51
关于Hive中常用函数需要注意的点小合集

1.COALESCE( value1,value2,... ) The COALESCE function returns the fist not NULL value from the list of values. If all the values in the list are NULL, then it returns NULL. Exam...

2019/03/15 11:11
163
史上最全常用正则表达式大全

很多不太懂正则的朋友,在遇到需要用正则校验数据时,往往是在网上去找很久,结果找来的还是不很符合要求。所以我最近把开发中常用的一些正则表达式整理了一下,在这里分享一下。给自己留个底...

2018/11/22 16:28
2.1K
Spark Load Data and Export Data

Load_Data_Command 一、导入数据-加载csv文件数据作为spark 临时表DataSource(不需要提前创建表,方便数据分析) 该命令将csv文件导入到临时表中,命令格式为 load data '文件路径' table [...

2018/10/23 11:15
858
Join a New Company

今天入职新公司了,感觉还OK,加油干吧。

2018/09/19 17:25
50
(部分转载)Presto上使用SQL遇到的一些坑

遇到过的问题: 很多的时候,在Presto上对数据库跨库查询,例如Mysql数据库。这个时候Presto的做法是从MySQL数据库端拉取最基本的数据,然后再去做进一步的处理,例如统计等聚合操作。 举个栗...

2018/08/07 12:39
4.8K
关于改进工作效率

1.给不同的业务线建立需求群,所有的数据需求都在群里面提。 2.对于特别难搞定的事情,到对应的技术哪去做,有问题随时沟通。 3.定期给工作总结形成方法论。 4.学习新的技术,尝试用新的方法...

2018/07/19 11:28
65
(转)SQL语句的执行顺序

(7) SELECT (8) DISTINCT <select_list> (1) FROM <left_table> (3) <join_type> JOIN <right_table> (2) ON <join_condition> (4) WHERE <where_condition> (5) GROUP BY <group_by_list> (...

2018/07/18 12:50
24
开源中国APP App Store不能下载

发现开源中国APP App Store不能下载,提示没有该商品,不知道开源中国的管理员能不能看到,看看是怎么回事儿。不然就只能转战别的平台了。

2018/07/12 18:39
357
Presto Functions

Presto的是什么?优势是什么呢?从官方文档中我们了解到 Presto是一个分布式SQL查询引擎,用于查询分布在一个或多个不同数据源中的大数据集。 千万不要以为Presto可以解析SQL,那么Presto就是...

2018/07/12 13:54
2.4K
Job Summary for wk20180619

1.Mon:报表数据剧增原因复核;确认分销+限时折扣逻辑;618活动需求分析。 2.Tue:7.1峰会同事取数结果异常,逻辑复核;分销+限时折扣上线效果数据;小店自购数据需求;618活动数据逻辑整理。 ...

2018/06/16 01:19
20
Job Summary for wk20180609

1.本周的工作很杂,感觉做了很多东西,但产出好像又不多,能看到的产出只有:首焦和类目的报表、月报。 2.另外,还手把手教了新同事一些基本的技能,其实这不应该是我的职责,毕竟不是我带的...

2018/06/08 10:29
34
Important Time

Hope I can success this time. sometimes feel fu*king tired , always can not grap opps.

2018/03/29 13:07
23
(转)hive中解析json数组

hive中解析一般的json是很容易的,get_json_object就可以了。 但如果字段是json数组,比如 [{"bssid":"6C:59:40:21:05:C4","ssid":"MERCURY_05C4"},{"bssid":"AC:9C:E4:04:EE:52","appid":"1...

2018/03/26 15:30
3W
EXCEL TIPS From Webs

从A串中提取从"."开始的字符串B,可以使用find函数来对"."的首次出现进行定位,这类似于各种语言中的indexOf功能,find是从左往右查找的,在EXCEL中并没有从右往左查找,类似lastIndexOf的函数. 在...

2018/03/21 17:53
42

没有更多内容

加载失败,请刷新页面

返回顶部
顶部