加载中
修改git用户名和邮箱以及密码

查看当前用户名和邮箱: git config user.name git config user.email 修改方法 git config --global user.name "zhangsan(新的用户名)" git config --global user.email "123456@qq.com(新的...

git
09/17 09:58
0
count(1) 与 count(*) 比较

1. count(1) and count(*) 当表的数据量大些时,对表作分析之后,使用count(1)还要比使用count(*)用时多了! 从执行计划来看,count(1)和count(*)的效果是一样的。 但是在表做过分析之后,c...

09/16 23:55
54
用户留存率分析详解

无论是出售食品杂货、金融服务还是健身会籍,只有当新客户完成了再次购买时,才能称作是成功获客,而用来反映上述行为的指标被称为客户留存率。这是影响营收的关键指标之一,因为每当客户留存...

04/08 12:58
302
改变从心开始(from 幸福力:一生必读的七堂幸福课)

在泰晤士河畔有座闻名世界的威斯敏斯特大教堂(Westminster Cathedral),在其地下室的墓碑林中有一座无名氏的墓碑,上面有一段发人深省的文字,震撼着每一个前来瞻仰的 人们,镌刻在墓碑上的文...

01/14 16:54
63
训练集、验证集和测试集

通常在训练机器学习模型的时候,我们会将数据划分为训练集、验证集和测试集。一般来说,训练集:验证集:测试集的划分比例为6:2:2。对原始数据进行三个集合的划分,是为了能够选出效果(可以...

HIVE分析窗口函数系列

Hive中提供了越来越多的分析函数,用于完成负责的统计分析。抽时间将所有的分析窗口函数理一遍,将陆续发布。 今天先看几个基础的,SUM、AVG、MIN、MAX、COUNT。 用于实现分组内所有和连续累...

2019/03/15 11:22
51
关于Hive中常用函数需要注意的点小合集

1.COALESCE( value1,value2,... ) The COALESCE function returns the fist not NULL value from the list of values. If all the values in the list are NULL, then it returns NULL. Exam...

2019/03/15 11:11
163
史上最全常用正则表达式大全

很多不太懂正则的朋友,在遇到需要用正则校验数据时,往往是在网上去找很久,结果找来的还是不很符合要求。所以我最近把开发中常用的一些正则表达式整理了一下,在这里分享一下。给自己留个底...

2018/11/22 16:28
2.1K
Spark Load Data and Export Data

Load_Data_Command 一、导入数据-加载csv文件数据作为spark 临时表DataSource(不需要提前创建表,方便数据分析) 该命令将csv文件导入到临时表中,命令格式为 load data '文件路径' table [...

2018/10/23 11:15
873
Join a New Company

今天入职新公司了,感觉还OK,加油干吧。

2018/09/19 17:25
50
关于学习和工作

最近一段时间再学习Python和一些机器学习算法,可能是只接触到了皮毛,并没有感觉很复杂,另外,因为还没有实践的机会,所以理解的深度肯定还不够。争取在工作中找些实践的机会,另外,也可以...

2018/08/11 14:53
13
(部分转载)Presto上使用SQL遇到的一些坑

遇到过的问题: 很多的时候,在Presto上对数据库跨库查询,例如Mysql数据库。这个时候Presto的做法是从MySQL数据库端拉取最基本的数据,然后再去做进一步的处理,例如统计等聚合操作。 举个栗...

2018/08/07 12:39
4.9K
关于改进工作效率

1.给不同的业务线建立需求群,所有的数据需求都在群里面提。 2.对于特别难搞定的事情,到对应的技术哪去做,有问题随时沟通。 3.定期给工作总结形成方法论。 4.学习新的技术,尝试用新的方法...

2018/07/19 11:28
65
(转)SQL语句的执行顺序

(7) SELECT (8) DISTINCT <select_list> (1) FROM <left_table> (3) <join_type> JOIN <right_table> (2) ON <join_condition> (4) WHERE <where_condition> (5) GROUP BY <group_by_list> (...

2018/07/18 12:50
24
开源中国APP App Store不能下载

发现开源中国APP App Store不能下载,提示没有该商品,不知道开源中国的管理员能不能看到,看看是怎么回事儿。不然就只能转战别的平台了。

2018/07/12 18:39
357
Presto Functions

Presto的是什么?优势是什么呢?从官方文档中我们了解到 Presto是一个分布式SQL查询引擎,用于查询分布在一个或多个不同数据源中的大数据集。 千万不要以为Presto可以解析SQL,那么Presto就是...

2018/07/12 13:54
2.5K
Job Summary for wk20180619

1.Mon:报表数据剧增原因复核;确认分销+限时折扣逻辑;618活动需求分析。 2.Tue:7.1峰会同事取数结果异常,逻辑复核;分销+限时折扣上线效果数据;小店自购数据需求;618活动数据逻辑整理。 ...

2018/06/16 01:19
20
Job Summary for wk20180609

1.本周的工作很杂,感觉做了很多东西,但产出好像又不多,能看到的产出只有:首焦和类目的报表、月报。 2.另外,还手把手教了新同事一些基本的技能,其实这不应该是我的职责,毕竟不是我带的...

2018/06/08 10:29
34
只言片语

1.某天,你无端想起一个人,她曾让你对明天有所期许,但是却完全没有出现在你的明天里。 也有一个人, 她会在往后的岁月中给你更长久的幸福,虽然她不曾来过你的青春。 2.这是个喧嚣的世界 ...

2018/05/17 13:29
35
在路上 - 精选

1.时间管理 分配时间的时候,不要只是取算每分每秒每小时,而要考虑到每一件时间是重要的事情和紧急的事情。 因为我们常常会变成紧急事情的奴隶,而忘了做哪些重要的事情,尤其是那些重要但不...

2018/05/15 13:05
24

没有更多内容

加载失败,请刷新页面

返回顶部
顶部