加载中
一个博士生学位论文致谢部分(挺感人的,转载)

我出生的时候是一个下雪的深夜,我的父亲在床边生了一堆柴火,我的母亲躺在四周漏风的那间破屋角落的床上,咬紧牙关,生下了我。27年后,也是在一个下雪的深夜,我完成了我的博士论文。当我打...

2020/10/30 14:31
72
读后感

PART1: 逻辑思维,成大事者不纠结 1.曾国藩 第一次出仕时:一直用自己的标准去衡量和要求其他人,最后基本把所有人都得罪了 第二次出仕时:采用严于律己,宽于待人的态度,对自己要求还是非常...

2020/10/22 14:17
27
修改git用户名和邮箱以及密码

查看当前用户名和邮箱: git config user.name git config user.email 修改方法 git config --global user.name "zhangsan(新的用户名)" git config --global user.email "123456@qq.com(新的...

git
2020/09/17 09:58
215
count(1) 与 count(*) 比较

1. count(1) and count(*) 当表的数据量大些时,对表作分析之后,使用count(1)还要比使用count(*)用时多了! 从执行计划来看,count(1)和count(*)的效果是一样的。 但是在表做过分析之后,c...

2020/09/16 23:55
136
用户留存率分析详解

无论是出售食品杂货、金融服务还是健身会籍,只有当新客户完成了再次购买时,才能称作是成功获客,而用来反映上述行为的指标被称为客户留存率。这是影响营收的关键指标之一,因为每当客户留存...

2020/04/08 12:58
705
改变从心开始(from 幸福力:一生必读的七堂幸福课)

在泰晤士河畔有座闻名世界的威斯敏斯特大教堂(Westminster Cathedral),在其地下室的墓碑林中有一座无名氏的墓碑,上面有一段发人深省的文字,震撼着每一个前来瞻仰的 人们,镌刻在墓碑上的文...

2020/01/14 16:54
63
训练集、验证集和测试集

通常在训练机器学习模型的时候,我们会将数据划分为训练集、验证集和测试集。一般来说,训练集:验证集:测试集的划分比例为6:2:2。对原始数据进行三个集合的划分,是为了能够选出效果(可以...

HIVE分析窗口函数系列

Hive中提供了越来越多的分析函数,用于完成负责的统计分析。抽时间将所有的分析窗口函数理一遍,将陆续发布。 今天先看几个基础的,SUM、AVG、MIN、MAX、COUNT。 用于实现分组内所有和连续累...

2019/03/15 11:22
147
关于Hive中常用函数需要注意的点小合集

1.COALESCE( value1,value2,... ) The COALESCE function returns the fist not NULL value from the list of values. If all the values in the list are NULL, then it returns NULL. Exam...

2019/03/15 11:11
235
史上最全常用正则表达式大全

很多不太懂正则的朋友,在遇到需要用正则校验数据时,往往是在网上去找很久,结果找来的还是不很符合要求。所以我最近把开发中常用的一些正则表达式整理了一下,在这里分享一下。给自己留个底...

2018/11/22 16:28
2.2K
Spark Load Data and Export Data

Load_Data_Command 一、导入数据-加载csv文件数据作为spark 临时表DataSource(不需要提前创建表,方便数据分析) 该命令将csv文件导入到临时表中,命令格式为 load data '文件路径' table [...

2018/10/23 11:15
1.1K
Join a New Company

今天入职新公司了,感觉还OK,加油干吧。

2018/09/19 17:25
56
关于学习和工作

最近一段时间再学习Python和一些机器学习算法,可能是只接触到了皮毛,并没有感觉很复杂,另外,因为还没有实践的机会,所以理解的深度肯定还不够。争取在工作中找些实践的机会,另外,也可以...

2018/08/11 14:53
13
(部分转载)Presto上使用SQL遇到的一些坑

遇到过的问题: 很多的时候,在Presto上对数据库跨库查询,例如Mysql数据库。这个时候Presto的做法是从MySQL数据库端拉取最基本的数据,然后再去做进一步的处理,例如统计等聚合操作。 举个栗...

2018/08/07 12:39
7.2K
关于改进工作效率

1.给不同的业务线建立需求群,所有的数据需求都在群里面提。 2.对于特别难搞定的事情,到对应的技术哪去做,有问题随时沟通。 3.定期给工作总结形成方法论。 4.学习新的技术,尝试用新的方法...

2018/07/19 11:28
75
(转)SQL语句的执行顺序

(7) SELECT (8) DISTINCT <select_list> (1) FROM <left_table> (3) <join_type> JOIN <right_table> (2) ON <join_condition> (4) WHERE <where_condition> (5) GROUP BY <group_by_list> (...

2018/07/18 12:50
24
开源中国APP App Store不能下载

发现开源中国APP App Store不能下载,提示没有该商品,不知道开源中国的管理员能不能看到,看看是怎么回事儿。不然就只能转战别的平台了。

2018/07/12 18:39
398
Presto Functions

Presto的是什么?优势是什么呢?从官方文档中我们了解到 Presto是一个分布式SQL查询引擎,用于查询分布在一个或多个不同数据源中的大数据集。 千万不要以为Presto可以解析SQL,那么Presto就是...

2018/07/12 13:54
3.5K
Job Summary for wk20180619

1.Mon:报表数据剧增原因复核;确认分销+限时折扣逻辑;618活动需求分析。 2.Tue:7.1峰会同事取数结果异常,逻辑复核;分销+限时折扣上线效果数据;小店自购数据需求;618活动数据逻辑整理。 ...

2018/06/16 01:19
36
Job Summary for wk20180609

1.本周的工作很杂,感觉做了很多东西,但产出好像又不多,能看到的产出只有:首焦和类目的报表、月报。 2.另外,还手把手教了新同事一些基本的技能,其实这不应该是我的职责,毕竟不是我带的...

2018/06/08 10:29
34

没有更多内容

加载失败,请刷新页面

返回顶部
顶部