OpenFEA数据分析之爱户外运动的土豪在哪里?

原创
2016/12/14 15:55
阅读数 305

世界上的问题很多,小伙伴们都想知道是什么吗?NOW,告诉你们,只要给我数据,我用OpenFEA分析分析,就能给您一个比较靠谱的答案。

昨天家里有个小朋友看了一个户外运动的广告,她感觉蛮好玩的,然后就问爸爸:“爸爸,为什么你天天要加班,而不带我一起去做户外运动?”

爸爸回答:“小朋友,爸爸身上有房贷,要挣钱养家,爸爸现在又不是土豪!“

小朋友又问:”爸爸,那土豪是什么意思,土豪在哪里?“

对呀,土豪在哪里?爱户外运动的土豪又在哪里?

别急,我慢慢算给你听!

一、分析思路

土豪标志就是买!买!买!爱户外运动的土豪的标志就是买!买!买!

骑个车,登个山,跑个步,游个泳有必要买个万把块的户外运动手表吗?这不就是土豪行为嘛!

(一)数据准备

上某东,抓数据!怎么抓?来找我,我当面告诉你!

1、佳明手表购买评论记录及手表价格

2、颂拓手表购买评论记录及手表价格

(二)分析过程

1、把数据上传到OpenFEA,如下图:

2、加载数据到内存DF表

3、数据分析与统计

(1)表联合

(2)分组与统计

(3)重命名字段

(4)结果排序

(5)绘图

从图中得出结论:喜欢户外运动的人士主要分布在北京、广州、上海。但是,这些人士并不完全是土豪,还需要剔除购买低价位户外运动手表的人士。

(6)剔除购买低价位户外运动手表的记录,然后再统计分析

最终得出结论:喜欢户外运动的土豪人士主要分布在北京、广州、上海。

二、分析脚本

#加载数据

jmsb = load csv by xhzjmsb.csv

stsb = load csv by xhzstsb.csv

jmprice = load csv by jmprice.csv

stprice = load csv by stprice.csv

#表链接

sbun = union (jmsb,stsb)

#表分组

gt = group sbun by (省份)

#表统计

result = agg gt by (省份:count) 

#重命名字段

rename result as (u"省份":u"人数")

#排序

result = order result by (人数) with desc

#绘图

plot result by 04

priceun = union (jmprice,stprice)

#表关连查型

sbun1 = join (sbun,priceun) by (型号,型号)

#表过滤

sbun2 = filter sbun1 by (price>4000)

gt2 = group sbun2 by (省份)

result2 = agg gt2 by (省份:count) 

rename result2 as (u"省份":u"人数")

result2 = order result2 by (人数) with desc

plot result2 by 04

展开阅读全文
打赏
0
0 收藏
分享
加载中
更多评论
打赏
0 评论
0 收藏
0
分享
返回顶部
顶部