文档章节

趣味分析系列 | 文胸品牌知多少(一)

openfea
 openfea
发布于 2016/12/21 17:28
字数 633
阅读 24
收藏 0

一年一度的圣诞节马上就快到了,各位男神是不是又在劳神费力地给女神们准备圣诞节礼物?今年送啥呢?

送脑白金怎么样?NO,NO,NO!脑白金是送给大妈的!!!

直接给MONEY? NO,NO,NO!太俗气!!!

送鲜花与巧克力?NO,NO,NO!不实在!!!

按我说,直接送个文胸套装,有情调又贴心!!!说不定你的女神会给你个惊喜呢!

但是问题又来了,挑选哪个品牌的文胸好呢,总不能送一个层次太LOW的吧。因此,你需要对文胸的品牌有个大概的了解。简单讲,首先你得了解女生文胸品牌有多少?品牌的排名度是怎样的?为了减少各位男神上网的搜索时间,看我下面仔细分析给你看!

一、数据准备

打开浏览器上某东,祭出我们的F12神器,然后把如下网页代码复制下来(还不会?来找我,我当面告诉你,教到你会为止!)。

源码稍作处理如下:

二、分析过程

1、把数据上传到OpenFEA(请访问www.openfea.cn的下载专区,可以在互联网上搭建的在线试用环境中跟我一起分析),如下图:

2、加载数据到内存DF表

3、数据分析与处理

(1)数据行列转换

(2)字段重命名与数据打标签

(3)数据过滤

(4)数据提取

(5)数据合并

(6)存储结果数据

(7)结论

女生文胸品牌总共有1240个,各位男神慢慢了解吧,我只能帮你到这了。

三、分析脚本

#加载数据

df1 = load csv by jd_goods.txt with (encoding="gbk",sep="=",header=-1)

#行列互换

df2 = @udf df1 by udf0.df_T

rename df2 as (0:"content")

#数据打标签

df2.flag1 = str content by (contains("brand-"))

df2.flag2 = str content by (contains(u'品牌'))

df3 = filter df2 by (flag1==True)

df4 = filter df2 by (flag2==True)

#数据分析与提取

df3.brandno =str content by (findall("(\d+)"))

df3.brand_code=str brandno by (get(0))

df4.brands = str content by (split("::"))

df4.brands_1=str brands by (get(1))

df4.brand_name = str brands_1 by ([0:-8])

#数据合并

df3 = add idx1 by (range(df3.index.size))

df4 = add idx2 by (range(df4.index.size))

df5 = join (df3,df4) by (idx1,idx2)

df6 = loc df5 by (brand_name,brand_code)

#存储数据

store df6 to csv by jd_goods.csv

<烦请关注,下期内容更精彩!>

趣味分析系列  |  文胸纬度分析360度(罩杯、颜色......)(二)

趣味分析系列  |  女神在哪里(三)

更多文章,敬请期待......

© 著作权归作者所有

openfea

openfea

粉丝 20
博文 91
码字总数 101905
作品 1
杭州
其他
私信 提问
IPNET:IP领域的应用孵化平台

IPNET是由太一智源研发的、面向实体IP、数字IP、无形IP的“全IP”应用孵化平台。2019年,期待IPNET好事连连。 IPNET作为一个IP应用孵化平台,首先是一个技术基础平台,然后是一个业务创新平台...

Forest的账本
02/08
0
0
“被打”和“北大” 的关联--- 趣味数据挖掘系列之一)

“被打”和“北大” 的关联--- 趣味数据挖掘系列之一(唐常杰) (说明:这是在科学博客上的趣味数据挖掘系列十二篇中的第一篇,和朋友讨论过,博文不算正式刊物,只把系列的第一篇搬过来,可以...

tangchangjie
2018/06/26
0
0
程序员9月书讯

本月13本书,涉及方方面面,包括Java、Python、C#、JS、Swift、Haskell等编程语言相关图书、安全经典、用户体验与品牌塑造、数学经典著作等,所有小伙伴都能找到自己喜欢的Style。 1.《HTTPS...

图灵教育
2016/09/13
0
0
如何把自己打造成技术圈的 papi 酱

最近半年,一个叫papi酱的平胸女子连续在微博、朋友圈、创业圈刷屏,当之无愧成了中文互联网的第一大网红。呃,你以为我会巴拉巴拉说一堆网工创业的事?NO,今天想借papi酱的话题跟大家一起聊...

优雅的程序员
2016/04/11
8.2K
51
有没有人和我一样觉得国人编的书还是很棒的(关于linux的)

e文不好,看翻译过来的书,说实话觉得都挺糟糕的,主要是总会扯东侧西,扯着扯着就扯到天上去了,而某些国人编的书就很不错,像一本手册,逻辑条理都十分强; 譬如我十分喜欢的十二五规划的那...

Nte
2013/11/29
531
7

没有更多内容

加载失败,请刷新页面

加载更多

vue.js-详解三大流行框架VUE_快速进阶前端大咖-Vue基础

作者 | Jeskson 来源 | 达达前端小酒馆 Vue概述: MVX模式简介,Vue框架简介,Vue.js的安装与使用。 Vue基础语法: 实例对象,生命周期,模板语法,计算属性,methods方法 Vue渲染: 列表渲染...

达达前端小酒馆
今天
4
0
OSChina 周五乱弹 —— 匹诺曹也是韩国人

Osc乱弹歌单(2019)请戳(这里) 【今日歌曲】 @watergood :分享海先生的单曲《烟花巷》 《烟花巷》- 海先生 手机党少年们想听歌,请使劲儿戳(这里) @Cyber-Pan :已经很久没有十点前下过...

小小编辑
今天
8
1
Snack3 之 Jsonpath使用

Snack3 之 Jsonpath使用 一、 Snack3 和 JSONPath 介绍 Snack3 是一个支持JSONPath的JSON框架。JSONPath是一个很强大的功能,也可以在Java框架中当作对象查询语言(OQL)来使用。 <dependenc...

刘之西东
今天
5
0
7. 彤哥说netty系列之Java NIO核心组件之Selector

<p align="right">——日拱一卒,不期而至!</p> 你好,我是彤哥,本篇是netty系列的第七篇。 简介 上一章我们一起学习了Java NIO的核心组件Buffer,它通常跟Channel一起使用,但是它们在网络...

彤哥读源码
昨天
21
0
在Jupyter notebooks 中运行GRASS GIS

在Ubuntu16.04中,首先安装jupyter: python3 -m pip install --upgrade pippython3 -m pip install jupyter 然后创建一个sh脚本: # directory where GRASS GIS lives# GRASS GIS 的安装......

ddd口木呆
昨天
4
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部