文档章节

趣味分析系列 | 维多利亚女神的秘密

openfea
 openfea
发布于 2017/02/23 15:44
字数 1776
阅读 27
收藏 0

讲到维多利亚女神,你们的脑子里闪过的是那些画面?

 

上两期,我们主要做了文胸的品牌及文胸罩杯的专题分析。这一期我们将从各个角度向大家介绍维多利女神的所有秘密,以便让各位亲早日找到各自的维多利亚女神,并能愉快地生活在一起!

女神不一定是最漂亮的,但一定是有品味、有气质的,而且身材还过得去的。那么穿衣打扮的品味肯定是衡量一个女生是否是女神的一个重要标准,因此,购买何种价位的内衣当然是考量的一个维度。另外,合适的罩杯大小毫无疑问是衡量身材好与不好的重要维度。因此,找女神我们有后面的女神公式。

小编帮大家找到女神还不够,如何能与女神愉快地生活在一起也是我们要讲的重点。因此,你有必要了解女神们的作息规律、日常偏好,又比如她们倾向于购买何种品牌、何种质地、何种色系的内衣等等都是我们需要一一了解的信息。所谓知已知彼,百战百胜嘛!

数据准备与处理思路:

经过社区爬虫达人(燕子)几天的辛勤爬取,共取得某网购平台100多万的文胸网购评论数据/商品型号/价格三部分数据,分别形成3个文本文件。经FEA处理后的数据结构如下。

(1数据结构

A:文胸网购评论数据(comments2)

B:商品详情信息(goods2:文胸产品名称、产品购物网址、旗舰店名称、文胸货号代码)

C:文胸价格(price2:文胸货号代码、价格)

(2)分析思路

A:根据文胸网购评论数据(comments2),我们对表中的referencename字段进行分组统计,可以统计出最受欢迎的文胸产品名称,以及文胸品牌25强;

对表中的userlevelname字段进行分组统计,可以统计出购物平台上会员等级的分布组成情况;

对表中的userclientshow字段进行分组统计,可以统计出购物平台上,顾客一般是通过何种终端进行下单购买的;

对表中的productcolor字段进行分组统计,可以统计出大家都偏爱哪几种颜色,进而分析主要的几个颜色色系。

对表中的userprovince字段进行分组统计,可以统计出网购客户主要分布在全国哪些省市。

对表中的productsize字段进行分组统计,可以统计出全国女生罩杯大小数量上的一个概况统计。

对表中的userprovince、productsize两个字段组合进行分组统计,可以统计出全国各省女生罩杯大小数量上的一个概况统计。

对表中的creationtime字段按位进行拆分(年、月、日、小时),然后逐一进行分组统计,可以统计出每年、每月、每日、每小时段的累计购买数量,从购买时间上对购买行为有一个大概的了解。比方说,哪几个月是销售旺季,大家最喜欢在一天当中的哪个小时时段里下单购买。

B: 将文胸网购评论数据(comments2)与商品详情信息(goods2)按文胸产品名称字段进行两表关联,然后对旗舰店名称进行分组统计,可以计算出哪些店铺销售量比较靠前。

C:将商品详情信息(goods2)与文胸价格信息(price2)两表按文胸货号代码进行两表关联,可以得出每个商品的价格,然后再与网购评论数据(comments2)中的产品名称字段进行关联,得到一个包含文胸价格、文胸名称、罩杯大小、顾客所在省份等全字段的一张总表,如下: 

这时,对多个字段组合进行分组统计,或者按多个字段条件进行过滤,可以计算出一些更有意思的结果。如身材好的人分布在哪些省份,女神主要分布在哪些省份等等。

(注:受爬取的数据质量限制及网购平台上商品罩杯分类标准规则较多等客观因素,分析结果与思路仅供参考)

多利亚女神的秘密

(1受女生欢迎的胸品牌与文胸店铺25强

(基于爬取的数据)从以上两图可以看出,像冰堂秀、幻薇、古今、曼妮芬、黛安芬、水中花等大商场常见专柜品牌都是榜上有名。

(2顾客群体分析

从以上两图可以看出,广东、北京、江苏、四川、浙江五地的顾客人数排名靠前。

从上图我们可以看出,该购物平台中,铜牌会员与银牌会员占有较大比重;这些网购人员中,大部份是通过安卓手机客户端与苹果手机客户端来进行下单购买的。

(3买时间分析

从上图中的文胸月累积销售量柱状图中可以看出,每年的6、7、8、9、11月份是一个购买旺季。这很有可能跟夏季的穿戴洗护次数频繁有关,至于11月份这一个销售量可能与天猫等网购平台大促销政策有关。

(4文胸色系分布

从上图可以看出,黑色与肤色两种色系均为25%左右。这与我们夏季经常看到女生穿黑丝袜、漏黑色肩带是有很大关系的。到了这,各位看官,你们在为你们的女神挑选文胸与丝袜时应该买什么色系应该心里有数了吧。

4)文胸价格分析

我对53万个文胸的购买价格进行初步分析后发现:平均价格为102元,50%的人购买价格为98元,75%的人购买价格为119元,总体来讲单价都是大众消费水平的。

(5们的维多女神

女神的定义:学识渊博、经济独立、颜值高、身材好、气质佳……

鉴于小编爬取的数据有限,我只能肤浅地给出如下女神计算公式:

By the way,这里要感谢一下我团队里美女小倩,是她告诉我如何解读文胸罩杯型号数据:前面数字代表身材胖瘦,后面字母代表罩杯大小。

从以上两图我们可以看出,在为数不多的女神里面,人数排名靠前的省市有广东、北京、江苏、四川、浙江。

 

上期回顾:

趣味分析系列 | 女生罩杯型号知多少

趣味分析系列 | 文胸品牌知多少(一)

© 著作权归作者所有

openfea
粉丝 18
博文 86
码字总数 95615
作品 1
杭州
其他
私信 提问
价值100亿美金的胸罩生意

翻开维多利亚的秘密母公司The Limited的财报,2015年销售额是121亿美金,净利润是12亿美金,截至目前,维多利亚的秘密在全球有超过2000间店铺,其中70%在美国,加拿大和英国。 这样一家专卖女...

挖数
2017/11/25
0
0
MIT 开发头戴式设备,可听使用者心里话

虽然现在智能语音助理相当方便,但仍然有人不喜欢对机器说话。最近 MIT 开发出一部头戴式设备,可「聆听」使用者心中所想,进而充当遥控器进行各种动作。 这个设备的原理是透过读取用户默念(...

Unwire HK
2018/04/09
0
0
day182-2018-12-19-英语流利阅读-待学习

“性感”时代已去,维密将如何转身? Daniel 2018-12-19 1.今日导读 维多利亚的秘密(Victoria's Secret)这个内衣品牌,最近似乎步入了“中年危机”——曾经打遍天下的“性感”内衣,在主打...

飞鱼说编程
2018/12/19
53
0
“被打”和“北大” 的关联--- 趣味数据挖掘系列之一)

“被打”和“北大” 的关联--- 趣味数据挖掘系列之一(唐常杰) (说明:这是在科学博客上的趣味数据挖掘系列十二篇中的第一篇,和朋友讨论过,博文不算正式刊物,只把系列的第一篇搬过来,可以...

tangchangjie
2018/06/26
0
0
数据分析奥斯卡女神们,谁是你心中的No.1?

作者 | 徐麟 转载自数据森麟(公众号 ID:shujusenlin) 前言 在开始今天的正文前,首先带来一首经典的由奥黛丽·赫本演唱的《Moon River》,也是电影《蒂凡尼的早餐》中的主题曲。 一年一度...

AI科技大本营
03/08
0
0

没有更多内容

加载失败,请刷新页面

加载更多

作为一个(IT)程序员!聊天没有话题?试试这十二种技巧

首先呢?我是一名程序员,经常性和同事没话题。 因为每天都会有自己的任务要做,程序员对于其他行业来说;是相对来说比较忙的。你会经常看到程序员在发呆、调试密密麻麻代码、红色报错发呆;...

小英子wep
今天
18
0
【SpringBoot】产生背景及简介

一、SpringBoot介绍 Spring Boot 是由 Pivotal 团队提供的全新框架,其设计目的是用来简化新 Spring 应用的初始搭建以及开发过程,该框架使用了特定的方式来进行配置,从而使开发人员不再需要...

zw965
今天
7
0
简述并发编程分为三个核心问题:分工、同步、互斥。

总的来说,并发编程可以总结为三个核心问题:分工、同步、互斥。 所谓分工指的是如何高效地拆解任务并分配给线程,而同步指的是线程之间如何协作,互斥则是保证同一时刻只允许一个线程访问共...

dust8080
今天
7
0
OSChina 周四乱弹 —— 当你简历注水但还是找到了工作

Osc乱弹歌单(2019)请戳(这里) 【今日歌曲】 @花间小酌 :#今日歌曲推荐# 分享成龙的单曲《男儿当自强》。 《男儿当自强》- 成龙 手机党少年们想听歌,请使劲儿戳(这里) @hxg2016 :刚在...

小小编辑
今天
3.5K
22
靠写代码赚钱的一些门路

作者 @mezod 译者 @josephchang10 如今,通过自己的代码去赚钱变得越来越简单,不过对很多人来说依然还是很难,因为他们不知道有哪些门路。 今天给大家分享一个精彩的 GitHub 库,这个库整理...

高级农民工
昨天
11
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部