文档章节

如何高效率采集并分析数据

可乐瓶的小辣椒
 可乐瓶的小辣椒
发布于 2017/03/10 13:32
字数 1182
阅读 56
收藏 1

一、数据采集的三大要点

图片1

1、全面性

数据量足够具有分析价值、数据面足够支撑分析需求。

比如对于“查看商品详情”这一行为,需要采集用户触发时的环境信息、会话、以及背后的用户id,最后需要统计这一行为在某一时段触发的人数、次数、人均次数、活跃比等。

2、多维性

数据更重要的是能满足分析需求。灵活、快速自定义数据的多种属性和不同类型,从而满足不同的分析目标。

比如“查看商品详情”这一行为,通过埋点,我们才能知道用户查看的商品是什么、价格、类型、商品id等多个属性。从而知道用户看过哪些商品、什么类型的商品被查看的多、某一个商品被查看了多少次。而不仅仅是知道用户进入了商品详情页。

3、高效性

高效性包含技术执行的高效性、团队内部成员协同的高效性以及数据分析需求和目标实现的高效性。

基于以上三点,我们看如何让数据采集更准确、分析更有用以及团队内部更高效。

二、数据分析价值性和高效性

图片2

1、明确数据驱动目标

数据采集切忌大而全,数据分析需求也是随着产品不断迭代的,明确长远和当前阶段的分析需求,让分析更有目的性,技术执行更高效。

2、按需采集数据

带着需求和分析目标去采数据,不仅避免了数据冗余带来的无从下手,也避免了全量采集之后却不知道要分析什么的尴尬。

图示为埋点范例:

图片表格

图示文档可由数据分析需求人员整理,表格梳理让需求人员和技术人员协同更高效,也大大提升了后续的分析价值和效率。

3、多维交叉定位问题

对数据的应用可分为一般分析和探索性分析。一般分析包括对日常数据如新增、活跃、留存、核心漏斗的监测分析,也包括对各部门日常业务的数据监测。监测每日增长,分析异常情况,比如对注册失败、支付失败事件的监控和及时优化。

探索性分析是对数据的高级应用。对核心事件的相关性分析、挖掘产品改进关键点等,如促进用户购买的相关性分析、找到促进留存的Ahamoment等。

4、优化产品、优化运营策略

基于数据反映的问题,做到实时监控和及时解决,基于分析得到的增长启发,去做A/B测试、灰度测试、去MVP实践。

5、衡量

衡量是数据分析到实践的最后一步,当然,也可能是第一步。有时候我们看似找到了增长点,但实验发现,事实并不如预期,不要灰心,不要丧气,更不要不吃饭,分析过程中对用户的理解、对业务的深度挖掘可能会让下一次优化产生累计价值。

三、数据分析思维

图片3

数据采集固然重要,数据分析的方法论也很重要,但不要迷信数据,因为更重要的,可能是人的创造力和想象力!数据分析也从来不是一劳永逸的,产品在不断迭代,业务在不断更新,从认知到决策,数据更多的是起到了辅助的作用,从梳理需求、到采集、到分析、到实践、再到衡量,它是始终循环在企业增长的整个过程中的。

最后,那些改变世界的程序猿,他们始终希望能用自己的技术创造更多的价值,很多时候,他们要的可能是明确的数据需求、明确的分析目标,以及一套高效协同的方法,毕竟,谁都认为:能准确解决问题、能驱动业务增长更重要!

推荐阅读

315正版诚信护航促销

本文转载自:

可乐瓶的小辣椒
粉丝 6
博文 318
码字总数 126125
作品 0
私信 提问
详解如何pyhton批量采集拉勾网java招聘信息数据

大数据(Big Data)是指那些超过传统数据库系统处理能力的数据。它的数据规模和转输速度要求很高,或者其结构不适合原本的数据库系统。为了获取大数据中的价值,我们必须选择另一种方式来处理...

技术阿飞
2018/12/07
15
0
云上的Growth hacking之路,打造产品的增长引擎

增长关乎产品的存亡 增长!增长!增长!业务增长是每一个创业者每天面临的最大问题。无论你的产品是APP,还是web,或者是小程序,只能不断的维持用户的增长,才能向资本市场讲出一个好故事,...

云雷
06/24
0
0
Scrapy学习实例(二)采集无限滚动页面

上一篇写的是采集虎嗅网首页的新闻数据,有朋友对我说,采集多页试试看。后来研究下,虎嗅网首页是POST加载,中携带参数,所以只需要带上一个循环就好了。这是我最初的想法,先让我们看看Scr...

崔斯特
2017/12/03
0
0
OS X 样本收集和分析工具--OSXCollector

OSXCollector 是 OS X 系统样本采集和分析工具。 Forensic 采集 采集脚本运行在相关的机器上,输出一个 JSON 文件,描述任务机器的相关情况。OSXCollector 会从 plists,SQLite 数据和本地文...

叶秀兰
2015/01/28
411
0
大数据经典学习路线(及供参考)之 二

2.1 数据仓库增强 2.1.1 数据仓库及数据模型入门 什么是数据仓库、数据仓库的意义、数据仓库核心概念、数据仓库的体系结构 2.1.2 数据仓库设计 建立数据仓库的步骤、数据的抽取、数据的转换、...

柯西带你学编程
2018/05/22
0
0

没有更多内容

加载失败,请刷新页面

加载更多

作为一个(IT)程序员!聊天没有话题?试试这十二种技巧

首先呢?我是一名程序员,经常性和同事没话题。 因为每天都会有自己的任务要做,程序员对于其他行业来说;是相对来说比较忙的。你会经常看到程序员在发呆、调试密密麻麻代码、红色报错发呆;...

小英子wep
今天
12
0
【SpringBoot】产生背景及简介

一、SpringBoot介绍 Spring Boot 是由 Pivotal 团队提供的全新框架,其设计目的是用来简化新 Spring 应用的初始搭建以及开发过程,该框架使用了特定的方式来进行配置,从而使开发人员不再需要...

zw965
今天
4
0
简述并发编程分为三个核心问题:分工、同步、互斥。

总的来说,并发编程可以总结为三个核心问题:分工、同步、互斥。 所谓分工指的是如何高效地拆解任务并分配给线程,而同步指的是线程之间如何协作,互斥则是保证同一时刻只允许一个线程访问共...

dust8080
今天
6
0
OSChina 周四乱弹 —— 当你简历注水但还是找到了工作

Osc乱弹歌单(2019)请戳(这里) 【今日歌曲】 @花间小酌 :#今日歌曲推荐# 分享成龙的单曲《男儿当自强》。 《男儿当自强》- 成龙 手机党少年们想听歌,请使劲儿戳(这里) @hxg2016 :刚在...

小小编辑
今天
3.3K
22
靠写代码赚钱的一些门路

作者 @mezod 译者 @josephchang10 如今,通过自己的代码去赚钱变得越来越简单,不过对很多人来说依然还是很难,因为他们不知道有哪些门路。 今天给大家分享一个精彩的 GitHub 库,这个库整理...

高级农民工
昨天
9
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部