文档章节

大数据分析——如何消除金融不确定性

大数据之路
 大数据之路
发布于 2012/09/10 18:16
字数 1910
阅读 269
收藏 2

“信息是用来消除不确定性的东西。”——香农《信息论》

“大数据的本质,就是通过信息消除不确定性。”——吴军《硅谷之谜》

桑文锋非常认同这两点,引入更多的信息,可以消除更多的不确定性,这就是为什么信息是重要的。显然大数据是更多的信息,在数据处理上可以在业务中起到更多作用。

数据到底能做什么?一点是数据驱动决策,另一点是数据驱动人工智能。

数据驱动决策主要是 BI 方面,不论是做产品改进、营销、运营监控、商业决策,都是通过收集更多的数据,让决策变得更加有效,而非拍脑袋凭感觉。

数据驱动产品智能方面更多体现数据价值,驱动决策只能发挥 20% 的价值。基于数据改进产品,数据的价值远远大于几张报表。驱动产品智能更多称为 AI 人工智能,智能就是在数据的基础上,通过一些策略算法,例如深度学习,得出结果,把结果回归到产品里,产品本身具有学习能力就是一种智能。

数据处理的第一步是数据采集;第二步是数据建模,整合数据模型;第三步是通过数据模型做数据分析;最后一步是做指标。

第一步 数据采集

数据采集原则

数据采集离不开数据源,这是桑文锋八年百度构建数据平台的经验之谈。数据分析出问题,往往是数据本身收集不够好,基于如此的基础上建高台,肯定是不稳定的。基于随心所欲的需求出业务报表,就会发现日后的想法没有数据支撑。如何把数据源整好?原则就是大、全、细、时。

  • 大”强调宏观的“大”,而非物理的“大”。大数据不是一味追求数据量的“大”,比如每天各地级市的苹果价格数据统计只有2MB,但基于此研发出一款苹果智能调度系统,就是一个大数据应用;

  • “全”强调多种数据源。大数据采集讲求全量,而不是抽样。除了采集客户端数据,还需采集服务端日志、业务数据库,以及第三方服务等数据,全面覆盖。

  • “细”强调多维度数据采集,即把事件的维度、属性、字段等都进行采集。如电商行业“加入购物车”的事件,除了采集用户的 click 数据,还应采集用户点击的是哪个商品、对应的商户等数据,方便后续交叉分析。

  • “时”强调数据的时效性。显然,具有时效性的数据才有参考价值。

数据采集方式


数据采集方式共有三种:第一类是通过界面配置采集的可视化埋点;第二类是通过前端和后端将核心逻辑的数据信息、维度信息记录下来的代码埋点;第三类是人工审核数据,实时、批量引入的辅助工具导入。

第二步 数据建模

数据建模阶段,许多人对数据分析存在一个很严重的错误理解:将数据库当成数据仓库使用。这将导致三个问题。

  • 业务人员难以理解,无法直接使用复杂的数据库,或者业务数据经常改变,达不到人人皆可用数据的状态,效率降低。

  • 常规数据库性能降低。常规数据库无法很好地支持大批量数据或长时间跨度数据分析。

  • 数据不全,无法灵活组合做分析。

第三步 数据分析

针对用户的运营情况,我们有不同的模型进行专业分析,如用户分群、漏斗分析、留存分析等。之所以可以做到专业化、标准化,是因为前期数据基础采集与建模工作的专业,使数据分析工作变得容易。

第四步 指标

把业务常关注的东西指标化,是数据分析的正确思想。金融行业天然跟数据打交道,在获取信息的过程中,大家需要围绕业务建立指标体系,如获客渠道、用户激活情况、复投复购率、交易数据、引荐奖励等,这些指标也都体现在了 AARRR 模型中。

案例一 渠道优化


金融类产品的获客成本还是相对较高的,渠道分析非常重要。以互金行业融 360 为例,融 360 作为一个连接贷款机构的中间平台,肩负桥梁作用,贷款机构的许多数据不能做到实时交互。如果广告推广只能跟踪到点击行为,无法跟踪转化与消费,就会缺失核心数据,所以要进行渠道分析。

如上图,将用户的价值数据打通,为公司提供可以全景观察的数据,在渠道分析层面,市场部门通过对效果转化的分析来判断广告取舍,从而让每一分钱都花的更有价值。

案例二 产品优化

互联网金融产品业务复杂,产品更需优化。举个例子,某产品有一个拉新的理财项目,新人第一次使用返利 9.9%,很多人在使用过程中发生了获取验证码失败的问题,用户只能流失,并且还容易损伤产品口碑。这个例子充分说明了拉新容易留存难的事实。细致监控用户注册、转化、激活过程,优化产品功能,让用户体验到产品的优势,有助于用户留存。

案例三 用户流失

用户流失率是每个产品的核心指标之一。每一个用户都是企业花钱“买”来的,拉新成本非常高,企业更希望用户在自建平台上持续活跃,而非每次都要通过广告跳转过来。这也是自建平台的核心价值之一:为用户提供落地页,减少营销成本。甚至我们还希望用户引荐身边的人,进一步降低获客成本。对用户进行详细的留存分析和流失分析,可以及时找到运营问题环节,对用户“查漏补缺”。

优质运营的本质是不断细分,针对不同的用户使用不同的策略。最极端的案例就是个性化运营,每一个人都拥有定制版本。传统银行业务通常采用这种方式,但是互联网用户过多,所以需要用有限的设备和工具做精细化运营。

神策数据的产品神策分析有三个特点:

  • 私有化部署,帮助金融产品保障数据源头安全。

  • 基础数据采集与建模,为客户梳理搭建数据基础。

  • PaaS 平台深度开发,帮助金融产品对接自有的系统。

欢迎大家关注“神策分析”,或访问我们的官网了解产品:神策数据

本文转载自:https://zhuanlan.zhihu.com/p/27110959

大数据之路
粉丝 1601
博文 515
码字总数 335917
作品 0
武汉
架构师
私信 提问
每个数据科学家都该读的五本无关技术的书

     大数据文摘出品   编译:M、小七   2010年,我在华盛顿大学的一节课上写了我的第一行R代码。当我意识到代码比电子表格更强大时,我立马就迷上了。在过去十年中,我目睹了“数据...

大数据文摘
2018/09/10
0
0
大数据、机器学习及人工智能必读书目——《数学之美》

  计分析、机器学习即人工智能必读书目系列之数学之美      我们已经进入了全新的数据时代,大数据、云计算、物联网、机器学习、人工智能等等一系列技术纷至沓来,数据的管理和应用已经...

爱编程爱统计
2017/09/09
0
0
AI=机器学习²,我们在去往²的路上 | 普林斯顿范剑青教授

雷锋网AI金融评论报道,在9月18日“2018世界人工智能大会”智能金融主题论坛上,中国互联网金融协会会长李东荣,加州大学伯克利分校迈克尔·欧文·乔丹(Michael I. Jordan)教授,复旦大学大...

陈伊莉
2018/09/20
0
0
T11 2017暨TalkingData智能数据峰会

TalkingData用数据诠释感性的改变,同一个世界,同一个语言。世界运转,社会发展,移动互联,再到人们生活的点点滴滴,我们用数据的语言沟通,用数据的思维改变。 以大数据的思维,改变对精确...

活动家
2017/08/23
7
0
数学之美札记:信息的度量和作用

1948年,香农在著名论文“通信的数学原理”中提出了“信息熵”的概念,解决了信息的度量问题,并且量化出信息的作用。 香农使用了“比特”(Bit)这个概念来度量信息量。一个比特是一位二进制...

Realfighter
2015/06/07
486
0

没有更多内容

加载失败,请刷新页面

加载更多

CentOS7.6中安装使用fcitx框架

内容目录 一、为什么要使用fcitx?二、安装fcitx框架三、安装搜狗输入法 一、为什么要使用fcitx? Gnome3桌面自带的输入法框架为ibus,而在使用ibus时会时不时出现卡顿无法输入的现象。 搜狗和...

技术训练营
今天
3
0
《Designing.Data-Intensive.Applications》笔记 四

第九章 一致性与共识 分布式系统最重要的的抽象之一是共识(consensus):让所有的节点对某件事达成一致。 最终一致性(eventual consistency)只提供较弱的保证,需要探索更高的一致性保证(stro...

丰田破产标志
今天
7
0
docker 使用mysql

1, 进入容器 比如 myslq1 里面进行操作 docker exec -it mysql1 /bin/bash 2. 退出 容器 交互: exit 3. mysql 启动在容器里面,并且 可以本地连接mysql docker run --name mysql1 --env MY...

之渊
今天
7
0
python数据结构

1、字符串及其方法(案例来自Python-100-Days) def main(): str1 = 'hello, world!' # 通过len函数计算字符串的长度 print(len(str1)) # 13 # 获得字符串首字母大写的...

huijue
今天
5
0
PHP+Ajax微信手机端九宫格抽奖实例

PHP+Ajax结合lottery.js制作的一款微信手机端九宫格抽奖实例,抽奖完成后有收货地址添加表单出现。支持可以设置中奖概率等。 奖品列表 <div class="lottery_list clearfix" id="lottery"> ......

ymkjs1990
今天
4
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部