文档章节

数据挖掘案例:建立客户流失模型

 数据分析师
发布于 2014/11/28 10:41
字数 1207
阅读 20
收藏 0
 随着市场竞争的加剧,中国电信面临的压力越来越大,客户流失也日益增大。从统计数据看,今年固话小灵通的销户数已经超 过了开户数。面对如此严峻的市场形式,当务之急就是要尽全力减少客户的流失。因此,利用数据挖掘方法,建立一套可以及时预测客户流失率的模型就相当有必要。

      (一)确定客户流失模型的目标:预测可能流失的客户名单。经过对市场的分析,我们发现固话小灵通流失率比较大,而宽带等数据业务还处于增长期,流失率比较小。因此,我们把预测的产品范围限定在固话和小灵通上。另外,我们也不考虑那些因为欠费被强制销户的客户,因为这些客户没有什么价值。还有,对已经加入了某一类有销户时间限制套餐且未到期的客户也可以不考虑。这样,我们建模的目标范围变得更加明确。

      (二)获取用于建模的数据。建模的数据可以从各个营运系统中提取。可以从IBSS系统提取客户数据、服务数据、产品数据、套餐数据、业务数据:从计费账务系统提取市话计费数据、长途计费数据、智能网计费数据、省数据业务计费数据;从CMMS系统提取渠道数据;从资源系统提取地址数据、资源数据;从交换系统提取通话数据等等。另外有一些数据需要通过市场调查获取,比如调查哪些地区是其他运营商有布线的固话竞争区域。可以在区域范围内的交接箱资料加上“竞争区域”的标识。

      (三)对数据进行清洗、格式化,转换成建模数据集。一个客户可能有多个固话和小灵通,销户指的是固话小灵通拆机,而不是指客户不再使用所有的电信产品。因此真正的客户预测流失上并不具有价值。经过分析,我们确定建模的对象为服务实体,即固话和小灵通。模型集的行代表一个固话或小灵通,计费等数据则对应到各个列。另外。为了使预测结果更接近于现实情况,我们取最近12个月的计费数据。接下来,我们要剔除一些无效的变量,如身份证号、电话号码、绝对日期、地址数据等。这些交量对建模没有用处。最后就是加入衍生变量。这个过程需要我们对电信业务进行深入的分析并充分发挥创造性,这样才能生成一组对建模很有意义的衍生变量。如根据固话对应的交接箱,我们提取出“是否处于竞争区域”的变量;从通话日期可以提取出“星期几”、“是否节假日”等变量,另外,还可以通过组合生成全部月份的变量总和及其方差,各月变量占总和的比等变量。经过这些清洗和转换工作,我们便生成了用于建模的数据集。

      (四)建立模型。我们选用SAS EM软件包作为建模工具,在挖掘算法方面选用决策树算法。决策树算法可以处理上百个字段,具有探索功能,且高度自动化。考虑到固话和小灵通这两类产品有很大的区别,因此需要分别建立预测模型。接下来,我们对客户进行分类。按月平均消费额分成高价值客户和低价值客户。另外再分出两类特殊客户,近期开户的客户和有申请套餐的客户,对这四类客户分别建立模型,再将模型进行合并。

      (五)模型评估。对模型的评估同样分成四类客户分别评分。即生成四类客户的评分数据集,分别输入模型中,得出预测结果。把结果和实际情况进行比较来评价模型的有效性。

      (六)模型预测结果用于支持决策。客户流失率预测模型建立后,我们就及时预测某个客户流失的可能性大小。当其流失可能性高于某一分值,我们就认为他是将可能流失的客户,就可以及时的推出针对性的营销套餐来留下该客户

© 著作权归作者所有

共有 人打赏支持
粉丝 30
博文 1645
码字总数 2338861
作品 0
邢台
数据挖掘的三大趋势——专访SAS首席技术顾问张磊

数据挖掘的英文是Data Mining,直译就是数据挖掘。韩家炜教授在《数据挖掘:概念与技术》一书中介绍过数据挖掘一词的来源。在科研界,最初一直沿用“数据库中的知识发现”,即KDD,Knowledge...

liangtee
2013/01/04
0
0
数据挖掘 流程简介

我们这就是有 企业挖掘中最常用的 《流失用户分析》来说明: 数据挖掘流程: 1. 定义主题 :天啊,我在干什么!( 此模块绝大多数主观意识上完成,有少量客观验证) 1.1 明确主题用户在各用户...

walb呀
2017/12/07
0
0
【每周一本书】之《数据可视化与数据挖掘》:基于Tableau和SPSS Modeler图形界面

数据猿导读】 大数据时代正在改变着我们的生活、工作和思维,要让大数据发挥出最大价值,最重要的手段就是进行数据可视化挖掘。利用可视化数据挖掘工具和技术,分析人员能够从全新的角度快速...

ympzuelx3aiap7q
01/16
0
0
八场直播,八大案例,书籍同步!一次性搞定Python数据科学案例实战!-第五讲作业(数据见附件)

课程链接: https://edu.hellobi.com/course/280 电信公司希望针对客户的信息预测其流失可能性,数据存放在“telecom_churn.csv”中。 分析思路: 在对客户流失与否的影响因素进行模型研究之前...

Ben_Chang
06/12
0
0
大数据建模的九大形式,你知道吗?(下)

第五,模式律(大卫律):数据中总含有模式。 我们可能预料到一些数据挖掘项目会失败,因为解决业务问题的模式并不存在于数据中,但是这与数据挖掘者的实践经验并不相关。 这是因为:在一个与业...

陈安妮annie1
2017/12/27
0
0

没有更多内容

加载失败,请刷新页面

加载更多

django rest framework 外键序列化方法与问题总结

django rest framework 外键序列化方法与问题总结 当借口中需要出现一对多关系的时候,我们可以用rest_framwork的序列化功能来处理,代码如下. # models.pyfrom django.db import modelscl...

_Change_
昨天
1
0
SingleNumber136 leetCode

Given a non-empty array of integers, every element appears twice except for one. Find that single one. Note: Your algorithm should have a linear runtime complexity. Could you im......

woshixin
昨天
1
0
String ,  StringBuffer ,  StringBuilder的区别

String , StringBuffer , StringBuilder的区别 String 首先,String 是用来表示一个字符串常量的,它是一个不可变对象,意味着,一旦我们创建了某个字符串之后,就不能再改变它的值了,我们可...

tsmyk0715
昨天
3
0
区块链100讲:UTXO 和 Account 模型对比

在当前区块链世界中,主要有两种记录保存方式,UTXO 模式(Unspent Transaction Output) 和 Account 模式。Bitcoin 采用的是 UTXO 模型,Ethereum 采用的 Account 模型,同样 CITA 也采用了 ...

HiBlock
昨天
1
0
Vue中路由管理器Vue Router使用介绍(三)

一、路由定义添加动态参数定义 1.路由定义项,使用:xx 方式 定义动态参数 { path:'/user/:id/:name', name:'user', component:()=>import('./views/User.vue') ...

tianma3798
昨天
1
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部