文档章节

R计算IV

火力全開
 火力全開
发布于 06/22 17:41
字数 119
阅读 22
收藏 0

参考文章

#读取文件
rawdata = read.csv("/path/to/csv/file/credit.csv",header=T)
# colnames(rawdata)[18] <- "y"     //重命名因变量y

#数据分区 训练集测试集
trainIdx <- sample(nrow(rawdata), round(0.6*nrow(rawdata)))
traindata <- rawdata[trainIdx,]
validdata <- rawdata[-trainIdx,]
# nrow(traindata)

# binning cutoff calculation
library(smbinning)
V1bin=smbinning(df=traindata, y="application_approved", x="credit_score", p=0.05)
V1bin$ivtable
V1bin$bands

© 著作权归作者所有

火力全開
粉丝 21
博文 226
码字总数 18971
作品 0
卢湾
高级程序员
评分卡模型开发-定性指标筛选

定量指标是数值型的,我们还可以用回归的方法来筛选,那么定性的指标怎么办呢? R里面给我们提供了非常强大的IV值计算算法,通过引用R里面的informationvalue包,来计算各指标的IV值,即可得...

lll1528238733
2017/08/03
0
0
Kaggle----泰坦尼克的沉没2.0版本

学习R语言和数据分析已经一段时间了,目前进行到SQL从入门到精通这块,这段时间了解了一下二叉树,随机森林,这些大学期间就听过的名词,熟悉而陌生,走出了大学,又把老师曾给我的东西还给了...

十三
2017/09/07
0
0
手把手教你使用R语言做评分卡模型

感谢关注天善智能,走好数据之路↑↑↑ 欢迎关注天善智能,我们是专注于商业智能BI,人工智能AI,大数据分析与挖掘领域的垂直社区,学习,问答、求职一站式搞定! 作者介绍: 黄升,普兰金融...

天善智能
2017/11/22
0
0
数据挖掘模型中的IV和WOE详解

1.IV的用途 IV的全称是Information Value,中文意思是信息价值,或者信息量。 我们在用逻辑回归、决策树等模型方法构建分类模型时,经常需要对自变量进行筛选。比如我们有200个候选自变量,通...

火力全開
06/21
0
0
BAT机器学习面试题及解析(261-265题)

本系列作为国内首个AI题库,囊括绝大部分机器学习和深度学习的笔试面试题、知识点,可以作为机器学习自测题,也可以当做查漏补缺的资料库。前260题已发(链接见文末),后续请关注本公众号。...

t7sfokzord1jaymsfk4
2017/12/11
0
0

没有更多内容

加载失败,请刷新页面

加载更多

Oracle return exit continue

常在循环体中看到下面3种语句: return exit continue 举例说明 啥都没有 -- none begin for i in 1 .. 10 loop if i < 5 then dbms_output.put_line('i < 5, i = ' || to_char......

taadis
今天
2
0
JSONObject 转换时出错 InvocationTargetException

JSONObject 转换时出错java.lang.reflect.InvocationTargetException 一时看不出来是什么问题。 挺奇怪的。 百度参考了一下这个 网页的解决方案 说是类型不对,空? 仔细查看代码,果然是有一...

之渊
今天
3
0
no such module 'pop'问题

在github上 clone 了一个 swift 项目,编译时提示"no such module 'POP'"错误,查了一下居然是因为podfile中指定的最低版本是iOS 11.0,大于我测试手机的iOS版本10.3.3,将Podfile中的最低版...

yoyoso
今天
3
0
redis 系列一 -- 简介及安装

1.简介 redis -- remote dictionary server 远程字典服务 使用 C 语言编写; 高性能的 key-value数据库; 内存数据库,支持数据持久化。 Redis 是一个开源(BSD许可)的,内存中的数据结构存...

imbiao
今天
4
0
nginx log记录请求响应时间

有时为了方便分析接口性能等,需要记录请求的时长,通过修改nginx的日志格式可以做到,如 添加一个新的log_format log_format timed_combined '$remote_addr - $remote_user [$time_local] "...

swingcoder
今天
5
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部