加载中
相对重要性

概念 简单就是说“哪些预测变量对响应变量影响最大”?或者“哪些变对预测最为重要” 预测变量不相关 直接计算预测变量与响应变量之间的相关系数,进行排序即可 预测变量有相关性 利用比较标...

2017/11/07 08:08
302
交叉验证

背景 对于OLS回归,通过使的预测误差(残差)平方和最小和对响应变量的解释度(R平方)最大,获得模型由于等式只是最优化已给出的数据,所以在新数据集上表现并不一定好 交叉验证 所谓交叉验...

2017/11/07 08:08
685
变量选择

当有大量的候选变量中选择最终的预测变量,有以下两种流行方法 逐步回归法(stepwise method) a、向前逐步回归(forward stepwise regression):每次添加一个预测变量到模型中,知道添加不会...

2017/11/07 08:07
191
模型比较

最终回归模型的选择总是会涉及预测精度(模型尽可能的拟合数据)与模型洁度(一个简单能复制的模型)的调和问题 模型比较 可以将模型中的某些变量增删,然后比较前后模型的拟合效果,比如说在...

2017/11/07 08:07
98
回归假设问题的改进

删除观测点 删除离群点可以提高数据集对于正态假设的拟合度,而强影响点会干扰结果,通常也会被删除,两者删除后模型需要重新拟合,一直重复上述过程,但是要谨慎把,因为有些删除会导致结果...

2017/11/07 08:07
181
离群点、杆杠值、强影响点整合到一幅图

影响图 使用car包中的influence()函数,可以将离群点、杆杠值、强影响点整合到一幅图形中 > library(car) > influencePlot(fit,id.method = "identify",main = "Influence Plot", + ...

2017/11/07 07:56
252
强影响点

概念 强影响点,即对模型参数估计值影响有些比例失衡的点,比如移除某个点,会导致模型发生巨大的变化 如何检测 1、检测强影像点:Cook距离,或称 D统计量,以及变量添加图(added varialepl...

2017/11/07 07:56
262
高杠杆值点

概念 高杠杆值观测点 ,即与其他预测变量有关的离群点,换句话说,他们是由许多异常的预测变量值组合起来的,与相应变量值没有关系 高杠杆点_百度百科 如何判断是否为高杆杠值点 通过帽子 统...

2017/11/07 07:56
624
离群点

概念 指预测效果不佳的观测点,通常很大的、或正或负 的残差( - ), 正的残差说明低估了响应值,负的高估了响应值 观测离群值的方法 1、通过 Q-Q图可以粗劣的看出离群值 2、标准化残差值大...

2017/11/07 07:55
66
多重共线性

多重共线性 当回归模型中两个或者两个以上的自变量彼此相关时,则称为回归模型中存在多重共线性 会导致模型参数的置信区间过大,使单个系数解释起来困难 vif() 可以使用VIF(Variance Inflat...

2017/11/07 07:55
75
线性模型假设的综合验证

gvlma() gvlma包中的gvlma()函数,对线性模型假设进行综合验证(通过/不通过),同时还能做偏斜度、峰度、异方差性的评价 > library(gvlma) > gvmodel <- gvlma(fit) > summary(gvmodel) C...

2017/11/07 07:55
374
回归诊断的改进方法

car中的函数 相比于R基础提供的评价模型拟合情况,car包中提供了大量函数,大大增强了拟合和评价回归模型的能力 函数 目的 qqplot() 分位数比较图 durbinWatsonTest() 对误差自相关性做Durbi...

2017/11/07 07:55
177
R基础提供的标准方法

plot() lm()函数返回对象使用plot()函数,可以生产给你评价模型拟合情况的四幅图形 fit <- lm(weight ~ height, data = women) par(mfrow=c(2,2)) #图将以2*2布局 plot(fit) OLS回归的统计假...

2017/11/07 07:55
81
有交互项的多元线性回归

例 若两个预测变量的交互项显著,说明响应变量与其中一个预测变量的关系依赖与另外一个预测变量的水平 #以mtcars数据框中的汽车数据为例,查看汽车重量和马力对mpg的影响 > fit <- lm(mpg ~ ...

2017/11/07 07:53
1.5K
多元线性回归

例 使用基础包中state.x77的数据集,想研究犯罪率与其他的关系 states <- as.data.frame(state.x77[,c("Murder", "Population", "Illiteracy", "Inco...

2017/11/07 07:49
369
简单线性回归和多项式回归

简单线性回归: 当回归模型中包含一个因变量和自变量时, 多项式回归:当只有一个与预测变量,但同时包含变量的幂(如,X^2,X^3) 多元线性回归:当有不止一个预测变量时 简单线性回归 例 #欲...

2017/11/07 07:48
1.4K
用lm()拟合回归模型

lm()拟合回归模型 在R中,拟合线性模型最基本的函数就是lm() myfit <- lm(formula,data) 1 myfit <- lm(formula,data) formula:指要拟合模型的形式 形式如下:y~ x1 + x2 +...+ xk,左边为响...

2017/11/07 07:47
2.8K
OLS回归

OLS回归 利用OLS法通过一系列的预测变量来预测响应变量,OLS回归拟合模型的形式 n:观测的数目 k:为预测变量的数目 :第 i 次观测对应的因变量的预测值(具体来讲,它是在已知预测变量值的条...

2017/11/07 07:46
388

没有更多内容

加载失败,请刷新页面

没有更多内容

返回顶部
顶部