加载中
R与其他语言的注意点

对象名称中的句点"." 这个“.”没有特殊的意义,但美元符号“$”却和其他的语言“.”类似的含义,即指定一个数据框或列表中的某些部分 对象 在R中,对象(object)是指可以赋值给变量的任何值...

2017/11/06 10:31
45
R基础提供的标准方法

plot() lm()函数返回对象使用plot()函数,可以生产给你评价模型拟合情况的四幅图形 fit <- lm(weight ~ height, data = women) par(mfrow=c(2,2)) #图将以2*2布局 plot(fit) OLS回归的统计假...

2017/11/07 07:55
81
R中的主成分和因子分析

主成分分析(PCA) a、一种降维技巧,将大量相关变量转化为一组很少的相关变量,这些无关变量称为主成分 b、用一组较少的不相关变量代替大量相关变量,同时尽可能保留初始变量的信息,,推导所...

2017/11/07 08:49
552
变量选择

当有大量的候选变量中选择最终的预测变量,有以下两种流行方法 逐步回归法(stepwise method) a、向前逐步回归(forward stepwise regression):每次添加一个预测变量到模型中,知道添加不会...

2017/11/07 08:07
191
探索缺失值模式

列表显示缺失值 使用complete.case() 函数列出完整的实例,但是如果数据集大,较为麻烦 使用 mice包中的 md.pattern() 方法 > library(mice) > data(sleep,package="VIM") > md.pattern(sle...

R
2017/11/08 01:12
512
相对重要性

概念 简单就是说“哪些预测变量对响应变量影响最大”?或者“哪些变对预测最为重要” 预测变量不相关 直接计算预测变量与响应变量之间的相关系数,进行排序即可 预测变量有相关性 利用比较标...

2017/11/07 08:08
302
其他EFA相关的包和其他潜变量模型

其他EFA相关模型 R包含了其他许多对因子分析非常有用的软件包。 FactoMineR包不仅提供了 PCA 和 EFA 方法,还包含潜变量模型。它有许多此处我们并没有考虑的参数选项,比如数值型变量和类别型...

2017/11/07 08:51
101
生成时间序列

在R中生成时序对象 在R中分析时间序列的前提是我们将分析 对象转为时间序列对象(time-series object),即在R中一种包括观测值、起始时间、终止时间以及周期(如月、季度或年)的结果 一个 ...

2017/11/07 08:57
215
变量的重编码

重编码变量 如将1~99的之间的年龄分为Young、Middle Aged、Elder 案例 #重新编码变量 #年龄99设置成NA > leadership$age[leadership$age == 99] <- NA #variable[condition] <- expression...

2017/11/06 11:11
219
数据集取子集

选入(保留)变量 #以下几种方式获取子集的结果是相同的 > newdata <- leadership[,c(6:9)] #获取列下标为6-9 的数据包含6和9 > View(newdata) > myvars1 <- c("q1","q2","q3","q4"...

2017/11/06 11:13
46
R语言的介绍

获取帮助 函数 功能 help.start() 打开帮助文档首页 help("foo")或?foo 查看函数foo的帮助(引号可以省略) example("foo") 函数foo的使用示例(引用可以省略) RSiteSearch"foo" 以foo为关键...

2017/11/06 10:10
671
缺失值及处理

is.na() 检测缺失值是否存在 > y <- c(1,2,NA,3) > is.na(y) [1] FALSE FALSE TRUE FALSE #注意 is.na()函数是如何作用于一个对象上的,它将返回一个相同大小的对象 #某个元素是 NA ,则返回...

2017/11/06 11:11
67
季节性分解

季节性因素的时间序列 存在季节性因素的时间序列(如月度数据、季度数据)可被分解为趋势因子、季节性因子、随机性因子 趋势因子(trend componnet):能捕捉到长期变化; 季节性因子(seasonal...

2017/11/07 08:57
676
glm()

R中使用glm()函数拟广义线性模型,其格式为 glm(formula,family= family(link=funciton),data = ) 概率分布(famiily)和相应默认的连接函数(function) glm()参数表 分布族 默认的连接函数...

用lm()拟合回归模型

lm()拟合回归模型 在R中,拟合线性模型最基本的函数就是lm() myfit <- lm(formula,data) 1 myfit <- lm(formula,data) formula:指要拟合模型的形式 形式如下:y~ x1 + x2 +...+ xk,左边为响...

2017/11/07 07:47
2.9K
ANOVA模型拟合

aov() aov()函数的语法为 aov(formual,data=dataframe) 1 1 aov(formual,data=dataframe) y是因变量,字母A、B、C代表因子 R 表达式中的特殊符号 符号 用法 ~ 分隔符号,左边为响应变量,右边...

2017/11/07 08:18
443
交叉验证

背景 对于OLS回归,通过使的预测误差(残差)平方和最小和对响应变量的解释度(R平方)最大,获得模型由于等式只是最优化已给出的数据,所以在新数据集上表现并不一定好 交叉验证 所谓交叉验...

2017/11/07 08:08
685
拓展

R中拓展的Logistic回归和变种如下所示 稳健Logistic 回归 robust 包中的glmRob()函数可用来拟合稳健的广义线性模型,包括稳健Logistic回归。当拟合Logistic回归模型数据出现iqundian和强影响...

K均值聚类

K均值(k-means)算法 a、选择 K 个中心点(随机选择 K 行) b、把每个数据点分配到离它最近的中心点 c、重新计算每类中的点到类中心距离的平均值(也就是说,得到长度为 p 的 均值向量,这里的 ...

2017/11/08 00:36
564
分组

在R中,组通常用分类变量的水平(因子)来定义,分组是通过ggplot2图将一个或者多个带有诸如形状、颜色、填充、尺寸和线类型的视觉特征的分组变量设置完成,ggplot()声明中的 aes() 函数负责...

没有更多内容

加载失败,请刷新页面

返回顶部
顶部