文档章节

R语言系列:生成数据

explore
 explore
发布于 2012/09/19 09:00
字数 832
阅读 644
收藏 1

生成规则数据
1、使用“:“,如x=1:10,注意该方法既可以递增也可以递减,如y=10:1
2、seq,有两种用法:①seq(起点,终点,步长); ②seq(length=9, from=1, to=5)
    seq还有一种简写:seq(x)    #相当于1:length(x),但当length(x)为0时,返回integer(0)
3、c(1,2,8)
4、使用scan(),可以等待键盘输入。输入过程中,可以使用空格分隔每个元素,也可以一行输入一个元素。输入完毕只需键入一个空行即可。
5、rep(x,n)    #将x重复n次,可使用each限定为依次重复形式
    rep(1:3,3)
    rep(1:3,each=3)
6、sequence(c(4,9))    构造一个包含1:4和1:9共13个元素的向量
7、gl(k,n,length=,label=)构造一个因子序列。k为水平数,n为每个水平连续出现的次数,length为整个序列的长度,label为因子标签。
举例:gl(3,5,length=20,label=c('a','b','c'))
8、expand.grid(a=1:3,b=1:4,c=c('x','y','z'))构造一个数据框,将各参数的各水平完全搭配。
9、paste:该函数每次从每个参数中提取一个元素组成一个字符串,直至元素最多的参数取完,其它元素不足的参数循环补足。 可接受多个参数,每个参数可包括多个元素。例:paste(c("X","Y"), 1:10, sep="")
10、combn(x, n)    #生成x中取n个元素的所有组合

常用随机数字
runif(n,min=0,max=1)    #uniform,均匀分布
rnorm(n,mean=0,sd=1)    #Gaussian(normal),正态分布
rexp(n,rate=1)    #exponential,指数分布
rlnorm(n,meanlog=0,sdlog=1)    #lognormal,对数正态分布
rdirichlet    #狄利克雷分布,不在默认包里,需安装其他包如rBeta2009、MCMCpack、gtools。
 

随机抽样
sample(x, n, replace=FALSE, prob=)
sample(10)    #随机排列1:10,默认不重复抽样
sample(10, 5)    #从1:10中随机抽5个,不重复抽样
x=10:20; sample(x);    #随机排列x
sample(10, replace=TRUE)    #从1:10中随机抽10次,允许重复抽样
sample(0:1, 100, replace=TRUE)    #100次伯努利试验
sample(c(0,1), 10, replace=TRUE, prob=c(0.1, 0.9))    #分别以0.1和0.9的概率抽取0和1

字符切割
strsplit(x, split, fixed = FALSE, perl = FALSE)
    #根据split将x分割,若split=“”,则将x分为单个字符。
    #默认split为正则表达式,可使用fixed=TRUE,对split做精确匹配
    #当perl=TRUE时,使用perl的正则表达式规则
    #当分隔符为?, +, {, |, (, )时,要使用'\\'来消除特殊含义

字符连接
paste(letters,collapse='')    #将26个小写字母连成一个字符串
    #使用collapse指定的连接符,连接paste的结果为一个字符串
    #鉴别以下几种情况
paste(letters[1:5])    #不能连接,输出5个字母:"a" "b" "c" "d" "e"
paste("a", "b", "c", "d", "e", sep='')    #输出"abcde",注意和前者的差别
paste(1:3,4:6,collapse='-')    #输出"1 4-2 5-3 6"
paste(1:3,4:6,sep='',collapse='-')    #输出"14-25-36"
paste(c(1:3,4:6),collapse='-')    #输出"1-2-3-4-5-6"

R语言中的内嵌常量
LETTERS    #26个大写字母
letters    #26个小写字母
month.abb    #12个月份的三字母缩写
month.name    #12个月份的全称
pi    #3.14...
字母和月份可以取部分子集,例:letters[c(1:8)]

© 著作权归作者所有

共有 人打赏支持
explore
粉丝 13
博文 60
码字总数 34421
作品 0
太原
R语言学习笔记之聚类分析

使用k-means聚类所需的包: factoextra cluster #加载包 library(factoextra) library(cluster)l #数据准备 使用内置的R数据集USArrests #load the dataset data("USArrests") #remove any m......

R语言中文社区
01/16
0
0
天善智能数据分析可视化广深特训营第一期:R语言(初中级)圆满结束!

7月22日,天善智能数据分析可视化广深特训营第一期在深圳福田赛格广场落下帷幕。 本次参与培训的,有来自平安证券,oppo,顺丰科技,投哪网等企业一线的数十名数据分析人员。 本次线下培训,...

天善智能
07/24
0
0
【沙龙资料】模型效果评估及优化—天善智能数据之美深圳站谢佳标老师分享

本文为谢佳标老师在天善智能数据之美深圳站的分享,更多精彩内容可以参加谢佳标老师系列课程:数据分析与挖掘R语言十三式,打造R全栈专家 1、模型效果评估常用方法 2、混淆矩阵 3、ROC曲线绘...

天善智能
06/12
0
0
【R图秀-2】社交网络数据可视化(一)

作者简介Introduction 傅兴:个人公众号:Rapp 往期回顾 为了进一步提高自己数据获取的能力,我把目光放到了互联网上一个重要的数据来源:社交网络(Social Network),比如国外的facebook和...

R语言中文社区
01/28
0
0
算法|决策树算法究竟说的是什么?

作者简介 浩彬老撕,R语言中文社区特邀作者。 个人公众号:探数寻理 决策树算法概述

kmd8d5r
05/10
0
0

没有更多内容

加载失败,请刷新页面

加载更多

将桌面捕获到虚拟摄像头

当然你可以直接用现成的虚拟摄像头软件实现这个功能。不过当初我开发这个插件的原因是,需要在Flash产品里面共享桌面,如果此时需要引导用户安装一个第三方的虚拟摄像头体验不好,所以公司希...

一个灰
22分钟前
1
0
Linux 配置网络绑定

1. 常见的网卡绑定驱动模式: mod=0 (balance-rr) Round-robin 衡抡循环策略 特点: 传输数据包顺序是依次传输(即:第1个包走eth0,下一个包就走eth1.一直循环下去,直到最后一个传输完毕),...

JeremyTown
31分钟前
0
0
VS code 编辑器使用技能

VS code 文档:https://code.visualstudio.com/docs/getstarted/locales 1、安装中文扩展包 打开扩展包按钮(最左上角从上往下数第5个按钮或者快捷键 Ctrl + Shift + X) 搜索语言包categor...

削个椰子皮_给个梨
40分钟前
1
0
Django 2.1.2项目中创建一个应用

Django 2.1.2项目中创建一个应用: 1.新建一个应用(app), 名称叫 learn python manage.py startapp learn # learn 是一个app的名称 2.在learn应用中修改视图文件views.py: # Create your vi...

MichaelShu
41分钟前
1
0
Swagger中配置了@ApiModelProperty的allowableValues属性但不显示的问题

现在用Swagger来生成API文档的例子已经非常多了,今天碰到开发同事问了一个问题,帮着看了一下,主要还是配置方法的问题,所以记录一下。如果您也碰到了同样的问题,希望本文对您有用。 问题...

程序猿DD
今天
5
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部