r语言学习-因子
r语言学习-因子
lifearena 发表于3年前
r语言学习-因子
  • 发表于 3年前
  • 阅读 25
  • 收藏 0
  • 点赞 0
  • 评论 0

新睿云服务器60天免费使用,快来体验!>>>   

1、因子的因素是名义变量,即使是数字也意味着是分类,而不是真正的数字。

2、因子常用的函数

(1)tapply(x,f,g),x是向,f是因子,g是函数。

  (2)by ( ),由于tapply仅用于向量,不用于数据框和矩阵,因此不适合用于回归,而by()可以用于数据框和矩阵,因此可以用by,它与tapply的运作方式一样,只是应用范围更广。by(数据,分组因子,应用于每组的函数)

 (2)aggregate(),对分组中的每一个变量调用tapply()函数。

  (3) cut(x,b ), cut是生成因子的一种方法,x落在b的数据组成的区间,返回区间顺序号。

  (4) split(x,f ),split仅仅是将x分组,x可以是向量和数据框,而tapply()中的x只能是向量。split输出列表。

3、往数据框上加一列,可以直接在数据框后加$,然后加新变量名字,产生新的一列。例:d$over25<-ifelse(d$age>25,1,0)。

4、order给出的是原数据按频数多少进行排列,可以有给出的位置的值。

   table得到的结果是横着排列的频数表。

    as.data.frame得到的结果是竖着排列的数据框,而且对于频数那一列给出了频数变量Freq.    

  • 打赏
  • 点赞
  • 收藏
  • 分享
共有 人打赏支持
粉丝 0
博文 7
码字总数 1657
×
lifearena
如果觉得我的文章对您有用,请随意打赏。您的支持将鼓励我继续创作!
* 金额(元)
¥1 ¥5 ¥10 ¥20 其他金额
打赏人
留言
* 支付类型
微信扫码支付
打赏金额:
已支付成功
打赏金额: