博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
R 数据处理 ①
阅读量:6229 次
发布时间:2019-06-21

本文共 1109 字,大约阅读时间需要 3 分钟。

  • 数据采样:
setwd("E:\\Rwork")set.seed(1234)index <- sample(1:nrow(iris),10, replace = T)indexsample_set <- iris[index,]index <- sample(nrow(iris),0.75*nrow(iris))sample_set <- iris[index,]
  • 数值离散化
data(iris)buckets <- 10maxseplen <- max(iris$Sepal.Length)minseplen <- min(iris$Sepal.Length)cutpoints <- seq(minseplen, maxseplen, by = (maxseplen - minseplen ) / buckets )cutpointscutseplen <- cut(iris$Sepal.Length, breaks = cutpoints , include.lowest = TRUE)newiris <- data.frame(contseplen = iris$Sepal.Length , discseplen = cutseplen)newiris
  • 数据合并

最常用merge()函数,但是这个函数使用时候这两种情况需要注意:

1、merge(a,b),纯粹地把两个数据集合在一起,没有沟通a、b数据集的by,这样出现的数据很多,相当于a*b条数据;
2、merge函数是匹配到a,b数据集的并,都有的才匹配出来,如果a、b数据集ID不同,要用all=T(下面有all用法的代码)。

ID<-c(1,2,3,4)  name<-c("Jim","Tony","Lisa","Tom")  score<-c(89,22,78,78)  student1<-data.frame(ID,name)  student2<-data.frame(ID,score)  total_student<-merge(student1,student2,by="ID")  #或者rbind()  total_student
ID<-c(1,2,3)  name<-c("Jame","Kevin","Sunny")  student1<-data.frame(ID,name)  ID<-c(4,5,6)  name<-c("Sun","Frame","Eric")  student2<-data.frame(ID,name)  total<-cbind(student1,student2)  total

转载地址:http://foxna.baihongyu.com/

你可能感兴趣的文章
物联网的三层架构
查看>>
linux性能剖析工具
查看>>
Mysql数据库安装---解压版
查看>>
在多文档应用程序中使用OpenGL绘图
查看>>
【转】HTTP状态码(HTTP Status Code)
查看>>
在Eclipse下搭建Android开发环境教程,HelloWord
查看>>
python自动化测试——设置元素等待
查看>>
Ubuntu下使用SVN
查看>>
shutdown与startup命令
查看>>
swift -- 计步器CMPedometer的使用
查看>>
zTree的重点
查看>>
Java 文件读写操作
查看>>
BDFL
查看>>
poj1411
查看>>
java中的throw与throws的区别
查看>>
Error: Password file read access must be restricted: /etc/cassandra/jmxremote.password
查看>>
常用的垃圾回收算法
查看>>
DP ZOJ 3872 Beauty of Array
查看>>
SSH整合报错:找不到元素 'beans' 的声明
查看>>
Spring 依赖注入方式详解
查看>>