1. 首页 > 科技

R语言分组计数求教 r语言分组函数

R语言分组计数求教r语言分组函数

如何利用R语言计数

其基本思想就是把百分数按照字符处理,首先将“%”与数字分离,然后再将数除以100,就可以化成小数了。下面两种方法的区别一个是将%替换成空格,一个是提取除百分号的数字。

> testdata<-data.frame(v1=c("78%", "65%", "32%"), v2=c("43%", "56%", "23%"))

> testnewdata1<-data.frame(lapply(testdata, function(x) as.numeric(sub("%", "", x))/100) )

> testnewdata1

v1 v2

1 0.78 0.43

2 0.65 0.56

3 0.32 0.23

> library(stringr)

> testnewdata2<-data.frame(lapply(testdata, function(x) as.numeric(str_extract(x,'[0-9.]+'))/100) )

> testnewdata2

v1 v2

1 0.78 0.43

2 0.65 0.56

3 0.32 0.23

替换百分号的思想还可以用下面的代码实现

> testnewdata3<-data.frame(lapply(testdata, function(x) as.numeric(gsub("\\%", "", x))/100))

> testnewdata3

v1 v2

1 0.78 0.43

2 0.65 0.56

3 0.32 0.23

如何用r语言进行数据分类

首先,原始数据是由name(名字),class(班级),course(课程)和score(分数)组成的,将其导入R语言并存储在Mydata对象里

接下来,我们利用sqldf包来处理分组汇总的问题。

由于sqldf包不是R语言自带的,所以先用以下代码安装sqldf包:

install.packages("sqldf")

然后选择“China(Beijing)”镜像站点进行安装,R语言会同时自动安装“sqldf”包的依赖包。

安装好sqldf包及其依赖包后,输入以下代码加载sqldf包:

library(sqldf)

一切准备就绪,接下来用sqldf统计每个同学的总成绩和平均分:

sqldf("select name,sum(score) as score_sum,avg(score) as score_avg from Mydata group by name")

统计每个班级的总成绩:

sqldf("select class,sum(score) as score_sum from Mydata group by class")

统计每个班级的每门课程的总成绩和平均分:

sqldf("select class,course,sum(score) as score_sum,avg(score) as score_avg from Mydata group by class,course")

求助:这个分组的计数怎么实现啊,先谢谢了!

请问版主,同样是这个表,我再查询中增加了字段[是否交纳],条件是='是',如何计数呢?其结果应该是办结所属月份 人员之计数 是否交纳之计数 交纳金额之计数2015年1月 2 1 12015年2月 2 1 1

R语言如何分组命名

cut(1:10,breaks = c(0,5,8,10))以此类推吧。上面是1:10 分为了三类,(0,5], (5,8]和(8,10]