R语言怎么删除重复数据

发布时间:2022-03-05 15:03:39 作者:iii
来源:亿速云 阅读:1119

这篇文章主要介绍了R语言怎么删除重复数据的相关知识,内容详细易懂,操作简单快捷,具有一定借鉴价值,相信大家阅读完这篇R语言怎么删除重复数据文章都会有所收获,下面我们一起来看看吧。

R 删除重复数据的方法,包括duplicated 和unique 针对duplicated, 对向量的元素或数据框的行进行操作的时候,返回逻辑值,以下面的数据框为例:  dat   A B C D1  a b a c2  c k b d3  c k c c4...

R 删除重复数据的方法,包括duplicated 和unique

针对duplicated, 对向量的元素或数据框的行进行操作的时候,返回逻辑值,以下面的数据框为例:

 dat
   A B C D
1  a b a c
2  c k b d
3  c k c c
4  d e q k
5  e f g l
6  h g h q
7  j f q k
8  a b a c
9  e f g l
10 o o l m
 duplicated(dat)
 [1] FALSE FALSE FALSE FALSE FALSE FALSE FALSE  TRUE  TRUE FALSE

dat是一个十行的数据框,其中第8行和第1行重复,第9行和第5行的数据重复,所以,返回值的第8和第9是TRUE,因此,可以按照如下操作,排除为TRUE,也就是重复的数据,只取数据第一次出现的结果。

  dat[!duplicated(dat),]
   A B C D
1  a b a c
2  c k b d
3  c k c c
4  d e q k
5  e f g l
6  h g h q
7  j f q k
10 o o l m

duplicated可以针对具体区域进行重复数据的判断,例如:

  dat[!duplicated(dat[,c("A","B")]),]
   A B C D
1  a b a c
2  c k b d
4  d e q k
5  e f g l
6  h g h q
7  j f q k
10 o o l m

  dat[!duplicated(dat[1:8,]),]
   A B C D
1  a b a c
2  c k b d
3  c k c c
4  d e q k
5  e f g l
6  h g h q
7  j f q k
9  e f g l
10 o o l m

 dat[!duplicated(dat[1:8,c("A","B")]),]
   A B C D
1  a b a c
2  c k b d
4  d e q k
5  e f g l
6  h g h q
7  j f q k
9  e f g l
10 o o l m

unique 针对向量和着数据框进行处理,会直接将删除重复后的结果进行返回,返回结果取首次出现结果:

 unique(dat)
   A B C D
1  a b a c
2  c k b d
3  c k c c
4  d e q k
5  e f g l
6  h g h q
7  j f q k
10 o o l m

两种处理结果,原行名都未发生变化。

关于“R语言怎么删除重复数据”这篇文章的内容就介绍到这里,感谢各位的阅读!相信大家对“R语言怎么删除重复数据”知识都有一定的了解,大家如果还想学习更多知识,欢迎关注亿速云行业资讯频道。

推荐阅读:
  1. mysql如何删除重复数据方法
  2. oacle 删除重复数据

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

r语言

上一篇:R语言怎么处理大数据时内存out of memory的问题

下一篇:怎么用awk对某一列数据取对数

相关阅读

您好,登录后才能下订单哦!

密码登录
登录注册
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》