Removing multiple values in R

Question

I have a dataset with like 14,000 rows and 40 columns I'm trying to remove all the rows with the below values in the first column of the data set, but when I do something like

filter(data_set, data_set$DMS != rem)


rem <- c("02M177","02M267", "02M933","03M452","05M148","06M178","06M209","07X359","09X274","09X294","09X311","09X350","09X361","09X555","11X355","12X314","14K414","17K532","18K763","19K404","19K557","19K654","19K661","19K662","19K663","19K760","20K264","20K971","23K446","23K599","23K664","23K668","24Q290","24Q311","24Q330","27Q273","27Q297","27Q362","28Q287","28Q332","29Q289","30Q280","30Q291","30Q300","31R028","31R078")

It doesn't work. Is there an easy way to do this or do I have to make a function?

score 4 · Answer 1 · answered Dec 31 '15 at 22:37

4

Or this (which makes it clear you filtering on rows):

data_set[!data_set$DMS %in% rem,]

answered Dec 31 '15 at 22:37

fishtank

3,718
1
14
16

score 3 · Answer 2 · answered Dec 31 '15 at 21:41

3

You can also use subset:

subset(data_set, ! DMS %in% rem)

answered Dec 31 '15 at 21:41

Zelazny7

39,946
18
70
84

Ben Bolker · Answer 3 · 2015-12-31T22:03:56.063

2

You need filter(data_set, ! DMS %in% rem)

example:

dd <- data.frame(f=letters[1:6],x=1:6)
library("dplyr")
dd %>% filter(!f %in% c("a","c","e"))
##   f x
## 1 b 2
## 2 d 4
## 3 f 6

edited Dec 31 '15 at 22:03

answered Dec 31 '15 at 21:31

Ben Bolker

211,554
25
370
453

No that didn't do it. I'm using dplyr – Shootin_Putin Dec 31 '15 at 21:56
4

if that didn't do it then you need to post a [reproducible example](http://stackoverflow.com/questions/5963269/how-to-make-a-great-r-reproducible-example) ... – Ben Bolker Dec 31 '15 at 22:02

score 1 · Answer 4 · answered Jan 01 '16 at 01:57

1

Using data.table, we set the 'key' column

library(data.table)
setDT(data_set, key='DMS')[!rem]

Using the example from @Ben Bolker's post

rem <- c('a', 'c', 'e')
setDT(dd, key='f')[!rem]
#   f x
#1: b 2
#2: d 4
#3: f 6

answered Jan 01 '16 at 01:57

akrun

874,273
37
540
662

Removing multiple values in R

4 Answers4

Linked

Related