How to remove rows which has same values in variables?

Question

How to remove rows which has identical string variable? Here is example data:

data <- data.frame(c("A", "C", "B"),
                     c("A", "B", "C"),
                     stringsAsFactors = FALSE)

head(data)
#   c..A....C....B.. c..A....B....C..
#1                A                A
#2                C                B
#3                B                C

For the output I would like to get this dataframe:

#  c..A....C....B.. c..A....B....C..
#2                C                B
#3                B                C

As you can see in the first row, same A and A are deleted. tidyverse approach preferred.

score 3 · Accepted Answer · answered Sep 26 '21 at 16:27

3

data <- data.frame(x = c("A", "C", "B"),
                   y = c("A", "B", "C"),
                   stringsAsFactors = FALSE)

library(dplyr)

data %>% 
  filter(x != y)

  x y
1 C B
2 B C

answered Sep 26 '21 at 16:27

Vinícius Félix

8,448
6
16
32

score 2 · Answer 2 · answered Sep 26 '21 at 18:19

2

Using subset from base R

subset(data, x != y)

answered Sep 26 '21 at 18:19

akrun

874,273
37
540
662

How to remove rows which has same values in variables?

2 Answers2