반응형
    
    
    
  distinct 함수를 이용하면 데이터프레임에서 선택한 열의 유니크한 값을 추출할 수 있습니다.
1. 하나의 열에서 유니크한 값 추출하기
mpg 데이터의 manuracturer 열의 유니트한 값들을 출력해봅시다.  
mpg %>% distinct(manufacturer)
> mpg %>% distinct(manufacturer)
# A tibble: 15 × 1
   manufacturer
   <chr>       
 1 audi        
 2 chevrolet   
 3 dodge       
 4 ford        
 5 honda       
 6 hyundai     
 7 jeep        
 8 land rover  
 9 lincoln     
10 mercury     
11 nissan      
12 pontiac     
13 subaru      
14 toyota      
15 volkswagen
2. 여러 열에서 유니크한 값 출력하기
cyl 열을 기준으로 내림차순 정렬한 뒤, 그 안에서 mpg 를 기준으로 오름차순 정렬하는 방법은 아래와 같습니다.  
mtcars %>% arrange(desc(cyl),mpg)
> mpg %>% distinct(manufacturer,year)
# A tibble: 30 × 2
   manufacturer  year
   <chr>        <int>
 1 audi          1999
 2 audi          2008
 3 chevrolet     2008
 4 chevrolet     1999
 5 dodge         1999
 6 dodge         2008
 7 ford          1999
 8 ford          2008
 9 honda         1999
10 honda         2008
# … with 20 more rows
# ℹ Use `print(n = ...)` to see more rows
각 열만 보면 유니크하지 않다고 생각할 수도 있는데, 행을 기준으로 봐야 합니다. audi,1999 인 행과 audi,2008 인 행은 서로 다릅니다. 출력 결과에서 각각의 행들은 유니크합니다. 
반응형
    
    
    
  'R tidyverse > 하루만에 끝내는 dplyr' 카테고리의 다른 글
| [R dplyr의 이해] 10. 원하는 열의 통계량 출력하기 (summarise, group_by) (0) | 2023.02.08 | 
|---|---|
| [R dplyr의 이해] 9. 연산을 통한 열 변형 혹은 생성 (mutate 함수) (0) | 2023.02.08 | 
| [R dplyr의 이해] 7. 데이터프레임 오름차순, 내림차순 정렬하기 (arrange) (0) | 2023.02.08 | 
| [R dplyr의 이해] 6. 원하는 열 추출 및 제외하기 (select) (0) | 2023.02.07 | 
| [R dplyr의 이해] 5. 조건을 만족하는 행 추출 (filter) (0) | 2023.02.07 | 
댓글