본문 바로가기
반응형

분류 전체보기464

[하루만에 끝내는 R 데이터프레임] 2. 데이터프레임 정의하고 열이름, 행이름 바꾸기 이번시간에는 데이터프레임을 정의하는 방법을 배우고, 행과 열의 이름을 바꿔볼 것입니다. 1교시. 강의 소개 2교시. 데이터프레임 정의하고 행이름, 열이름 바꾸기 3교시. 유용한 기본함수 (tail, head, str, dim) 4교시. 벡터의 인덱싱 5교시. 데이터 프레임 원소에 접근하기 (데이터프레임 인덱싱) 6교시. 데이터프레임 열과 행에 접근하기 7교시. 데이터프레임 행 또는 열 제거, 추가, 변경하기 8교시. 특정 조건으로 데이터프레임 추리기 9교시. 여러 데이터프레임 결합하기 10교시. 엑셀파일을 데이터프레임으로 불러오기 1. 데이터프레임 정의하기 데이터프레임을 하나 정의해봅시다. 데이터프레임은 벡터를 이용하여 정의합니다. 각 벡터들은 데이터프레임의 열이 됩니다. 학생들의 정보를 담고 있는 데이.. 2023. 6. 2.
[하루만에 끝내는 R 데이터프레임] 1. 강의 소개 본 강의는 하루만에 끝내는 R 기초에 이은 하루만에 끝내는 시리즈 두번째 강의입니다. 제목은 하루만에 끝내는 R 데이터프레임 입니다. 아마 많은 분들이 통계분석과 시각화를 위해 R을 배우시는 것이라 생각됩니다. 통계분석과 시각화를 배우기 전에 '데이터프레임'을 정복해야 합니다. 데이터프레임은 R에서 가장 많이 사용되는 자료구조입니다. 데이터프레임을 잘 다룰 줄 알아야 통계분석과 시각화가 한결 편해집니다. 하루만에 끝내는 데이터프레임에서 배울 내용은 아래와 같습니다. 1교시. 강의 소개 2교시. 데이터프레임 정의하고 행이름, 열이름 바꾸기 3교시. 유용한 기본함수 (tail, head, str, dim) 4교시. 벡터의 인덱싱 5교시. 데이터 프레임 원소에 접근하기 (데이터프레임 인덱싱) 6교시. 데이터프.. 2023. 6. 2.
[R강의] 161. 데이터프레임 행과 열을 제거하는 방법 데이터프레임을 하나 정의합시다. v1=c(1,2,1,3,2) v2=c(20,10,10,10,30) v3=c('a','b','c','d','e') df=data.frame(v1,v2,v3) > df v1 v2 v3 1 1 20 a 2 2 10 b 3 1 10 c 4 3 10 d 5 2 30 e 1. 열 제거하는 방법 첫번째 열을 제거하는 방법은 아래와 같습니다. 제거하고 싶은 열의 번호에 마이너스를 붙이고 인덱싱하면 됩니다. > df[-1] v2 v3 1 20 a 2 10 b 3 10 c 4 10 d 5 30 e 아래와 같이 콤마를 넣어도 됩니다. > df[,-1] v2 v3 1 20 a 2 10 b 3 10 c 4 10 d 5 30 e 첫번째 열과 세번째 열을 제거하는 방법은 아래와 같습니다. > df[.. 2023. 4. 26.
[R강의] 160. 데이터프레임 행의 순서를 바꾸는 방법과 원리 데이터 프레임을 하나 정의합시다. v1=c(1,2,3,4,5) v2=c('a','b','c','d','e') df=data.frame(v1,v2) > df v1 v2 1 1 a 2 2 b 3 3 c 4 4 d 5 5 e 순서를 바꿀 때는 데이터프레임의 인덱싱을 사용합니다. 인덱싱의 원리를 이해하면 순서를 바꾸는 원리도 이해할 수 있습니다. 데이터프레임 df 의 첫번째와 두번째 행만 가져와 봅시다. > df[c(1,2),] v1 v2 1 1 a 2 2 b 이번에는 순서를 바꿔서 두번째 행과 첫번째 행을 가져와봅시다. > df[c(2,1),] v1 v2 2 2 b 1 1 a 인덱싱 c(2,1) 의 의미는 두번째 행과 첫번째 행을 순서대로 가져오라는 의미입니다. 이 원리를 이용하면 데이터프레임 행의 순서를 바.. 2023. 4. 26.
[R강의] 159. 벡터 원소를 제거하는 방법 벡터를 하나 정의합시다. v=c('a','b','c','d','e') 첫번째 원소를 제거하는 방법은 인덱싱을 위한 대괄호에 -1을 입력하는 것입니다. > v[-1] [1] "b" "c" "d" "e" 이번에는 여러개 원소를 동시에 제거해봅시다. 두번째와 세번째 원소를 제거하는 방법은 아래와 같습니다. > v[c(-2,-3)] [1] "a" "d" "e" 단순히 결과만 출력하는 것이 아니라 벡터 v를 변경하려면 결과를 v에 넣어주면 됩니다. > v=v[c(-2,-3)] > v [1] "a" "d" "e" 2023. 4. 26.
[R강의] 158. 벡터 원소의 순서를 바꾸는 방법과 원리 아래와 같은 벡터가 있다고 합시다. v=c('A','B','C') 순서를 B,A,C 로 바꾸고 싶다면 아래와 같이 하면 됩니다. > v[c(2,1,3)] [1] "B" "A" "C" 인덱싱을 이용한 것인데요. c(2,1,3) 을 인덱스로 입력하면 두번째, 첫번째,세번째 순서로 원소를 가져와 벡터 형태로 나열하게 됩니다. 아래와 같이 입력하면 어떻게 출력될까요? v[c(2,1,2)] B,A,B 가 출력됩니다. 인덱스를 중복으로 입력해도 된다는 것을 알 수 있습니다. 2023. 4. 26.
[R강의] 157. 벡터의 오름차순, 내림차순 정렬 하는 방법 (sort) 벡터를 하나 정의합시다. v=c(1,3,2,4,5) 오름차순 정렬할 때는 sort 함수를 사용합니다. > sort(v) [1] 1 2 3 4 5 내림차순 정렬할 때도 sort 함수를 사용합니다. decreasing 옵션을 TRUE로 설정하면 됩니다. > sort(v,decreasing=TRUE) [1] 5 4 3 2 1 2023. 4. 26.
[R강의] 156. 결측치를 확인하는 두가지 함수 (complete.cases, is.na) 결측치를 확인하는 함수는 두 가지가 있습니다. complete.cases 와 is.na 함수입니다. complete.cases 는 결측치를 FALSE로 반환하고, is.na 는 결측치를 TRUE 로 반환합니다. 1. 벡터 결측치 벡터로 예를 들어봅시다. NA가 포함된 벡터를 만들겠습니다. v=c(1,NA,NA,4,5) complete.cases 함수를 적용해봅시다. > complete.cases(v) [1] TRUE FALSE FALSE TRUE TRUE is.na 함수를 적용해봅시다. > is.na(v) [1] FALSE TRUE TRUE FALSE FALSE 2. 데이터프레임 결측치 두 함수 모두 데이터프레임에도 사용 가능합니다. NA가 포함된 데이터프레임을 하나 만들어봅시다. df=data.fram.. 2023. 4. 25.
[R강의] 155. 데이터프레임의 여러 열을 합쳐서 변수와 값으로 만들기 (melt) 데이터프레임의 여러 열을 합쳐서 변수와 값으로 만드는 방법을 알아봅시다. 말이 좀 어렵죠? 그림으로도 준비했습니다. 왼쪽 데이터는 다섯 학생의 성별과 시험성적입니다. 네 과목의 시험성적인데요. 오른쪽 처럼 과목이라는 열과 점수라는 열로 바꿔보겠습니다. 오른쪽 처럼 바꾸면 데이터를 다루기가 편해집니다. 먼저 패키지를 하나 설치하고 불러옵시다. reshape2 라는 패키지입니다. 이 패키지 안에 있는 melt 함수를 사용할 겁니다. #패키지 설치 install.packages("reshape2") #패키지 불러오기 library(reshape2) 아래와 같이 데이터를 입력합시다. ID=c(1,2,3,4,5) SEX=c('M','M','F','F','F') ENG=c(65,55,45,95,78) MATH=c(.. 2023. 4. 15.
[엑셀 통계] 70. 엑셀 추세선 함수 (회귀선 함수) 산점도에서 추세선을 추가하는 방법 말고, 그래프 없이 추세선을 구하는 방법을 알아봅시다. 먼저 예제에 사용할 데이터를 만들겠습니다. y=10x+5 에서 추출한 데이터입니다. 추세선을 구할 때는 linest 라는 함수를 사용합니다. y=ax+b 에서 a와 b값을 출력하기 때문에 두 칸이 필요합니다. 아래와 같이 사용합니다. TRUE로 놓아야 b값이 구해집니다. 입력결과는 아래와 같습니다. 추세선은 y=10x+5 입니다. 맞게 구해진 것을 알 수 있습니다. 만약 FALSE 라고 놓는다면, b=0으로 놓고 추세선을 구합니다. 한번 구해보면 아래와 같습니다. 2023. 4. 14.
[R강의] 154. 문자열을 다른 문자열로 대체하기 (sub, gsub) sub와 gsub 함수는 문자열을 다른 문자열로 대체하는 함수입니다. sub는 대체하다라는 뜻의 substitute 의 약어인 것 같습니다. sub 함수는 가장 첫번째 문자만을 대체하고, gsub는 전체 문자를 대체합니다. g는 global 이 아닐까요. 예시를 통해 알아봅시다. 문자열 x를 하나 만들어봅시다. x='hi hi hi' sub 함수로 첫번째 문자 hi를 hello 로 바꿔봅시다. > sub('hi','hello',x) [1] "hello hi hi" 이번에는 gsub 함수로 모든 hi를 hello 로 바꿔봅시다. > gsub('hi','hello',x) [1] "hello hello hello" 2023. 4. 8.
[R강의] 153. 함수에 인자를 여러 조합으로 입력하는 방법 (mapply) mapply 함수는 이해하기가 까다로운 함수입니다. 한번 이해하면 쉬운데 감을 잡는 것이 다른 apply 함수들 보다 어렵습니다. 먼저 예시를 하나 봅시다. > mapply(rep,c(1,2,3),c(2,3,4)) [[1]] [1] 1 1 [[2]] [1] 2 2 2 [[3]] [1] 3 3 3 3 mapply 가 어떤 역할을 하는지 감이 오시나요? 출력 결과가 리스트라는 것은 알 수 있습니다. 위 함수가 입력되면 R에서 어떤 일이 벌어지는지 알아봅시다. mapply 함수의 소스를 뜯어본 것은 아니라 순서는 약간 다를 수 있습니다. 위 함수가 입력되면 R에서는 아래와 같은 일이 벌어집니다. 1) rep(1,2) 가 실행되어 리스트의 첫번째 원소로 들어갑니다. 2) rep(2,3) 이 실행되어 리스트의 두.. 2023. 4. 7.
[R강의] 152. 벡터의 그룹별로 함수 적용하기 (tapply) 아래와 같은 벡터가 있다고 합시다. v=c(1,2,3,4,5,6,7,8,9) 각 값들은 아래와 같은 그룹에 속한다고 합시다. 그룹은 factor로 정의합니다. f=factor(c('A','A','B','A','A','B','A','A','B')) tapply 함수를 이용하면 그룹별로 함수를 적용할 수 있습니다. 그룹 별로 평균을 구해봅시다. > tapply(v,f,mean) A B 4.5 6.0 2023. 4. 5.
[R강의] 151. 리스트의 각 원소에 함수 적용하기 (sapply, lapply) 리스트의 각 원소에 함수를 적용하는 방법은 두가지가 있습니다. sapply 와 lapply 함수입니다. sapply 함수는 결과를 벡터나 행렬 형태로 출력하고 lapply 함수는 결과를 리스트 형태로 출력합니다. 예제를 통해서 이해해봅시다. 먼저 리스트를 하나 정의합시다. Math=c(94,82,45,55,67) English=c(88,86,56,90,50) Science=c(87,76,65,43,55) li=list(Math,English,Science) > li [[1]] [1] 94 82 45 55 67 [[2]] [1] 88 86 56 90 50 [[3]] [1] 87 76 65 43 55 1. sapply 함수 sapply 함수는 아래와 같은 형식으로 사용합니다. sapply(리스트,함수) 리스.. 2023. 4. 4.
[R강의] 150. 데이터프레임의 열 방향으로 함수 적용하기 (apply, sapply, lapply) 데이터프레임의 열 방향으로 함수를 적용하는 방법은 무려 세가지가 있습니다. apply,sapply,lapply 입니다. 이들의 차이점은 결과를 출력하는 방식입니다. apply와 sapply 는 벡터나 행렬 형태로 결과로 출력하고 laaply 는 리스트 형태로 결과를 출력합니다. 복잡해 보이지만 예제를 통해 쉽게 이해할 수 있습니다. 먼저 데이터프레임을 하나 정의해봅시다. Math=c(94,82,45,55,67) English=c(88,86,56,90,50) Science=c(87,76,65,43,55) df=data.frame(Math,English,Science) > df Math English Science 1 94 88 87 2 82 86 76 3 45 56 65 4 55 90 43 5 67 50 .. 2023. 4. 3.
[R강의] 149. 벡터나 데이터프레임을 그룹별로 나눠 리스트에 저장 (split) split 함수는 벡터나 데이터프레임을 그룹별로 나눠 리스트에 저장해주는 함수입니다. 어떻게 사용되는지 알아봅시다. 1. 벡터를 그룹별로 나눠 리스트에 저장 아래와 같은 벡터가 있다고 합시다. v=c(1,2,3,4,5,6,7,8,9) 각 값들은 아래와 같은 그룹에 속한다고 합시다. 그룹은 factor로 정의합니다. f=factor(c('A','A','B','A','A','B','A','A','B')) split 함수를 사용해봅시다. > split(v,f) $A [1] 1 2 4 5 7 8 $B [1] 3 6 9 2. 데이터프레임을 그룹별로 나눠 리스트에 저장 위에서 정의한 벡터와 요인으로 데이터프레임을 만들어봅시다. df=data.frame(v,f) > df v f 1 1 A 2 2 A 3 3 B 4 4.. 2023. 3. 29.
[R강의] 148. with 함수와 그래프 (열이름을 표현식에 사용) with 함수란? with 함수가 무엇인지 알아보고, with 함수를 그래프와 어떻게 함께 사용되는지도 알아봅시다. with 함수의 기본적인 형태는 아래와 같습니다. with(data,표현식) data에는 데이터프레임이나 리스트가 올 수 있습니다. with 함수는 데이터프레임에 있는 열 이름을 표현식에 바로 사용할 수 있게 해주는 함수입니다. with 함수를 사용하기 위해 아래와 같은 데이터프레임을 하나 정의해봅시다. df=data.frame(A=c(1,2,3),B=c(4,5,6),C=c(7,8,9)) > df A B C 1 1 4 7 2 2 5 8 3 3 6 9 아래와 같이 코드를 입력해봅시다. 어떤 결과가 출력될까요? with(df, A) A가 출력됩니다. > with(df,A) [1] 1 2 3 벡.. 2023. 3. 28.
[R강의] 147. 데이터프레임 열 선택 쉽게 하기, 조건부여 (subset) 열 선택을 쉽게 하도록 해주는 함수가 있습니다. 열만 선택할 수도 있고, 특정 조건을 부여할 수도 있습니다. airquality 라는 데이터를 이용하여 subset 함수를 사용해봅시다. airquality 데이터는 아래와 같습니다. > head(airquality) Ozone Solar.R Wind Temp Month Day 1 41 190 7.4 67 5 1 2 36 118 8.0 72 5 2 3 12 149 12.6 74 5 3 4 18 313 11.5 62 5 4 5 NA NA 14.3 56 5 5 6 28 NA 14.9 66 5 6 1. 특정 열 선택 Ozone 열을 선택해봅시다. 아래와 같이 함수를 사용하면 됩니다. > subset(airquality,select=Ozone) Ozone 1 41.. 2023. 3. 27.
[R강의] 146. attach 함수와 detach 함수 내장데이터인 iris 를 이용하여 attach 함수와 detach 함수를 설명하겠습니다. iris 데이터에는 아래와 같이 다섯개의 열이 있습니다. > head(iris) Sepal.Length Sepal.Width Petal.Length Petal.Width Species 1 5.1 3.5 1.4 0.2 setosa 2 4.9 3.0 1.4 0.2 setosa 3 4.7 3.2 1.3 0.2 setosa 4 4.6 3.1 1.5 0.2 setosa 5 5.0 3.6 1.4 0.2 setosa 6 5.4 3.9 1.7 0.4 setosa 첫번째 열에 접근하는 방법은 여러가지가 있는데 그 중 한 가지를 예를 들면 아래와 같습니다. > iris['Sepal.Length'] iris 데이터에 attach 함수를.. 2023. 3. 23.
[R강의] 145. 변수목록 보기, 삭제하기 변수를 생성해봅시다. > a=3 > b=c(1,2,3) > c='hi' R스튜디오를 쓰는 분들은 오른쪽 위에 있는 environment 탭에서 변수 목록을 확인할 수 있고 삭제도 가능합니다. 오늘 알아볼 방법은 콘솔 창에서 변수 목록을 출력하고 삭제하는 방법입니다. 변수 목록을 출력할 때는 ls() 또는 ls.str() 을 이용합니다. > ls() [1] "a" "b" "c" > ls.str() a : num 3 b : num [1:3] 1 2 3 c : chr "hi" 변수를 삭제할 때는 rm( ) 을 사용합니다. 변수 이름을 넣으면 됩니다. > rm(a) > ls() [1] "b" "c" 여러 변수를 삭제할 때는 list 옵션에 벡터 형태로 입력합니다. 이름을 문자열로 입력해야 합니다. > rm(li.. 2023. 3. 20.
[R강의] 144.정규분포 함수 4종류 의미 (dnorm, pnorm, qnorm, rnorm) R에서 제공하는 정규분포 함수는 네 종류가 있습니다. 함수 이름과 입력값은 아래와 같습니다. dnorm(x, mean = 0, sd = 1, log = FALSE) pnorm(q, mean = 0, sd = 1, lower.tail = TRUE, log.p = FALSE) qnorm(p, mean = 0, sd = 1, lower.tail = TRUE, log.p = FALSE) rnorm(n, mean = 0, sd = 1) 하나씩 의미를 알아봅시다. dnorm dnorm 의 d는 density 입니다. dnorm 은 확률밀도함수를 의미합니다. x에서의 확률밀도값을 반환합니다. 종 모양의 정규분포함수에서 y값에 해당됩니다. pnorm pnorm 의 p는 probability 입니다. 누적확률을 의미합니.. 2023. 3. 20.
[R강의] 143. 엑셀 데이터 불러올 때 설명 행 없이 불러오기 아래와 같은 데이터가 있다고 합시다. 첫 두줄은 설명입니다. R에서 불러올 때 설명줄은 생략하고 불러오는 방법을 알아봅시다. [File]-[Import Dataset]-[From Excel] 을 클릭합니다. 데이터를 불러옵니다. 첫 두 줄을 생략하려면 Skip 에 2를 넣으면 됩니다. 2023. 3. 15.
[R강의] 142. var, sd 함수는 모집단일까 표본일까 var 함수 R에서 분산을 계산할 때 사용하는 var 함수가 모분산을 계산하는지 표본분산을 계산하는지 알아봅시다. data=c(1,2,3,4,5) #모 분산 직접 계산하기 var_cal_p=sum((data-mean(data))**2)/length(data) #표본 분산 직접 계산하기 var_cal_s=sum((data-mean(data))**2)/(length(data)-1) #var 함수 사용 var_fun=var(data) #출력 print(var_cal_p) print(var_cal_s) print(var_fun) > print(var_cal_p) [1] 2 > print(var_cal_s) [1] 2.5 > print(var_fun) [1] 2.5 var 로 계산된 결과가 표본분산임을 알 수 있.. 2023. 2. 27.
[R강의] 141. library 와 require 의 차이 둘의 역할은 동일합니다. 패키지를 로딩합니다. 차이는 아래와 같습니다. > require(AB) 필요한 패키지를 로딩중입니다: AB Warning message: In library(package, lib.loc = lib.loc, character.only = TRUE, logical.return = TRUE, : ‘AB’이라고 불리는 패키지가 없습니다 > library(AB) Error in library(AB) : ‘AB’이라고 불리는 패키지가 없습니다 패키지가 없는 경우 require 함수는 Warning 을 library 함수는 Error 을 출력합니다. 2023. 2. 27.
[R강의] 140. 데이터 프레임을 쉽게 조작하는 transform 함수 데이터프레임을 하나 정의합시다. num=1:10 score=c(78,62,65,94,71,97,57,83,71,96) md=data.frame(num,score) > md num score 1 1 78 2 2 62 3 3 65 4 4 94 5 5 71 6 6 97 7 7 57 8 8 83 9 9 71 10 10 96 둘째 열에 5를 더해서 셋째 열을 추가하는 상황을 가정합시다. 아래와 같이 인덱싱을 이용하여 추가할 수 있습니다. > md[,'add']=md$score+5 > md num score add 1 1 78 83 2 2 62 67 3 3 65 70 4 4 94 99 5 5 71 76 6 6 97 102 7 7 57 62 8 8 83 88 9 9 71 76 10 10 96 101 이번에는 tran.. 2023. 2. 27.
[ggplot2의 이해] 8. 히스토그램 (geom_histogram) 1. 히스토그램 그리기 내장 데이터인 mpg를 이용하여 박스플롯을 그려보았습니다. hwy 라는 열을 사용할 것인데, hwy 는 highway miles per gallon 입니다. 연비라고 생각하면 됩니다. 그래프를 그려봅시다. 다양한 옵션들을 넣어보았는데 필요 없는 것은 제거하고 사용하시면 됩니다. 설명은 주석에 있습니다. library(tidyverse) ggplot()+ geom_histogram(data=mpg,aes(x=hwy))+ #binwidth 로 간격 조절 가능 labs(title="geom_histogram",x='hwy')+ #제목, 축이름 theme(title = element_text(size=20,face='bold'))+ #제목 서식 theme(axis.title = eleme.. 2023. 2. 10.
[ggplot2의 이해] 7. 값을 출력하는 막대그래프 (geom_col) ggplot2 에서 제공하는 막대그래프는 두 종류가 있습니다. geom_bar 와 geom_col 입니다. geom_bar 는 하나의 범주형 변수를 이용하여 막대그래프를 그립니다. 예를들어 데이터가 (사과,사과,귤,바나나,바나나,바나나) 라면 세개의 막대가 그려집니다. 이때 세로축은 원소의 수가 됩니다. geom_col 은 범주형 독립변수와 연속형 종속변수를 이용하여 막대그래프를 그립니다. 이번 글에서는 geom_col 를 이용해서 막대그래프를 그려봅시다. 1. 막대그래프 그리기 내장 데이터인 mpg를 이용하여 막대그래프를 그려보았습니다. mpg 는 자동차 데이터입니다. 총 11개의 변수가 있는데요. 독립변수로 class 를 선택하고, 종속변수로 hwy 를 선택하겠습니다. class 는 차의 타입이고, .. 2023. 2. 8.
[R dplyr의 이해] 10. 원하는 열의 통계량 출력하기 (summarise, group_by) summarise 함수를 이용하면 데이터프레임 열의 다양한 통계량을 보기 좋게 출력할 수 있습니다. 1. 통계량 출력하기 iris 데이터에서 Sepal.Length 의 평균과 표준편차를 출력해봅시다. iris %>% summarise( mean(Sepal.Length),sd(Sepal.Length)) ##출력결과 > iris %>% summarise( mean(Sepal.Length),sd(Sepal.Length)) mean(Sepal.Length) sd(Sepal.Length) 1 5.843333 0.8280661 아래와 같이 출력되는 열 이름을 지정해줄 수도 있습니다. iris %>% summarise( mean=mean(Sepal.Length),stdev=sd(Sepal.Length)) ##출력결과.. 2023. 2. 8.
[R dplyr의 이해] 9. 연산을 통한 열 변형 혹은 생성 (mutate 함수) muatate 함수는 기존 열을 변형하거나, 기존 열을 이용하여 새로운 열을 생성하는 함수입니다. 1. 기존 열 변환 오늘 사용할 iris 데이터는 아래와 같습니다. > head(iris) Sepal.Length Sepal.Width Petal.Length Petal.Width Species 1 5.1 3.5 1.4 0.2 setosa 2 4.9 3.0 1.4 0.2 setosa 3 4.7 3.2 1.3 0.2 setosa 4 4.6 3.1 1.5 0.2 setosa 5 5.0 3.6 1.4 0.2 setosa 6 5.4 3.9 1.7 0.4 setosa iris 데이터를 dt 라는 변수에 저장하고, Sepal.Length 열에 10을 곱해봅시다. 결과를 다시 dt에 넣어주여야 dt가 변형됩니다. dt=.. 2023. 2. 8.
[R dplyr의 이해] 8. 유니크한 값만 추출하기 (distinct) distinct 함수를 이용하면 데이터프레임에서 선택한 열의 유니크한 값을 추출할 수 있습니다. 1. 하나의 열에서 유니크한 값 추출하기 mpg 데이터의 manuracturer 열의 유니트한 값들을 출력해봅시다. mpg %>% distinct(manufacturer) > mpg %>% distinct(manufacturer) # A tibble: 15 × 1 manufacturer 1 audi 2 chevrolet 3 dodge 4 ford 5 honda 6 hyundai 7 jeep 8 land rover 9 lincoln 10 mercury 11 nissan 12 pontiac 13 subaru 14 toyota 15 volkswagen 2. 여러 열에서 유니크한 값 출력하기 cyl 열을 기준으로 내.. 2023. 2. 8.
반응형