본문 바로가기
반응형

분류 전체보기462

[R강의] 161. 데이터프레임 행과 열을 제거하는 방법 데이터프레임을 하나 정의합시다. v1=c(1,2,1,3,2) v2=c(20,10,10,10,30) v3=c('a','b','c','d','e') df=data.frame(v1,v2,v3) > df v1 v2 v3 1 1 20 a 2 2 10 b 3 1 10 c 4 3 10 d 5 2 30 e 1. 열 제거하는 방법 첫번째 열을 제거하는 방법은 아래와 같습니다. 제거하고 싶은 열의 번호에 마이너스를 붙이고 인덱싱하면 됩니다. > df[-1] v2 v3 1 20 a 2 10 b 3 10 c 4 10 d 5 30 e 아래와 같이 콤마를 넣어도 됩니다. > df[,-1] v2 v3 1 20 a 2 10 b 3 10 c 4 10 d 5 30 e 첫번째 열과 세번째 열을 제거하는 방법은 아래와 같습니다. > df[.. 2023. 4. 26.
[R강의] 160. 데이터프레임 행의 순서를 바꾸는 방법과 원리 데이터 프레임을 하나 정의합시다. v1=c(1,2,3,4,5) v2=c('a','b','c','d','e') df=data.frame(v1,v2) > df v1 v2 1 1 a 2 2 b 3 3 c 4 4 d 5 5 e 순서를 바꿀 때는 데이터프레임의 인덱싱을 사용합니다. 인덱싱의 원리를 이해하면 순서를 바꾸는 원리도 이해할 수 있습니다. 데이터프레임 df 의 첫번째와 두번째 행만 가져와 봅시다. > df[c(1,2),] v1 v2 1 1 a 2 2 b 이번에는 순서를 바꿔서 두번째 행과 첫번째 행을 가져와봅시다. > df[c(2,1),] v1 v2 2 2 b 1 1 a 인덱싱 c(2,1) 의 의미는 두번째 행과 첫번째 행을 순서대로 가져오라는 의미입니다. 이 원리를 이용하면 데이터프레임 행의 순서를 바.. 2023. 4. 26.
[R강의] 159. 벡터 원소를 제거하는 방법 벡터를 하나 정의합시다. v=c('a','b','c','d','e') 첫번째 원소를 제거하는 방법은 인덱싱을 위한 대괄호에 -1을 입력하는 것입니다. > v[-1] [1] "b" "c" "d" "e" 이번에는 여러개 원소를 동시에 제거해봅시다. 두번째와 세번째 원소를 제거하는 방법은 아래와 같습니다. > v[c(-2,-3)] [1] "a" "d" "e" 단순히 결과만 출력하는 것이 아니라 벡터 v를 변경하려면 결과를 v에 넣어주면 됩니다. > v=v[c(-2,-3)] > v [1] "a" "d" "e" 2023. 4. 26.
[R강의] 158. 벡터 원소의 순서를 바꾸는 방법과 원리 아래와 같은 벡터가 있다고 합시다. v=c('A','B','C') 순서를 B,A,C 로 바꾸고 싶다면 아래와 같이 하면 됩니다. > v[c(2,1,3)] [1] "B" "A" "C" 인덱싱을 이용한 것인데요. c(2,1,3) 을 인덱스로 입력하면 두번째, 첫번째,세번째 순서로 원소를 가져와 벡터 형태로 나열하게 됩니다. 아래와 같이 입력하면 어떻게 출력될까요? v[c(2,1,2)] B,A,B 가 출력됩니다. 인덱스를 중복으로 입력해도 된다는 것을 알 수 있습니다. 2023. 4. 26.
[R강의] 157. 벡터의 오름차순, 내림차순 정렬 하는 방법 (sort) 벡터를 하나 정의합시다. v=c(1,3,2,4,5) 오름차순 정렬할 때는 sort 함수를 사용합니다. > sort(v) [1] 1 2 3 4 5 내림차순 정렬할 때도 sort 함수를 사용합니다. decreasing 옵션을 TRUE로 설정하면 됩니다. > sort(v,decreasing=TRUE) [1] 5 4 3 2 1 2023. 4. 26.
[R강의] 156. 결측치를 확인하는 두가지 함수 (complete.cases, is.na) 결측치를 확인하는 함수는 두 가지가 있습니다. complete.cases 와 is.na 함수입니다. complete.cases 는 결측치를 FALSE로 반환하고, is.na 는 결측치를 TRUE 로 반환합니다. 1. 벡터 결측치 벡터로 예를 들어봅시다. NA가 포함된 벡터를 만들겠습니다. v=c(1,NA,NA,4,5) complete.cases 함수를 적용해봅시다. > complete.cases(v) [1] TRUE FALSE FALSE TRUE TRUE is.na 함수를 적용해봅시다. > is.na(v) [1] FALSE TRUE TRUE FALSE FALSE 2. 데이터프레임 결측치 두 함수 모두 데이터프레임에도 사용 가능합니다. NA가 포함된 데이터프레임을 하나 만들어봅시다. df=data.fram.. 2023. 4. 25.
[R강의] 155. 데이터프레임의 여러 열을 합쳐서 변수와 값으로 만들기 (melt) 데이터프레임의 여러 열을 합쳐서 변수와 값으로 만드는 방법을 알아봅시다. 말이 좀 어렵죠? 그림으로도 준비했습니다. 왼쪽 데이터는 다섯 학생의 성별과 시험성적입니다. 네 과목의 시험성적인데요. 오른쪽 처럼 과목이라는 열과 점수라는 열로 바꿔보겠습니다. 오른쪽 처럼 바꾸면 데이터를 다루기가 편해집니다. 먼저 패키지를 하나 설치하고 불러옵시다. reshape2 라는 패키지입니다. 이 패키지 안에 있는 melt 함수를 사용할 겁니다. #패키지 설치 install.packages("reshape2") #패키지 불러오기 library(reshape2) 아래와 같이 데이터를 입력합시다. ID=c(1,2,3,4,5) SEX=c('M','M','F','F','F') ENG=c(65,55,45,95,78) MATH=c(.. 2023. 4. 15.
[엑셀 통계] 70. 엑셀 추세선 함수 (회귀선 함수) 산점도에서 추세선을 추가하는 방법 말고, 그래프 없이 추세선을 구하는 방법을 알아봅시다. 먼저 예제에 사용할 데이터를 만들겠습니다. y=10x+5 에서 추출한 데이터입니다. 추세선을 구할 때는 linest 라는 함수를 사용합니다. y=ax+b 에서 a와 b값을 출력하기 때문에 두 칸이 필요합니다. 아래와 같이 사용합니다. TRUE로 놓아야 b값이 구해집니다. 입력결과는 아래와 같습니다. 추세선은 y=10x+5 입니다. 맞게 구해진 것을 알 수 있습니다. 만약 FALSE 라고 놓는다면, b=0으로 놓고 추세선을 구합니다. 한번 구해보면 아래와 같습니다. 2023. 4. 14.
[R강의] 154. 문자열을 다른 문자열로 대체하기 (sub, gsub) sub와 gsub 함수는 문자열을 다른 문자열로 대체하는 함수입니다. sub는 대체하다라는 뜻의 substitute 의 약어인 것 같습니다. sub 함수는 가장 첫번째 문자만을 대체하고, gsub는 전체 문자를 대체합니다. g는 global 이 아닐까요. 예시를 통해 알아봅시다. 문자열 x를 하나 만들어봅시다. x='hi hi hi' sub 함수로 첫번째 문자 hi를 hello 로 바꿔봅시다. > sub('hi','hello',x) [1] "hello hi hi" 이번에는 gsub 함수로 모든 hi를 hello 로 바꿔봅시다. > gsub('hi','hello',x) [1] "hello hello hello" 2023. 4. 8.
[R강의] 153. 함수에 인자를 여러 조합으로 입력하는 방법 (mapply) mapply 함수는 이해하기가 까다로운 함수입니다. 한번 이해하면 쉬운데 감을 잡는 것이 다른 apply 함수들 보다 어렵습니다. 먼저 예시를 하나 봅시다. > mapply(rep,c(1,2,3),c(2,3,4)) [[1]] [1] 1 1 [[2]] [1] 2 2 2 [[3]] [1] 3 3 3 3 mapply 가 어떤 역할을 하는지 감이 오시나요? 출력 결과가 리스트라는 것은 알 수 있습니다. 위 함수가 입력되면 R에서 어떤 일이 벌어지는지 알아봅시다. mapply 함수의 소스를 뜯어본 것은 아니라 순서는 약간 다를 수 있습니다. 위 함수가 입력되면 R에서는 아래와 같은 일이 벌어집니다. 1) rep(1,2) 가 실행되어 리스트의 첫번째 원소로 들어갑니다. 2) rep(2,3) 이 실행되어 리스트의 두.. 2023. 4. 7.
[R강의] 152. 벡터의 그룹별로 함수 적용하기 (tapply) 아래와 같은 벡터가 있다고 합시다. v=c(1,2,3,4,5,6,7,8,9) 각 값들은 아래와 같은 그룹에 속한다고 합시다. 그룹은 factor로 정의합니다. f=factor(c('A','A','B','A','A','B','A','A','B')) tapply 함수를 이용하면 그룹별로 함수를 적용할 수 있습니다. 그룹 별로 평균을 구해봅시다. > tapply(v,f,mean) A B 4.5 6.0 2023. 4. 5.
[R강의] 151. 리스트의 각 원소에 함수 적용하기 (sapply, lapply) 리스트의 각 원소에 함수를 적용하는 방법은 두가지가 있습니다. sapply 와 lapply 함수입니다. sapply 함수는 결과를 벡터나 행렬 형태로 출력하고 lapply 함수는 결과를 리스트 형태로 출력합니다. 예제를 통해서 이해해봅시다. 먼저 리스트를 하나 정의합시다. Math=c(94,82,45,55,67) English=c(88,86,56,90,50) Science=c(87,76,65,43,55) li=list(Math,English,Science) > li [[1]] [1] 94 82 45 55 67 [[2]] [1] 88 86 56 90 50 [[3]] [1] 87 76 65 43 55 1. sapply 함수 sapply 함수는 아래와 같은 형식으로 사용합니다. sapply(리스트,함수) 리스.. 2023. 4. 4.
[R강의] 150. 데이터프레임의 열 방향으로 함수 적용하기 (apply, sapply, lapply) 데이터프레임의 열 방향으로 함수를 적용하는 방법은 무려 세가지가 있습니다. apply,sapply,lapply 입니다. 이들의 차이점은 결과를 출력하는 방식입니다. apply와 sapply 는 벡터나 행렬 형태로 결과로 출력하고 laaply 는 리스트 형태로 결과를 출력합니다. 복잡해 보이지만 예제를 통해 쉽게 이해할 수 있습니다. 먼저 데이터프레임을 하나 정의해봅시다. Math=c(94,82,45,55,67) English=c(88,86,56,90,50) Science=c(87,76,65,43,55) df=data.frame(Math,English,Science) > df Math English Science 1 94 88 87 2 82 86 76 3 45 56 65 4 55 90 43 5 67 50 .. 2023. 4. 3.
[R강의] 149. 벡터나 데이터프레임을 그룹별로 나눠 리스트에 저장 (split) split 함수는 벡터나 데이터프레임을 그룹별로 나눠 리스트에 저장해주는 함수입니다. 어떻게 사용되는지 알아봅시다. 1. 벡터를 그룹별로 나눠 리스트에 저장 아래와 같은 벡터가 있다고 합시다. v=c(1,2,3,4,5,6,7,8,9) 각 값들은 아래와 같은 그룹에 속한다고 합시다. 그룹은 factor로 정의합니다. f=factor(c('A','A','B','A','A','B','A','A','B')) split 함수를 사용해봅시다. > split(v,f) $A [1] 1 2 4 5 7 8 $B [1] 3 6 9 2. 데이터프레임을 그룹별로 나눠 리스트에 저장 위에서 정의한 벡터와 요인으로 데이터프레임을 만들어봅시다. df=data.frame(v,f) > df v f 1 1 A 2 2 A 3 3 B 4 4.. 2023. 3. 29.
[R강의] 148. with 함수와 그래프 (열이름을 표현식에 사용) with 함수란? with 함수가 무엇인지 알아보고, with 함수를 그래프와 어떻게 함께 사용되는지도 알아봅시다. with 함수의 기본적인 형태는 아래와 같습니다. with(data,표현식) data에는 데이터프레임이나 리스트가 올 수 있습니다. with 함수는 데이터프레임에 있는 열 이름을 표현식에 바로 사용할 수 있게 해주는 함수입니다. with 함수를 사용하기 위해 아래와 같은 데이터프레임을 하나 정의해봅시다. df=data.frame(A=c(1,2,3),B=c(4,5,6),C=c(7,8,9)) > df A B C 1 1 4 7 2 2 5 8 3 3 6 9 아래와 같이 코드를 입력해봅시다. 어떤 결과가 출력될까요? with(df, A) A가 출력됩니다. > with(df,A) [1] 1 2 3 벡.. 2023. 3. 28.
[R강의] 147. 데이터프레임 열 선택 쉽게 하기, 조건부여 (subset) 열 선택을 쉽게 하도록 해주는 함수가 있습니다. 열만 선택할 수도 있고, 특정 조건을 부여할 수도 있습니다. airquality 라는 데이터를 이용하여 subset 함수를 사용해봅시다. airquality 데이터는 아래와 같습니다. > head(airquality) Ozone Solar.R Wind Temp Month Day 1 41 190 7.4 67 5 1 2 36 118 8.0 72 5 2 3 12 149 12.6 74 5 3 4 18 313 11.5 62 5 4 5 NA NA 14.3 56 5 5 6 28 NA 14.9 66 5 6 1. 특정 열 선택 Ozone 열을 선택해봅시다. 아래와 같이 함수를 사용하면 됩니다. > subset(airquality,select=Ozone) Ozone 1 41.. 2023. 3. 27.
[R강의] 146. attach 함수와 detach 함수 내장데이터인 iris 를 이용하여 attach 함수와 detach 함수를 설명하겠습니다. iris 데이터에는 아래와 같이 다섯개의 열이 있습니다. > head(iris) Sepal.Length Sepal.Width Petal.Length Petal.Width Species 1 5.1 3.5 1.4 0.2 setosa 2 4.9 3.0 1.4 0.2 setosa 3 4.7 3.2 1.3 0.2 setosa 4 4.6 3.1 1.5 0.2 setosa 5 5.0 3.6 1.4 0.2 setosa 6 5.4 3.9 1.7 0.4 setosa 첫번째 열에 접근하는 방법은 여러가지가 있는데 그 중 한 가지를 예를 들면 아래와 같습니다. > iris['Sepal.Length'] iris 데이터에 attach 함수를.. 2023. 3. 23.
[R강의] 145. 변수목록 보기, 삭제하기 변수를 생성해봅시다. > a=3 > b=c(1,2,3) > c='hi' R스튜디오를 쓰는 분들은 오른쪽 위에 있는 environment 탭에서 변수 목록을 확인할 수 있고 삭제도 가능합니다. 오늘 알아볼 방법은 콘솔 창에서 변수 목록을 출력하고 삭제하는 방법입니다. 변수 목록을 출력할 때는 ls() 또는 ls.str() 을 이용합니다. > ls() [1] "a" "b" "c" > ls.str() a : num 3 b : num [1:3] 1 2 3 c : chr "hi" 변수를 삭제할 때는 rm( ) 을 사용합니다. 변수 이름을 넣으면 됩니다. > rm(a) > ls() [1] "b" "c" 여러 변수를 삭제할 때는 list 옵션에 벡터 형태로 입력합니다. 이름을 문자열로 입력해야 합니다. > rm(li.. 2023. 3. 20.
[R강의] 144.정규분포 함수 4종류 의미 (dnorm, pnorm, qnorm, rnorm) R에서 제공하는 정규분포 함수는 네 종류가 있습니다. 함수 이름과 입력값은 아래와 같습니다. dnorm(x, mean = 0, sd = 1, log = FALSE) pnorm(q, mean = 0, sd = 1, lower.tail = TRUE, log.p = FALSE) qnorm(p, mean = 0, sd = 1, lower.tail = TRUE, log.p = FALSE) rnorm(n, mean = 0, sd = 1) 하나씩 의미를 알아봅시다. dnorm dnorm 의 d는 density 입니다. dnorm 은 확률밀도함수를 의미합니다. x에서의 확률밀도값을 반환합니다. 종 모양의 정규분포함수에서 y값에 해당됩니다. pnorm pnorm 의 p는 probability 입니다. 누적확률을 의미합니.. 2023. 3. 20.
[R강의] 143. 엑셀 데이터 불러올 때 설명 행 없이 불러오기 아래와 같은 데이터가 있다고 합시다. 첫 두줄은 설명입니다. R에서 불러올 때 설명줄은 생략하고 불러오는 방법을 알아봅시다. [File]-[Import Dataset]-[From Excel] 을 클릭합니다. 데이터를 불러옵니다. 첫 두 줄을 생략하려면 Skip 에 2를 넣으면 됩니다. 2023. 3. 15.
[R강의] 142. var, sd 함수는 모집단일까 표본일까 var 함수 R에서 분산을 계산할 때 사용하는 var 함수가 모분산을 계산하는지 표본분산을 계산하는지 알아봅시다. data=c(1,2,3,4,5) #모 분산 직접 계산하기 var_cal_p=sum((data-mean(data))**2)/length(data) #표본 분산 직접 계산하기 var_cal_s=sum((data-mean(data))**2)/(length(data)-1) #var 함수 사용 var_fun=var(data) #출력 print(var_cal_p) print(var_cal_s) print(var_fun) > print(var_cal_p) [1] 2 > print(var_cal_s) [1] 2.5 > print(var_fun) [1] 2.5 var 로 계산된 결과가 표본분산임을 알 수 있.. 2023. 2. 27.
[R강의] 141. library 와 require 의 차이 둘의 역할은 동일합니다. 패키지를 로딩합니다. 차이는 아래와 같습니다. > require(AB) 필요한 패키지를 로딩중입니다: AB Warning message: In library(package, lib.loc = lib.loc, character.only = TRUE, logical.return = TRUE, : ‘AB’이라고 불리는 패키지가 없습니다 > library(AB) Error in library(AB) : ‘AB’이라고 불리는 패키지가 없습니다 패키지가 없는 경우 require 함수는 Warning 을 library 함수는 Error 을 출력합니다. 2023. 2. 27.
[R강의] 140. 데이터 프레임을 쉽게 조작하는 transform 함수 데이터프레임을 하나 정의합시다. num=1:10 score=c(78,62,65,94,71,97,57,83,71,96) md=data.frame(num,score) > md num score 1 1 78 2 2 62 3 3 65 4 4 94 5 5 71 6 6 97 7 7 57 8 8 83 9 9 71 10 10 96 둘째 열에 5를 더해서 셋째 열을 추가하는 상황을 가정합시다. 아래와 같이 인덱싱을 이용하여 추가할 수 있습니다. > md[,'add']=md$score+5 > md num score add 1 1 78 83 2 2 62 67 3 3 65 70 4 4 94 99 5 5 71 76 6 6 97 102 7 7 57 62 8 8 83 88 9 9 71 76 10 10 96 101 이번에는 tran.. 2023. 2. 27.
[ggplot2의 이해] 8. 히스토그램 (geom_histogram) 1. 히스토그램 그리기 내장 데이터인 mpg를 이용하여 박스플롯을 그려보았습니다. hwy 라는 열을 사용할 것인데, hwy 는 highway miles per gallon 입니다. 연비라고 생각하면 됩니다. 그래프를 그려봅시다. 다양한 옵션들을 넣어보았는데 필요 없는 것은 제거하고 사용하시면 됩니다. 설명은 주석에 있습니다. library(tidyverse) ggplot()+ geom_histogram(data=mpg,aes(x=hwy))+ #binwidth 로 간격 조절 가능 labs(title="geom_histogram",x='hwy')+ #제목, 축이름 theme(title = element_text(size=20,face='bold'))+ #제목 서식 theme(axis.title = eleme.. 2023. 2. 10.
[ggplot2의 이해] 7. 값을 출력하는 막대그래프 (geom_col) ggplot2 에서 제공하는 막대그래프는 두 종류가 있습니다. geom_bar 와 geom_col 입니다. geom_bar 는 하나의 범주형 변수를 이용하여 막대그래프를 그립니다. 예를들어 데이터가 (사과,사과,귤,바나나,바나나,바나나) 라면 세개의 막대가 그려집니다. 이때 세로축은 원소의 수가 됩니다. geom_col 은 범주형 독립변수와 연속형 종속변수를 이용하여 막대그래프를 그립니다. 이번 글에서는 geom_col 를 이용해서 막대그래프를 그려봅시다. 1. 막대그래프 그리기 내장 데이터인 mpg를 이용하여 막대그래프를 그려보았습니다. mpg 는 자동차 데이터입니다. 총 11개의 변수가 있는데요. 독립변수로 class 를 선택하고, 종속변수로 hwy 를 선택하겠습니다. class 는 차의 타입이고, .. 2023. 2. 8.
[R dplyr의 이해] 10. 원하는 열의 통계량 출력하기 (summarise, group_by) summarise 함수를 이용하면 데이터프레임 열의 다양한 통계량을 보기 좋게 출력할 수 있습니다. 1. 통계량 출력하기 iris 데이터에서 Sepal.Length 의 평균과 표준편차를 출력해봅시다. iris %>% summarise( mean(Sepal.Length),sd(Sepal.Length)) ##출력결과 > iris %>% summarise( mean(Sepal.Length),sd(Sepal.Length)) mean(Sepal.Length) sd(Sepal.Length) 1 5.843333 0.8280661 아래와 같이 출력되는 열 이름을 지정해줄 수도 있습니다. iris %>% summarise( mean=mean(Sepal.Length),stdev=sd(Sepal.Length)) ##출력결과.. 2023. 2. 8.
[R dplyr의 이해] 9. 연산을 통한 열 변형 혹은 생성 (mutate 함수) muatate 함수는 기존 열을 변형하거나, 기존 열을 이용하여 새로운 열을 생성하는 함수입니다. 1. 기존 열 변환 오늘 사용할 iris 데이터는 아래와 같습니다. > head(iris) Sepal.Length Sepal.Width Petal.Length Petal.Width Species 1 5.1 3.5 1.4 0.2 setosa 2 4.9 3.0 1.4 0.2 setosa 3 4.7 3.2 1.3 0.2 setosa 4 4.6 3.1 1.5 0.2 setosa 5 5.0 3.6 1.4 0.2 setosa 6 5.4 3.9 1.7 0.4 setosa iris 데이터를 dt 라는 변수에 저장하고, Sepal.Length 열에 10을 곱해봅시다. 결과를 다시 dt에 넣어주여야 dt가 변형됩니다. dt=.. 2023. 2. 8.
[R dplyr의 이해] 8. 유니크한 값만 추출하기 (distinct) distinct 함수를 이용하면 데이터프레임에서 선택한 열의 유니크한 값을 추출할 수 있습니다. 1. 하나의 열에서 유니크한 값 추출하기 mpg 데이터의 manuracturer 열의 유니트한 값들을 출력해봅시다. mpg %>% distinct(manufacturer) > mpg %>% distinct(manufacturer) # A tibble: 15 × 1 manufacturer 1 audi 2 chevrolet 3 dodge 4 ford 5 honda 6 hyundai 7 jeep 8 land rover 9 lincoln 10 mercury 11 nissan 12 pontiac 13 subaru 14 toyota 15 volkswagen 2. 여러 열에서 유니크한 값 출력하기 cyl 열을 기준으로 내.. 2023. 2. 8.
[R dplyr의 이해] 7. 데이터프레임 오름차순, 내림차순 정렬하기 (arrange) arrange 함수를 이용하면 데이터프레임에서 특정 열을 기준으로 오름차순 또는 내림차순 정렬을 할 수 있습니다. 1. 하나의 열을 기준으로 정렬 mtcars 데이터에서 mpg 열을 기준으로 오름차순 정렬하는 방법은 아래와 같습니다. mtcars %>% arrange(mpg) 같은 열을 기준으로 내림차순 정렬하는 방법은 아래와 같습니다. mtcars %>% arrange(desc(mpg)) 2. 여러 열을 기준으로 정렬 cyl 열을 기준으로 내림차순 정렬한 뒤, 그 안에서 mpg 를 기준으로 오름차순 정렬하는 방법은 아래와 같습니다. mtcars %>% arrange(desc(cyl),mpg) 2023. 2. 8.
[ggplot2의 이해] 6. 원소 수를 출력하는 막대그래프 (geom_bar) ggplot2 에서 제공하는 막대그래프는 두 종류가 있습니다. geom_bar 와 geom_col 입니다. geom_bar 는 하나의 범주형 변수를 이용하여 막대그래프를 그립니다. 예를들어 데이터가 (사과,사과,귤,바나나,바나나,바나나) 라면 세개의 막대가 그려집니다. 이때 세로축은 원소의 수가 됩니다. geom_col 은 범주형 독립변수와 연속형 종속변수를 이용하여 막대그래프를 그립니다. 이번 글에서는 geom_bar 를 이용해서 막대그래프를 그려봅시다. 1. 막대그래프 그리기 내장 데이터인 mpg를 이용하여 막대그래프를 그려보았습니다. mpg 는 자동차 데이터입니다. 총 11개의 독립변수가 있는데요. 이들 중 , manufacturer(제조사) 를 사용하겠습니다. 그래프를 그리면 제조사 별로 차가 몇.. 2023. 2. 7.
반응형