본문 바로가기
반응형

R tidyverse/하루만에 끝내는 ggplot28

[ggplot2의 이해] 8. 히스토그램 (geom_histogram) 1. 히스토그램 그리기 내장 데이터인 mpg를 이용하여 박스플롯을 그려보았습니다. hwy 라는 열을 사용할 것인데, hwy 는 highway miles per gallon 입니다. 연비라고 생각하면 됩니다. 그래프를 그려봅시다. 다양한 옵션들을 넣어보았는데 필요 없는 것은 제거하고 사용하시면 됩니다. 설명은 주석에 있습니다. library(tidyverse) ggplot()+ geom_histogram(data=mpg,aes(x=hwy))+ #binwidth 로 간격 조절 가능 labs(title="geom_histogram",x='hwy')+ #제목, 축이름 theme(title = element_text(size=20,face='bold'))+ #제목 서식 theme(axis.title = eleme.. 2023. 2. 10.
[ggplot2의 이해] 7. 값을 출력하는 막대그래프 (geom_col) ggplot2 에서 제공하는 막대그래프는 두 종류가 있습니다. geom_bar 와 geom_col 입니다. geom_bar 는 하나의 범주형 변수를 이용하여 막대그래프를 그립니다. 예를들어 데이터가 (사과,사과,귤,바나나,바나나,바나나) 라면 세개의 막대가 그려집니다. 이때 세로축은 원소의 수가 됩니다. geom_col 은 범주형 독립변수와 연속형 종속변수를 이용하여 막대그래프를 그립니다. 이번 글에서는 geom_col 를 이용해서 막대그래프를 그려봅시다. 1. 막대그래프 그리기 내장 데이터인 mpg를 이용하여 막대그래프를 그려보았습니다. mpg 는 자동차 데이터입니다. 총 11개의 변수가 있는데요. 독립변수로 class 를 선택하고, 종속변수로 hwy 를 선택하겠습니다. class 는 차의 타입이고, .. 2023. 2. 8.
[ggplot2의 이해] 6. 원소 수를 출력하는 막대그래프 (geom_bar) ggplot2 에서 제공하는 막대그래프는 두 종류가 있습니다. geom_bar 와 geom_col 입니다. geom_bar 는 하나의 범주형 변수를 이용하여 막대그래프를 그립니다. 예를들어 데이터가 (사과,사과,귤,바나나,바나나,바나나) 라면 세개의 막대가 그려집니다. 이때 세로축은 원소의 수가 됩니다. geom_col 은 범주형 독립변수와 연속형 종속변수를 이용하여 막대그래프를 그립니다. 이번 글에서는 geom_bar 를 이용해서 막대그래프를 그려봅시다. 1. 막대그래프 그리기 내장 데이터인 mpg를 이용하여 막대그래프를 그려보았습니다. mpg 는 자동차 데이터입니다. 총 11개의 독립변수가 있는데요. 이들 중 , manufacturer(제조사) 를 사용하겠습니다. 그래프를 그리면 제조사 별로 차가 몇.. 2023. 2. 7.
[ggplot2의 이해] 5. 박스플롯 (geom_boxplot) 1. 박스플롯 그리기 MASS 패키지에서 제공하는 데이터인 Car93을 이용하여 박스플롯을 그려보았습니다. 독립변수는 자동차의 Type 이고, 종속변수는 자동차의 가격 입니다. 그래프를 그려봅시다. 다양한 옵션들을 넣어보았는데 필요 없는 것은 제거하고 사용하시면 됩니다. 설명은 주석에 있습니다. library(MASS) #Car93 데이터가 들어 있음 library(tidyverse) ggplot(data=Cars93,aes(x=Type,y=Price))+ geom_boxplot(outlier.color='red')+ labs(title="geom_boxplot",x='Type',y='Price')+ #제목, 축이름 theme(title = element_text(size=20,face='bold'))+.. 2023. 2. 6.
[ggplot2의 이해] 4. 선그래프 (geom_line) 1. 선 그래프 그리기 내장데이터인 Orange 를 이용하여 선그래프를 그려보았습니다. Orange 데이터는 다섯 종류 나무의 나이에 따른 테두리 둘레 데이터입니다. 1번 나무의 데이터만 Orange_1 에 저장합시다. Orange_1=Orange[Orange['Tree']==1,] 그래프를 그려봅시다. 주요한 옵션들만 넣었습니다. 주요 옵션은 제목, 축이름, 서식, 가운데정렬입니다. 설명은 주석으로 대신합니다. library(tidyverse) ggplot(data=Orange_1,aes(x=age,y=circumference))+ geom_line()+ labs(title="geom_line",x='age',y='circumference')+ #제목, 축이름 theme(title = element_t.. 2023. 2. 6.
[ggplot2의 이해] 3. 산점도 (geom_point) 1. 산점도 그리기 내장데이터인 iris 를 이용하여 산점도를 그려보았습니다. 주요한 옵션들만 넣었습니다. 주요 옵션은 제목, 축이름, 서식, 가운데정렬입니다. 설명은 주석으로 대신합니다. library(tidyverse) ggplot(data=iris,aes(x=Sepal.Length,y=Sepal.Width))+ geom_point()+ labs(title="geom_point",x='Sepal Length',y='Sepal Width')+ #제목, 축이름 theme(title = element_text(size=20,face='bold'))+ #제목 서식 theme(axis.title = element_text(size=10,face='bold'))+ #축서식 theme(plot.title = el.. 2023. 2. 3.
[ggplot2의 이해] 2. ggplot2의 기본구조 ggplot2 를 공부하기 전에 먼저 아래 패키지를 설치합시다. install.packages("tidyverse") 이 패키지를 설치하면 tidyverse 의 모든 패키지를 사용할 수 있습니다. 이제 본격적으로 ggplot2 를 공부해봅시다. ggplot2 는 데이터프레임(또는 tibble)을 이용하여 그리는 것을 원칙으로 합니다. 우리가 다루는 데이터프레임이 변수 df 에 들어있다고 합시다. 어떤 그래프를 그릴 것인지와 상관 없이 아래 코드로 시작합니다. ggplot(data=df) "그래프를 그릴 것이고 데이터는 df 를 사용할 것이다" 라는 뜻입니다. 이제 그릴 그래프를 선택해야 합니다. 그래프를 그려주는 함수들은 아래와 같습니다. 더 여러가지 종류가 있지만 자주 사용되는 함수들만 가져왔습니다. .. 2023. 1. 28.
[ggplot2의 이해] 1. ggplot2란 무엇인가? R 안에는 tidyverse 라는 또 하나의 세계가 있습니다. tidyverse는 Hadley Wickham과 그의 팀이 개발한 패키지 모음을 말합니다. tidyverse 없이도 R을 사용하는데 전혀 문제가 없지만, tidyverse 를 사용하면 데이터 전처리,시각화 등이 편해집니다. 시중에 출시되고 있는 R을 이용한 데이터분석 및 시각화 책들은 tidyverse 패키지를 사용하고 있기 때문에 R로 데이터 분석을 한다면 거의 필수적으로 사용해야 하는 패키지가 되었습니다. tidyverse 안에는 아래 패키지들이 있습니다. dplyr : 데이터 전처리 ggplot2 : 시각화 readr : 데이터 호출 lubridate : 시계열 데이터 전처리 stringr : 텍스트 전처리 purrr : 함수형 패키지 .. 2023. 1. 27.
반응형