본문 바로가기
반응형

R데이터분석7

[ggplot2의 이해] 8. 히스토그램 (geom_histogram) 1. 히스토그램 그리기 내장 데이터인 mpg를 이용하여 박스플롯을 그려보았습니다. hwy 라는 열을 사용할 것인데, hwy 는 highway miles per gallon 입니다. 연비라고 생각하면 됩니다. 그래프를 그려봅시다. 다양한 옵션들을 넣어보았는데 필요 없는 것은 제거하고 사용하시면 됩니다. 설명은 주석에 있습니다. library(tidyverse) ggplot()+ geom_histogram(data=mpg,aes(x=hwy))+ #binwidth 로 간격 조절 가능 labs(title="geom_histogram",x='hwy')+ #제목, 축이름 theme(title = element_text(size=20,face='bold'))+ #제목 서식 theme(axis.title = eleme.. 2023. 2. 10.
[R dplyr의 이해] 10. 원하는 열의 통계량 출력하기 (summarise, group_by) summarise 함수를 이용하면 데이터프레임 열의 다양한 통계량을 보기 좋게 출력할 수 있습니다. 1. 통계량 출력하기 iris 데이터에서 Sepal.Length 의 평균과 표준편차를 출력해봅시다. iris %>% summarise( mean(Sepal.Length),sd(Sepal.Length)) ##출력결과 > iris %>% summarise( mean(Sepal.Length),sd(Sepal.Length)) mean(Sepal.Length) sd(Sepal.Length) 1 5.843333 0.8280661 아래와 같이 출력되는 열 이름을 지정해줄 수도 있습니다. iris %>% summarise( mean=mean(Sepal.Length),stdev=sd(Sepal.Length)) ##출력결과.. 2023. 2. 8.
[R dplyr의 이해] 9. 연산을 통한 열 변형 혹은 생성 (mutate 함수) muatate 함수는 기존 열을 변형하거나, 기존 열을 이용하여 새로운 열을 생성하는 함수입니다. 1. 기존 열 변환 오늘 사용할 iris 데이터는 아래와 같습니다. > head(iris) Sepal.Length Sepal.Width Petal.Length Petal.Width Species 1 5.1 3.5 1.4 0.2 setosa 2 4.9 3.0 1.4 0.2 setosa 3 4.7 3.2 1.3 0.2 setosa 4 4.6 3.1 1.5 0.2 setosa 5 5.0 3.6 1.4 0.2 setosa 6 5.4 3.9 1.7 0.4 setosa iris 데이터를 dt 라는 변수에 저장하고, Sepal.Length 열에 10을 곱해봅시다. 결과를 다시 dt에 넣어주여야 dt가 변형됩니다. dt=.. 2023. 2. 8.
[R dplyr의 이해] 8. 유니크한 값만 추출하기 (distinct) distinct 함수를 이용하면 데이터프레임에서 선택한 열의 유니크한 값을 추출할 수 있습니다. 1. 하나의 열에서 유니크한 값 추출하기 mpg 데이터의 manuracturer 열의 유니트한 값들을 출력해봅시다. mpg %>% distinct(manufacturer) > mpg %>% distinct(manufacturer) # A tibble: 15 × 1 manufacturer 1 audi 2 chevrolet 3 dodge 4 ford 5 honda 6 hyundai 7 jeep 8 land rover 9 lincoln 10 mercury 11 nissan 12 pontiac 13 subaru 14 toyota 15 volkswagen 2. 여러 열에서 유니크한 값 출력하기 cyl 열을 기준으로 내.. 2023. 2. 8.
[R dplyr의 이해] 7. 데이터프레임 오름차순, 내림차순 정렬하기 (arrange) arrange 함수를 이용하면 데이터프레임에서 특정 열을 기준으로 오름차순 또는 내림차순 정렬을 할 수 있습니다. 1. 하나의 열을 기준으로 정렬 mtcars 데이터에서 mpg 열을 기준으로 오름차순 정렬하는 방법은 아래와 같습니다. mtcars %>% arrange(mpg) 같은 열을 기준으로 내림차순 정렬하는 방법은 아래와 같습니다. mtcars %>% arrange(desc(mpg)) 2. 여러 열을 기준으로 정렬 cyl 열을 기준으로 내림차순 정렬한 뒤, 그 안에서 mpg 를 기준으로 오름차순 정렬하는 방법은 아래와 같습니다. mtcars %>% arrange(desc(cyl),mpg) 2023. 2. 8.
[R dplyr의 이해] 6. 원하는 열 추출 및 제외하기 (select) 1. 원하는 열 추출하기 내장데이터인 mpg 데이터에서 model과 year 열을 추출해봅시다. mpg %>% select(model,year) 2. 원하지 않는 열 제외하기 mpg 데이터에서 drv 열을 제외해봅시다. 마이너스를 붙이면 됩니다. mpg %>% select(-drv) 2023. 2. 7.
[R dplyr의 이해] 5. 조건을 만족하는 행 추출 (filter) tidyverse의 dplyr(디플라이알)에서 제공하는 filter 함수는 특정 조건을 만족하는 행만 추출하는 함수입니다. 내장데이터인 mpg를 이용해서 실습해봅시다. mpg 는 자동차 데이터입니다. > mpg # A tibble: 234 × 11 manufacturer model displ year cyl trans drv cty hwy fl class 1 audi a4 1.8 1999 4 auto(l5) f 18 29 p compact 2 audi a4 1.8 1999 4 manual(m5) f 21 29 p compact 3 audi a4 2 2008 4 manual(m6) f 20 31 p compact 4 audi a4 2 2008 4 auto(av) f 21 30 p compact 5 audi.. 2023. 2. 7.
반응형