[R강의] 104. 데이터프레임의 구조확인 str함수 vs glimpse 함수
데이터프레임의 구조를 확인하는 함수에는 두가지가 있습니다. 내장함수인 str 함수와, dplyr패키지의 glimpse 함수입니다. 데이터프레임 뿐 아니라, 모든 종류의 데이터의 구조를 확인해줍니다.
내장데이터인 CO2 데이터를 이용하여 비교하겠습니다. 먼저 str 함수입니다.
> str(CO2)
Classes ‘nfnGroupedData’, ‘nfGroupedData’, ‘groupedData’ and 'data.frame': 84 obs. of 5 variables:
$ Plant : Ord.factor w/ 12 levels "Qn1"<"Qn2"<"Qn3"<..: 1 1 1 1 1 1 1 2 2 2 ...
$ Type : Factor w/ 2 levels "Quebec","Mississippi": 1 1 1 1 1 1 1 1 1 1 ...
$ Treatment: Factor w/ 2 levels "nonchilled","chilled": 1 1 1 1 1 1 1 1 1 1 ...
$ conc : num 95 175 250 350 500 675 1000 95 175 250 ...
$ uptake : num 16 30.4 34.8 37.2 35.3 39.2 39.7 13.6 27.3 37.1 ...
- attr(*, "formula")=Class 'formula' language uptake ~ conc | Plant
.. ..- attr(*, ".Environment")=<environment: R_EmptyEnv>
- attr(*, "outer")=Class 'formula' language ~Treatment * Type
.. ..- attr(*, ".Environment")=<environment: R_EmptyEnv>
- attr(*, "labels")=List of 2
..$ x: chr "Ambient carbon dioxide concentration"
..$ y: chr "CO2 uptake rate"
- attr(*, "units")=List of 2
..$ x: chr "(uL/L)"
..$ y: chr "(umol/m^2 s)"
CO2라는 데이터프레임에는 다섯개의 데이터가 들어있다는 것을 알 수 있습니다. Plant, Type, Treatment, conc, uptake 입니다. attr은 속성입니다.
이번에는 glimpse 함수를 사용해봅시다.
> library(dplyr)
> glimpse(CO2)
Observations: 84
Variables: 5
$ Plant <ord> Qn1, Qn1, Qn1, Qn1, Qn1, Qn1, Qn1, Qn2, Qn2...
$ Type <fct> Quebec, Quebec, Quebec, Quebec, Quebec, Que...
$ Treatment <fct> nonchilled, nonchilled, nonchilled, nonchil...
$ conc <dbl> 95, 175, 250, 350, 500, 675, 1000, 95, 175,...
$ uptake <dbl> 16.0, 30.4, 34.8, 37.2, 35.3, 39.2, 39.7, 1...
glimpse가 가독성이 더 좋습니다. 아쉬운점은 level의 수가 나오지 않습니다.
'R 주제 > R 기초 및 통계 강의' 카테고리의 다른 글
[R 강의] 106. 피어슨 상관분석 (0) | 2020.12.10 |
---|---|
[R강의] 105. attr 이 무엇인가요? (0) | 2020.10.03 |
[R 강의] 103. 정말 유용한 %>% 연산자 (0) | 2020.10.02 |
[R강의] 102. 표본추출 방법 - 계통추출법(systematic sampling) (0) | 2020.09.29 |
[R강의] 101. 통계청 데이터 다운받고 R에서 불러오는 방법 (0) | 2020.09.23 |
댓글