본문 바로가기
R 주제/R 기초 및 통계 강의

[R강의] 104. 데이터프레임의 구조확인 str함수 vs glimpse 함수

by 만다린망고 2020. 10. 2.
반응형

[R강의] 104. 데이터프레임의 구조확인 str함수 vs glimpse 함수




데이터프레임의 구조를 확인하는 함수에는 두가지가 있습니다. 내장함수인 str 함수와, dplyr패키지의 glimpse 함수입니다. 데이터프레임 뿐 아니라, 모든 종류의 데이터의 구조를 확인해줍니다. 


내장데이터인 CO2 데이터를 이용하여 비교하겠습니다. 먼저 str 함수입니다. 


> str(CO2)

Classes ‘nfnGroupedData’, ‘nfGroupedData’, ‘groupedData’ and 'data.frame': 84 obs. of  5 variables:

 $ Plant    : Ord.factor w/ 12 levels "Qn1"<"Qn2"<"Qn3"<..: 1 1 1 1 1 1 1 2 2 2 ...

 $ Type     : Factor w/ 2 levels "Quebec","Mississippi": 1 1 1 1 1 1 1 1 1 1 ...

 $ Treatment: Factor w/ 2 levels "nonchilled","chilled": 1 1 1 1 1 1 1 1 1 1 ...

 $ conc     : num  95 175 250 350 500 675 1000 95 175 250 ...

 $ uptake   : num  16 30.4 34.8 37.2 35.3 39.2 39.7 13.6 27.3 37.1 ...

 - attr(*, "formula")=Class 'formula'  language uptake ~ conc | Plant

  .. ..- attr(*, ".Environment")=<environment: R_EmptyEnv> 

 - attr(*, "outer")=Class 'formula'  language ~Treatment * Type

  .. ..- attr(*, ".Environment")=<environment: R_EmptyEnv> 

 - attr(*, "labels")=List of 2

  ..$ x: chr "Ambient carbon dioxide concentration"

  ..$ y: chr "CO2 uptake rate"

 - attr(*, "units")=List of 2

  ..$ x: chr "(uL/L)"

  ..$ y: chr "(umol/m^2 s)"


CO2라는 데이터프레임에는 다섯개의 데이터가 들어있다는 것을 알 수 있습니다. Plant, Type, Treatment, conc, uptake 입니다. attr은 속성입니다. 


이번에는 glimpse 함수를 사용해봅시다. 


> library(dplyr)

> glimpse(CO2)

Observations: 84

Variables: 5

$ Plant     <ord> Qn1, Qn1, Qn1, Qn1, Qn1, Qn1, Qn1, Qn2, Qn2...

$ Type      <fct> Quebec, Quebec, Quebec, Quebec, Quebec, Que...

$ Treatment <fct> nonchilled, nonchilled, nonchilled, nonchil...

$ conc      <dbl> 95, 175, 250, 350, 500, 675, 1000, 95, 175,...

$ uptake    <dbl> 16.0, 30.4, 34.8, 37.2, 35.3, 39.2, 39.7, 1...


glimpse가 가독성이 더 좋습니다. 아쉬운점은 level의 수가 나오지 않습니다. 

반응형

댓글