본문 바로가기
R 주제/R 기초 및 통계 강의

[R 강의] 55. 범주형 자료의 입력 (factor)

by 만다린망고 2020. 3. 27.
반응형
도구 R로 푸는 통계

55. 범주형 자료의 입력 (factor)



자료는 크게 둘로 나뉩니다.


- 범주형자료(질적자료)

- 연속형자료(양적자료)


factor는 범주형 자료를 표현하기 위한 데이터타입(type)입니다. 범주형 자료는 순서가 있느냐 없느냐에 따라 명목척도, 순위척도로 나뉘는데요. 예를 들어보겠습니다.


범주형자료 - 명목척도 : 혈액형(A,B,O,AB), 남녀(M,F)

               - 순위척도 : 학년(1,2,3) 


factor를 입력하는 형식은 아래와 같습니다.


factor(입력하기 원하는 데이터, 레벨, 순위여부)



ex1) 혈액형 데이터 입력하기


친구 다섯명의 혈액형이 아래와 같다고 합시다.


> bt=c("A","B","A","AB","O")


factor로 입력해주겠습니다.


> bt_f=factor(bt,levels=c("A","B","O","AB"))

> bt_f

[1] A  B  A  AB O 

Levels: A B O AB


순서가 상관 없다면, 레벨을 입력하지 않아도 됩니다. 알파벳 순서되로 자동으로 레벨이 지정됩니다. 


> bt_f=factor(bt)

> bt_f

[1] A  B  A  AB O 

Levels: A AB B O


summary 함수를 이용하면 각 level에 해당되는 사람이 몇명인지 알려줍니다.


> summary(bt_f)

 A  B  O AB 

 2  1  1  1 



ex2) 학년 데이터 입력하기


일학년 부터 삼학년까지만 있다고 합시다. 


> gr=c("1","2","3")

> gr_f=factor(gr,levels=c("1","2","3"),ordered=TRUE)

> gr_f

[1] 1 2 3

Levels: 1 < 2 < 3


레벨에 부등호가 추가되었습니다. 


ex3) 라벨 사용하기


요인을 숫자에 대응시키고 라벨을 붙여주는 것도 가능합니다. 남자를 1, 여자를 2에 대응시켜 봅시다. 친구 


다섯명 중에 두명이 남자 세명이 여자인 상황을 가정하겠습니다.


> fr=c("1","1","2","2","2")

> fr_f=factor(fr,levels=c("1","2"),labels=c("Male","Female"))

> fr_f

[1] Male   Male   Female Female Female

Levels: Male Female


 

 

영상이 더 편하신 분


반응형

댓글