55. 범주형 자료의 입력 (factor)
자료는 크게 둘로 나뉩니다.
- 범주형자료(질적자료)
- 연속형자료(양적자료)
factor는 범주형 자료를 표현하기 위한 데이터타입(type)입니다. 범주형 자료는 순서가 있느냐 없느냐에 따라 명목척도, 순위척도로 나뉘는데요. 예를 들어보겠습니다.
범주형자료 - 명목척도 : 혈액형(A,B,O,AB), 남녀(M,F)
- 순위척도 : 학년(1,2,3)
factor를 입력하는 형식은 아래와 같습니다.
factor(입력하기 원하는 데이터, 레벨, 순위여부)
ex1) 혈액형 데이터 입력하기
친구 다섯명의 혈액형이 아래와 같다고 합시다.
> bt=c("A","B","A","AB","O")
factor로 입력해주겠습니다.
> bt_f=factor(bt,levels=c("A","B","O","AB"))
> bt_f
[1] A B A AB O
Levels: A B O AB
순서가 상관 없다면, 레벨을 입력하지 않아도 됩니다. 알파벳 순서되로 자동으로 레벨이 지정됩니다.
> bt_f=factor(bt)
> bt_f
[1] A B A AB O
Levels: A AB B O
summary 함수를 이용하면 각 level에 해당되는 사람이 몇명인지 알려줍니다.
> summary(bt_f)
A B O AB
2 1 1 1
ex2) 학년 데이터 입력하기
일학년 부터 삼학년까지만 있다고 합시다.
> gr=c("1","2","3")
> gr_f=factor(gr,levels=c("1","2","3"),ordered=TRUE)
> gr_f
[1] 1 2 3
Levels: 1 < 2 < 3
레벨에 부등호가 추가되었습니다.
ex3) 라벨 사용하기
요인을 숫자에 대응시키고 라벨을 붙여주는 것도 가능합니다. 남자를 1, 여자를 2에 대응시켜 봅시다. 친구
다섯명 중에 두명이 남자 세명이 여자인 상황을 가정하겠습니다.
> fr=c("1","1","2","2","2")
> fr_f=factor(fr,levels=c("1","2"),labels=c("Male","Female"))
> fr_f
[1] Male Male Female Female Female
Levels: Male Female
영상이 더 편하신 분
'R 주제 > R 기초 및 통계 강의' 카테고리의 다른 글
[R 강의] 57. 데이터프레임에 접근하기 (data.frame) (0) | 2020.03.27 |
---|---|
[R 강의] 56. 데이터프레임 만들기 (data.frame) (0) | 2020.03.27 |
[R 강의] 54. 1표본 Z 검정 함수 만들기 (0) | 2020.03.26 |
[R 강의] 53. 함수를 파일(.R)로 저장 및 사용하기 (0) | 2020.03.26 |
[R 강의] 52. 작업폴더 보기/설정하기, 작업폴더 내 파일보기 (0) | 2020.03.26 |
댓글