도구 R로 푸는 통계
정규성검정은 자료가 정규분포를 따르는지 여부를 검정해줍니다. 보통 아래 기준을 따릅니다. 이 기준은 rule of thumb(경험법칙) 입니다. 경험적으로 이렇게 쓰게 된 것입니다. p값의 유의수준을 0.05로 놓는 것처럼 말이죠.
표본크기 30이상 : 정규성검정 없이 표본 평균이 정규분포를 따른다고 가정(중심극한정리)
표본크기 10~30 : 정규성 검정 후 결정
표본크기 10 이하 : 정규분포 가정 불가
(표본크기 기준을 15와 40으로 두는 경우도 있습니다.)
다양한 방법이 있는데요. 대표적인 검정들은 아래와 같습니다.
Anderson–Darling test (AD test)
Cramér–von Mises criterion (CVM test)
Kolmogorov–Smirnov test (KS test)
Lilliefors test (LF test)
Shapiro–Wilk test (SW test)
귀무가설과 대립가설은 아래와 같습니다.
귀무가설 : 표본이 정규분포를 따르는 모집단에서 추출되었다.
대립가설 : 그렇지 않다.
이번 글에서는 SW test와 LF test 를 이용하여 정규성 검정을 해볼겁니다. LF test는 KS test 확장판이라고 생각하시면 됩니다.
참고로 SPSS에서는 정규성검정을 하면 LF test와 SW test의 결과를 출력해줍니다. 설명은 주석으로 대신합니다.
#크기 20인 샘플 생성
#크기가 20개이므로 정규성검정 후 정규분포 가정 여부 결정
x=rnorm(20,10,2)
#lilliefors test를 하기 위해 nortest 패캐지를 먼저 설치합니다.
install.packages("nortest")
#패키지 불러오기
library(nortest)
#Lilliefors test
lillie.test(x)
#shapiro wilk test
shapiro.test(x)
아래는 결과입니다.
> lillie.test(x)
Lilliefors (Kolmogorov-Smirnov) normality test
data: x
D = 0.16298, p-value = 0.1769
> shapiro.test(x)
Shapiro-Wilk normality test
data: x
W = 0.91108, p-value = 0.06683
LF test 결과의 p 값은 0.17이고, SW test 는 0.06 입니다. 기각되지 않아 정규성을 가정할 수 있습니다.
정규성검정을 할때는 보통 qqplot 도 함께 그려봅니다. 점들이 직선에 가까울수록 정규분포를 따르는 것입니다.
qqnorm(x)
qqline(x)
영상이 더 편하신 분
'R 주제 > R 기초 및 통계 강의' 카테고리의 다른 글
[R 강의] 100. 윌콕슨 순위합 검정 (독립표본 t검정의 비모수) (0) | 2020.07.09 |
---|---|
[R 강의] 99. 일표본 윌콕슨 검정 (일표본 t검정의 비모수) (0) | 2020.06.29 |
[R 강의] 97. 대응표본 t검정 (4) | 2020.06.22 |
[R 강의] 96. 독립표본 t검정 (+등분산 검정) (0) | 2020.06.16 |
[R 강의] 95. 일표본 t검정 (0) | 2020.06.16 |
댓글