6. 정규분포 함수(rnorm, dnorm, pnorm, qnorm)
R에는 네 가지 정규분포와 관련된 함수가 내장되어 있습니다.
1. 난수 함수 rnorm
2. 확률밀도함수 dnorm
3. 누적분포함수 pnorm
4. 분위수함수 qnorm
한가지 씩 살펴봅시다.
6.1 난수함수(rnorm)
난수함수는 정규분포함수의 변수에 해당하는 값을 임의로 생성해 주는 함수입니다. 디폴트(기본셋팅)는 '표준정규분포'이구요. 평균과 표준편차를 설정해줄 수 있습니다.
한번 생성해봅시다.
> rnorm(5)
[1] -1.1819541 -0.6065962 0.6924985 -0.8988901 0.5788439
평균을 100, 표준편차를 5로 바꿔봅시다.
> rnorm(5,mean=100,sd=5)
[1] 104.68508 106.81284 96.29777 101.26942 109.49112
6.2 확률밀도함수(dnorm)
확률밀도함수의 함수값을 구해줍니다. 확률밀도함수이기 때문에 값 자체가 확률을 의미하지는 않습니다. 디폴트 평균이 0이니까. 최댓값은 0에서 발생합니다.
> dnorm(0)
[1] 0.3989423
평균은 그대로 두고 표준편차를 늘려봅시다.
> dnorm(0,sd=10)
[1] 0.03989423
표준편차가 커지면 최댓값이 작아지는 것을 확인할 수 있습니다.
6.3 누적분포함수(pnorm)
그림으로 설명하겠습니다. pnorm(1)는 아래 그림의 색칠한 부분의 넓이를 의미합니다.
R을 이용해서 넓이를 구해봅시다.
> pnorm(1)
[1] 0.8413447
아래 그림처럼 반대쪽 넓이를 구하고 싶을 때도 있어요.
아래와 같이 lower.tail=FALSE를 추가해주면 됩니다.
> pnorm(1,lower.tail=FALSE)
[1] 0.1586553
6.4 분위수함수(qnorm)
확률이 입력변수입니다. 어떤 확률을 입력하면 그 확률에 해당하는 변수값을 찾아줍니다.
예를들어 qnorm(0.85)를 입력하면 아래 그림의 a값을 찾아주는 것입니다.
> qnorm(0.85)
[1] 1.036433
qnorm(0.85,lower.tail=FALSE) 를 입력하면 아래 그림과 같은 상황으로 바뀝니다.
영상이 더 편하신 분
'R 주제 > R 기초 및 통계 강의' 카테고리의 다른 글
[R 강의] 8. 진리값(TRUE,FALSE) (0) | 2020.03.14 |
---|---|
[R 강의] 7. 문자열, NA, NULL, Inf, NaN (0) | 2020.03.14 |
[R 강의] 5. 자료의 통계량 구하는 법 (평균값,중간값,최빈값,분산 + sort함수) (0) | 2020.03.14 |
[R 강의] 4. 유용한 함수 1탄 (min, max, range, length, sum, prod) (0) | 2020.03.14 |
[R강의] 3. 변수에 숫자 데이터 입력 (0) | 2020.03.14 |
댓글