본문 바로가기
반응형

R 주제/R 기초 및 통계 강의176

[R강의] 116. 01,02,03,.. 형태의 벡터 만드는 방법 01,02,03,04...와 같은 벡터를 만드는 방법입니다. sprintf 함수를 사용합니다. sprintf 함수는 포멧팅 방식을 설정할 수 있습니다. sprintf(포멧팅 방식, 인자) ex) 01~50 까지의 벡터를 01,02,03...으로 출력 > num=sprintf("%02d", 1:50) > num [1] "01" "02" "03" "04" "05" "06" "07" "08" "09" "10" "11" "12" "13" "14" "15" "16" "17" "18" "19" [20] "20" "21" "22" "23" "24" "25" "26" "27" "28" "29" "30" "31" "32" "33" "34" "35" "36" "37" "38" [39] "39" "40" "41" "42" .. 2021. 6. 28.
[R강의] 115. 데이터프레임에서 한 열을 기준으로 나머지열도 정렬하는법 아래와 같은 데이터프레임이 있습니다. 내장데이터인 CO2 데이터입니다. > head(CO2,10) Plant Type Treatment conc uptake 1 Qn1 Quebec nonchilled 95 16.0 2 Qn1 Quebec nonchilled 175 30.4 3 Qn1 Quebec nonchilled 250 34.8 4 Qn1 Quebec nonchilled 350 37.2 5 Qn1 Quebec nonchilled 500 35.3 6 Qn1 Quebec nonchilled 675 39.2 7 Qn1 Quebec nonchilled 1000 39.7 8 Qn2 Quebec nonchilled 95 13.6 9 Qn2 Quebec nonchilled 175 27.3 10 Qn2 Quebec .. 2021. 6. 11.
[R강의] 114. 여러 그래프의 제목과 축이름 글자 크기 한번에 바꾸는법 아래와 같이 세개의 그래프를 그렸다고 합시다. par(mfrow=c(1,3)) x=seq(-4,4,0.01) y=dnorm(x) plot(x,y,type='l',main="확률밀도함수 PDF",xlab="X",ylab="f(X)") x=seq(-4,4,0.01) y=pnorm(x) plot(x,y,type='l',main="누적분포함수 CDF",xlab="X",ylab="cumulative P") x=seq(0,1,0.01) y=qnorm(x) plot(x,y,type='l',main="역누적분포함수",xlab="cumulative P",ylab="X") 글자 크기를 바꾸려면 각 plot 내부에 cex 옵션을 정의해야 하는데 번거롭습니다. par 함수를 이용하면 한번에 바꿀 수 있습니다. par(mfro.. 2021. 6. 11.
[R강의] 113. 패키지들 설치경로 확인하기 콘솔 창에 아래 명령어를 입력합니다. .libPaths() 제 경우는 두개의 경로가 나왔습니다. > .libPaths() [1] "C:/Users/Javis/Documents/R/win-library/4.0" "C:/Program Files/R/R-4.0.3/library" 왼쪽 경로에는 새로 설치한 패키지들이 들어있었고, 오른쪽 경로에는 R설치시 디폴트로 설치되는 패키지들이 있었습니다. 패키지 설치결로를 변경할 때는 아래와 같이 입력하시면 됩니다. .libPaths("원하는 경로") 2021. 6. 10.
[R강의] 112. 상위 5개 숫자 추출하기 상위 5개 숫자를 출력하는 방법입니다. 설명은 주석으로 대신합니다. #데이터 A=c(1,4,23,5,2,122,3,7,2,65) #내림차순정렬 후 슬라이싱 A_top5=sort(A,decreasing = TRUE)[1:5] 2021. 5. 31.
[R강의] 111. 산점도 그래프 회전 산점도 그래프를 회전하는 방법에 대해 알아봅시다. 아래 그래프를 그려볼 것입니다. 상관분석 예시 그림을 만들때 사용하였습니다. 먼저 정규분포 함수에서 임의추출하여 x와 y를 생성합니다. #데이터 x=rnorm(1000,10,3) y=rnorm(1000,10,1) 그래프로 그려보면 아래와 같습니다. 의도적으로 상하방향이 납작하게 설정하였습니다. 표준편차를 작게 해주면 됩니다. #데이터 x=rnorm(1000,10,3) y=rnorm(1000,10,1) #plot plot(x,y,xlim=c(0,20),ylim=c(0,20),main="0deg") 회전하기 위해 회전행렬을 정의합니다. (a,b)를 $\theta$ 만큼 회전한 점 (a',b')를 구하는 방법은 아래와 같습니다. $\begin{bmatrix} .. 2021. 5. 26.
[R강의] 110. 데이터분석 결과를 '표'로 출력하는 방법 두 가지 검정결과 등을 커멘드 창에서 입력해서 보는 것이 불편합니다. t검정을 예로 들면, t검정 결과가 오른쪽 plot 창에 출력되면 편리할 것입니다. 또는 새 탭에 표 형식으로 출력할 수도 있습니다. 두 방법 모두 설명드리겠습니다. 한가지 상황을 가정하겠습니다. A,B 두 집단의 키와 몸무게 비교하는 상황입니다. 아래와 같은 표를 출력하는 것이 목적입니다. A집단 B집단 p-value 키 평균±표준편차 평균±표준편차 p값 몸무게 평균±표준편차 평균±표준편차 p값 1. View로 출력하는 방법 설명은 코드 주석으로 대신합니다. library(plotrix) library(dplyr) #데이터 생성 A_Height=rnorm(100,183,3) B_Height=rnorm(100,172,5) A_Weight=rno.. 2021. 5. 26.
[R강의] 109. 도수분포다각형 정규분포에서 표본을 추출하여 히스토그램을 하나 그려봅시다. d=rnorm(400,170,30) h=hist(data) 히스토그램이 저장된 변수 h를 콘솔창에 입력해봅시다. > h $breaks [1] 80 100 120 140 160 180 200 220 240 260 280 $counts [1] 3 9 53 83 92 94 51 12 2 1 $density [1] 0.000375 0.001125 0.006625 0.010375 0.011500 0.011750 0.006375 0.001500 0.000250 0.000125 $mids [1] 90 110 130 150 170 190 210 230 250 270 $xname [1] "data" $equidist [1] TRUE attr(,"class") [.. 2021. 3. 24.
[R강의] 108. 표준정규분포표 만들기 R을 이용하여 표준정규분포표를 만들어봅시다. 첫째줄을 먼저 만들고, z값에 0.1씩 더해가며 나머지 줄을 추가하는 코드입니다. #소수 둘째자리 z값 z_hrow=seq(0,0.09,0.01) #표준정규분포표 첫째줄 만들기 tab=round(pnorm(z_hrow),4) #나머지 줄 생성 for (i in seq(0.1,3.9,0.1)) { add_row=round(pnorm(z_hrow+i),4) tab=rbind(tab,add_row) } #열이름 colnames(tab)=z_hrow #행 이름 rownames(tab)=seq(0,3.9,0.1) #새 창에 출력하기기 View(tab) 2021. 3. 22.
[R강의] 107. 히스토그램에서 density는 상대도수가 아닙니다. 먼저 히스토그램에서 density는 두가지가 있다는 사실을 알고 시작합시다. 하나는 히스토그램을 그린 결과로 출력되는 density와 옵션으로 입력하는 density입니다. 옵션으로 입력하는 density는 히스토그램 막대에 체크무늬를 만들어주는 것인데, 우리가 오늘 다루려고 하는 density는 히스토그램을 그린 결과로 출력되는 density입니다. 데이터를 하나 정의합시다. 키 데이터입니다. 계급값과 도수를 아래와 같이 갖도록 만들겠습니다. 160-170 : 4명 170-180 : 6명 상대도수는 아래와 같습니다. 160-170 : 0.4 170-180 : 0.6 데이터는 아래와 같이 만들면 됩니다. height=c(161,162,163,164,171,172,173,174,175,176) 히스토그램을.. 2021. 1. 7.
[R 강의] 106. 피어슨 상관분석 1. 설명 상관분석은 서로 짝지어진 두 변수 사이의 관계의 강도를 [-1,1] 의 값을 갖는 상관계수로 나타내는 분석방법입니다. 0이면 관계 없음, 1에 가까울 수록 비례관계, -1에 가까울 수록 반비례관계입니다. 상관계수를 판단하는 일반적 기준은 아래와 같습니다. 0.0~0.2 : very weak correlation (or negligible) 0.2~0.4 : weak correlation 0.4~0.6 : moderate correlation 0.6~0.8 : strong correlation 0.8~1.0 : very strong correlation 절대적 기준은 아닙니다. 예를들어 '암과의 상관관계' 라면 낮은 상관계수도 유의미하게 해석될 수 있습니다. 상관계수에 대한 가설검정도 수행합니다.. 2020. 12. 10.
[R강의] 105. attr 이 무엇인가요? R을 사용하다 보면 attr 을 보게될 때가 있습니다. 예를들어 x라는 벡터에 scale 함수를 적용하면, 결과 데이터 이외에 아래 sttr 이라는 내용이 출력됩니다. > x=1:5 > scale(x) [,1] [1,] -1.2649111 [2,] -0.6324555 [3,] 0.0000000 [4,] 0.6324555 [5,] 1.2649111 attr(,"scaled:center") [1] 3 attr(,"scaled:scale") [1] 1.581139 attr 는 attribute 의 약어입니다. 속성이라는 뜻입니다. 변수에 속성을 지정할 수가 있는데요. 그럴 경우 입력되는 정보입니다. 벡터를 하나 정의하고 속성을 입력해보겠습니다. v1=c(1,2,3,4,5) attr을 입력할건데요. 입력하는 방.. 2020. 10. 3.
[R강의] 104. 데이터프레임의 구조확인 str함수 vs glimpse 함수 [R강의] 104. 데이터프레임의 구조확인 str함수 vs glimpse 함수 데이터프레임의 구조를 확인하는 함수에는 두가지가 있습니다. 내장함수인 str 함수와, dplyr패키지의 glimpse 함수입니다. 데이터프레임 뿐 아니라, 모든 종류의 데이터의 구조를 확인해줍니다. 내장데이터인 CO2 데이터를 이용하여 비교하겠습니다. 먼저 str 함수입니다. > str(CO2)Classes ‘nfnGroupedData’, ‘nfGroupedData’, ‘groupedData’ and 'data.frame':84 obs. of 5 variables: $ Plant : Ord.factor w/ 12 levels "Qn1" 2020. 10. 2.
[R 강의] 103. 정말 유용한 %>% 연산자 [R 강의] 103. 정말 유용한 %>% 연산자 %>%연산자는 dplyr 패키지에서 제공하는 연산자입니다. 파이프연산자라고 부릅니다. 알아두면 아주 유용한 연산자입니다. 연산자 오른쪽에 있는 함수를 왼쪽에 적용해줍니다. 직접 사용해보며 이해해봅시다. 먼저 dplyr 패키지를 설치합시다. install.packages("dplyr") 벡터를 정의하고, 파이프 연산자를 이용하여 평균을 구해봅시다. a=c(1.11,2.22,3.33,4.44,5.55)a_mean=a %>% mean > a_mean[1] 3.33 파이프 연산자는 변수에 적용된 함수가 많아질 수록 빛을 발함니다. 위에서 정의한 벡터의 평균을 구하고, 소수 둘째자리에서 반올림을 해봅시다. 먼저 파이프 연산자를 사용하지 않고 구해보겠습니다. > ro.. 2020. 10. 2.
[R강의] 102. 표본추출 방법 - 계통추출법(systematic sampling) [R강의] 102. 표본추출 방법 - 계통추출법(systematic sampling) 표본추출방법은 크게 확률추출법과 비확률추출법으로 나뉩니다. 오늘은 R에서 계통추출을 하는 방법을 공부해봅시다. 표본추출방법에 대한 내용은 아래 글을 참고해주세요. https://hsm-edu.tistory.com/1083 계통추출법 (systematic sampling)은 간격 k를 정하고, k보다 작은 번호에서 출발하여 k간격으로 표본을 추출하는 방법입니다. 예를들어 모집단의 크기가 10이라고 해봅시다. 모집단 원소들을 각각 1번부터 10번까지의 번호를 붙였습니다. 3번으로 출발하여 2간격으로 표본을 추출하면 아래와 같습니다. 3번, 5번, 7번, 9번 R 코드를 짜봅시다. 첫 번호와, 간격 k를 입력하면 표본을 추출.. 2020. 9. 29.
[R강의] 101. 통계청 데이터 다운받고 R에서 불러오는 방법 [R강의] 101. 통계청 데이터 다운받고 R에서 불러오는 방법 오늘은 통계청에서 제공하는 국가통계데이터를 다운 받고, R에서 불러오는 방법을 알려드리겠습니다. 국가 통계 데이터는 아래 사이트에서 다운받을 수 있습니다. https://kosis.kr/index/index.do 국가통계포털 사이트입니다. 국가통계포털은 KOSIS라고 부릅니다. Korean Statistical Information Service 의 줄임말입니다. 우리가 오늘 다운받을 데이터는 '사망원인'데이터입니다. 상단 [국내통계] 탭의 [주제 별 통계]로 들어갑니다. [보건]을 클릭하고 [사망원인통계]를 클릭합니다. (아래 그림 참고) 아래 그림처럼 사망원인 236항목을 클릭합니다. 시점을 전체로 변경해줍니다. 항목표두, 시점표측을 선.. 2020. 9. 23.
[R 강의] 100. 윌콕슨 순위합 검정 (독립표본 t검정의 비모수) 도구 R로 푸는 통계100. 윌콕슨 순위합 검정 (독립표본 t검정의 비모수) 1. 설명 표본의 정규성이 확보되지 않은 경우 독립표본 t검정 대신 사용합니다. 독립표본 t검정은 서로 독립인 두 집단의 평균을 비교하는 검정입니다. 윌콕슨 순위합 검정(Wilcoxon rank sum test)는 맨-휘트니 U 검정(Mann–Whitney U test)이라고도 부릅니다. 아래 두번째 경우에서 정규성 검정에 기각된 경우와, 세번째 경우에서 윌콕슨 순위합 검정을 하게됩니다. 30 이상 : t-test10-30 : 정규성검정 여부 결정10 이하 : 윌콕슨순위합검정 위 내용을 디시전트리로 정리하면 아래와 같습니다. 한가지 더 고려해야할 내용은 양측, 단측검정입니다. 알려진 두 집단의 평균이 같은지 다른지 여부를 알고 .. 2020. 7. 9.
[R 강의] 99. 일표본 윌콕슨 검정 (일표본 t검정의 비모수) 도구 R로 푸는 통계99. 일표본 윌콕슨 검정 (일표본 t검정의 비모수) 1. 설명 일표본 윌콕슨 검정은 표본의 정규성이 확보되지 않은 경우 일표본 t검정 대신 사용합니다. (일표본 t검정은 모집단의 알려진 평균과 표본의 평균을 비교하는 검정입니다.) 아래 두번째 경우에서 정규성 검정에 기각된 경우와, 세번째 경우에서 일표본 윌콕슨 검정을 하게됩니다. 30 이상 : 일표본 t 검정10-30 : 정규성검정 기각 시 일표본 윌콕슨 검정10 이하 : 일표본 윌콕슨 검정 위 내용을 디시전트리로 정리하면 아래와 같습니다. 한가지 더 고려해야할 내용은 양측, 단측검정입니다. 알려진 모집단의 평균과 같은지 다른지 여부를 알고 싶으면 '양측검정'을 선택하면 됩니다. wilcox.test(A,mu=m) 어느 한쪽이 더 .. 2020. 6. 29.
[R 강의] 98. 정규성검정 (LF test, SW test) 도구 R로 푸는 통계98. 정규성검정 (LF test, SW test) 정규성검정은 자료가 정규분포를 따르는지 여부를 검정해줍니다. 보통 아래 기준을 따릅니다. 이 기준은 rule of thumb(경험법칙) 입니다. 경험적으로 이렇게 쓰게 된 것입니다. p값의 유의수준을 0.05로 놓는 것처럼 말이죠. 표본크기 30이상 : 정규성검정 없이 표본 평균이 정규분포를 따른다고 가정(중심극한정리)표본크기 10~30 : 정규성 검정 후 결정표본크기 10 이하 : 정규분포 가정 불가 (표본크기 기준을 15와 40으로 두는 경우도 있습니다.) 다양한 방법이 있는데요. 대표적인 검정들은 아래와 같습니다. Anderson–Darling test (AD test)Cramér–von Mises criterion (CVM t.. 2020. 6. 27.
[R 강의] 97. 대응표본 t검정 도구 R로 푸는 통계97. 대응표본 t검정 (+등분산 검정) 1.대응표본 t검정 설명 2표본 t검정은 두 집단의 평균을 비교할 때 사용하는 검정입니다. t검정은 크게 둘로 나뉩니다. 1) 독립표본 t검정 : 서로 독립인 두 집단을 비교 (ex. 남녀 키)2) 대응표본 t검정 : 어떤 처리 전 후를 비교 (ex. 약 처방 전후 모발 개수) 이번영상에서는 대응표본검정을 해보겠습니다. t검정에서는 중심극한정리를 사용하여 정규분포를 가정하기 때문에 표본의 수가 30개 이상이어야 합니다. 표본의 수가 30개 미만인 경우에는 정규성검정을 통해 정규성을 입증하여야 합니다. 만약 정규성검정이 기각될 경우 비모수적 방법인 윌콕슨순위합검정을 사용해야 합니다. 또 샘플 사이즈가 너무 작을경우 정규성검정을 할 수 없습니다. .. 2020. 6. 22.
[R 강의] 96. 독립표본 t검정 (+등분산 검정) 도구 R로 푸는 통계96. 독립표본 t검정 (+등분산 검정) 1. 2표본 t검정 설명 2표본 t검정은 두 집단의 평균을 비교할 때 사용하는 검정입니다. t검정은 크게 둘로 나뉩니다. 1) 독립표본 t검정 : 서로 독립인 두 집단을 비교 (ex. 남녀 키)2) 대응표본 t검정 : 어떤 처리 전 후를 비교 (ex. 약 처방 전후 모발 개수) 이번영상에서는 독립표본 t검정을 해보겠습니다. 독립표본 t검정은 두 집단의 등분산 여부에 따라 둘로 나뉩니다. 따라서 등분산검정을 먼저 해야합니다. 보통 levene's test 를 사용 합니다. levene's test 기각 -> 이분산 가정 t 검정levene's test 기각 안됨 -> 등분산 가정 t 검정 t검정에서는 중심극한정리를 사용하여 정규분포를 가정하기 때.. 2020. 6. 16.
[R 강의] 95. 일표본 t검정 도구 R로 푸는 통계95. 일표본 t검정 1. 일표본 t검정 일표본 t검정은 모집단의 알려진 평균과 표본의 평균을 비교하는 검정입니다. 예를들면 어떤 회사의 A과자의 평균무게가 30g이라고 알려져 있는데, 왠지 더 적은 것 같아 표본을 뽑아 비교할 때 사용합니다. t검정은 중심극한정리에 의한 정규분포 가정을 기반으로 하기 때문에, 일반적으로 표본의 크기가 30 이상일 때 사용 할 수 있습니다. 표본의 크기에 따른 대처 방법은 아래와 같습니다. 30 이상 : t-test10-30 : 정규성검정 여부 결정10 이하 : 윌콕슨순위합검정 위 내용을 디시전트리로 정리하면 아래와 같습니다. 한가지 더 고려해야할 내용은 양측, 단측검정입니다. 알려진 모집단의 평균과 같은지 다른지 여부를 알고 싶으면 '양측검정'을 선.. 2020. 6. 16.
[R 강의] 94. 정규분포에 색칠하기 도구 R로 푸는 통계 94. 정규분포에 색칠하기 91강에서 배운 폴리곤 함수를 이용하여 정규분포 색칠을 하는 방법을 알아봅시다. 설명은 주석으로 대체합니다. ##정규분포 함수를 그리기 위한 데이터 생성 set.seed(2) x=seq(-4,4,0.001) y=dnorm(x) ##정규분포 함수 그리기 plot(x,y,type="l",ann=FALSE) title(main="normal distribution",xlab="x",ylab="f(x)", cex.lab=1.3,cex.main=1.5) ##색칠할 범위 설정하기 areaX=seq(1.96,4,0.01) areaY=dnorm(areaX) ##폴리곤 함수에 사용할 수 있도록 데이터 가공하기 xp=c(areaX,rev(areaX)) yp=c(rep(0,l.. 2020. 6. 6.
[R강의] 93. 맘에 드는 색을 RGB로 가져오기 도구 R로 푸는 통계 93. 맘에 드는 색을 RGB로 가져오기 웹서핑을 하다가 괜찮은 색(color)을 발견했다고 합시다. 이 색을 R에 가져와서 사용하는 방법을 설명드리겠습니다. 먼저 이 색의 RGB 정보를 알아야 합니다. 윈도우의 캡쳐도구를 이용하여 캡쳐한 뒤 그림판에 붙여넣습니다. 그림판의 '색 선택 도구'로 해당 색을 클릭해줍니다. '색 편집' 버튼을 클릭하면 RGB 정보를 알 수 있습니다. 그래프를 하나 그리고 색을 위에서 찾은 RGB로 설정합시다. rgb 함수를 이용합니다. 최대값 디폴트가 1이기 때문에 255로 바꿔줍니다. plot(1,1,cex=5,pch=19, col=rgb(98,158,156,maxColorValue=255)) 영상이 더 편하신 분 2020. 5. 29.
[R강의] 92. 정규분포 함수 그려보기 도구 R로 푸는 통계 92. 정규분포 함수 그려보기 정규분포 함수를 그려보겠습니다. 설명은 주석으로 대신합니다. #평균과 표준편차를 설정합니다. 이 값을 바꾸면 그래프도 자동으로 바뀌도록 할 것입니다. m=3 std=1 #x값을 생성합니다. 평균으로 부터 표준편차의 5배 만큼의 범위 사이의 값을 갖고, 0.01 단위인 x값을 생성합니다. x=seq((m-5*std),(m+5*std),0.01) #dnorm 함수를 이용하여 위에서 생성한 x값에 대한 확률밀도값을 생성합니다. y=dnorm(x,mean=m,sd=std) #그래프를 그립시다. x범위를 설정합니다. #type 은 "l" 로 놓습니다. 점을 연결한 선입니다. #ann 은 FALSE로 놓아 축 이름을 제거합니다. plot(x,y,xlim=c((m-.. 2020. 5. 28.
[R강의] 91. 그래프 색칠에 사용하는 polygon 함수 도구 R로 푸는 통계 91. 그래프 색칠에 사용하는 polygon 함수 Polygon함수는 점을 언결하여 다각형을 만들어주는 함수입니다. 다각형 내부 색과 다각형 테두리 색을 설정할 수 있습니다. 저는 함수의 영역을 표시할 때 주로 사용합니다. 예를들면 기각역을 표시할 때 사용합니다. 이번 강의에서는 polygon 함수의 사용 방법을 알아보고 다음 강의에서는 정규분포에 색칠해보겠습니다. 아래와 같이 세 점이 있다고 합시다. (1 2) (6 2) (3 7) 세 점을 연결해 다각형을 만들 것입니다. 연결 순서를 정해봅시다. 아래 순서로 연결하겠습니다. (6 2) (1 2) (3 7) 폴리곤 함수는 아래와 같이 입력합니다. polygon(c(6,1,3),c(2,2,7)) 먼저 x를 연결 순서대로 벡터형태로 입.. 2020. 5. 27.
[R 강의] 90. 결측치를 일괄 변경하는 함수 만들기 도구 R로 푸는 통계 90. 결측치를 일괄 변경하는 함수 만들기 R에서 결측치를 일괄변형해봅시다. 먼저 89강에서 만든 결측치의 위치를 알아내는 함수를 가져옵시다. findNA=function(D) { nrow=dim(D)[1] ncol=dim(D)[2] for (i in 1:nrow) { for (j in 1:ncol) { if (is.na(D[i,j])) { print(paste(i,',',j)) } } } } 이 함수를 아래와 같이 수정하면됩니다. S에 NA를 괄적으로 바꿀 값을 입력합니다. ChangeNA=function(D,S) { nrow=dim(D)[1] ncol=dim(D)[2] for (i in 1:nrow) { for (j in 1:ncol) { if (is.na(D[i,j])) { D.. 2020. 5. 25.
[R 강의] 89. 데이터프레임에서 결측치(NA)의 위치를 알아내기 도구 R로 푸는 통계 89. 데이터프레임에서 결측치(NA)의 위치를 알아내기 결측치가 있는 데이터프레임에서, 결측치 NA의 위치를 "행,열"형태로 출력해봅시다. 예를들어 3행 2열에 결측치가 있다면 "3,2"가 출력되는 것입니다. 설명은 주석으로 대신합니다. #먼저 결측치가 들어있는 벡터를 2개 정의합시다. V1=c(1,2,3,NA,5) V2=c(1,2,NA,NA,3) #벡터 2개를 이용하여 데이터프레임을 만들겠습니다. df=data.frame(V1,V2) #dim 함수를 이용하여 데이터프레임의 행과 열의 수를 알아냅니다. dim(df)[1] 은 행의 수 입니다. dim(df)[2]는 열의 수 입니다. nrow=dim(df)[1] ncol=dim(df)[2] #For문을 이중으로 사용할 것입니다. i가 .. 2020. 5. 22.
[R 강의] 88. 히스토그램 여러 개 겹쳐서 그리는 방법 도구 R로 푸는 통계 88. 히스토그램 여러 개 겹쳐서 그리는 방법 히스토그램 2개를 겹쳐서 그려보겠습니다. 3개 이상에도 동일한 방법이 적용됩니다. 설명은 주석으로 대체합니다. #데이터 생성하기. 정규분포에서 임의추출하여 데이터 생성. M_H=rnorm(500,170,5) F_H=rnorm(500,160,5) #x 축 범위 설정 x_range=seq(130,200,by=2) #히스토그램 만들어서 저장, plot=FALSE로 설정하여 그려지지 않게함 M_H_hist=hist(M_H, breaks=x_range, plot = FALSE) F_H_height_hist=hist(F_H, breaks=x_range, plot = FALSE) #y축 범위 설정을 위해 y축 최댓값을 찾아줌 y_max=max(max.. 2020. 5. 19.
[R 강의] 87. 마진(margin)과 테두리 선 넣기 도구 R로 푸는 통계 87. 마진(margin)과 테두리 선 넣기 마진은 '여백'을 의미합니다. R에는 두가지 마진이 있습니다 inner margin과 outer margin입니다. 주석을 통해 설명드리겠습니다. #mar은 inner margin 의 아래,왼쪽,위,오른쪽 간격을 설정합니다. #oma는 outer margin의 아래,왼쪽,위,오른쪽 간격을 설정합니다. #mar default c(5.1, 4.1, 4.1, 2.1) #oma default c(0,0,0,0) par(mar=c(6,6,6,6), oma=c(4,4,4,4)) #아무 그래프나 그렸습니다 plot(1,type="n",xlim=c(0,5),ylim=c(0,5)) #mtest는 margin에 text를 표시합니다. #outer=FALSE.. 2020. 5. 18.
반응형