본문 바로가기
반응형

R 주제221

[R 강의] 98. 정규성검정 (LF test, SW test) 도구 R로 푸는 통계98. 정규성검정 (LF test, SW test) 정규성검정은 자료가 정규분포를 따르는지 여부를 검정해줍니다. 보통 아래 기준을 따릅니다. 이 기준은 rule of thumb(경험법칙) 입니다. 경험적으로 이렇게 쓰게 된 것입니다. p값의 유의수준을 0.05로 놓는 것처럼 말이죠. 표본크기 30이상 : 정규성검정 없이 표본 평균이 정규분포를 따른다고 가정(중심극한정리)표본크기 10~30 : 정규성 검정 후 결정표본크기 10 이하 : 정규분포 가정 불가 (표본크기 기준을 15와 40으로 두는 경우도 있습니다.) 다양한 방법이 있는데요. 대표적인 검정들은 아래와 같습니다. Anderson–Darling test (AD test)Cramér–von Mises criterion (CVM t.. 2020. 6. 27.
[R 강의] 97. 대응표본 t검정 도구 R로 푸는 통계97. 대응표본 t검정 (+등분산 검정) 1.대응표본 t검정 설명 2표본 t검정은 두 집단의 평균을 비교할 때 사용하는 검정입니다. t검정은 크게 둘로 나뉩니다. 1) 독립표본 t검정 : 서로 독립인 두 집단을 비교 (ex. 남녀 키)2) 대응표본 t검정 : 어떤 처리 전 후를 비교 (ex. 약 처방 전후 모발 개수) 이번영상에서는 대응표본검정을 해보겠습니다. t검정에서는 중심극한정리를 사용하여 정규분포를 가정하기 때문에 표본의 수가 30개 이상이어야 합니다. 표본의 수가 30개 미만인 경우에는 정규성검정을 통해 정규성을 입증하여야 합니다. 만약 정규성검정이 기각될 경우 비모수적 방법인 윌콕슨순위합검정을 사용해야 합니다. 또 샘플 사이즈가 너무 작을경우 정규성검정을 할 수 없습니다. .. 2020. 6. 22.
[R 강의] 96. 독립표본 t검정 (+등분산 검정) 도구 R로 푸는 통계96. 독립표본 t검정 (+등분산 검정) 1. 2표본 t검정 설명 2표본 t검정은 두 집단의 평균을 비교할 때 사용하는 검정입니다. t검정은 크게 둘로 나뉩니다. 1) 독립표본 t검정 : 서로 독립인 두 집단을 비교 (ex. 남녀 키)2) 대응표본 t검정 : 어떤 처리 전 후를 비교 (ex. 약 처방 전후 모발 개수) 이번영상에서는 독립표본 t검정을 해보겠습니다. 독립표본 t검정은 두 집단의 등분산 여부에 따라 둘로 나뉩니다. 따라서 등분산검정을 먼저 해야합니다. 보통 levene's test 를 사용 합니다. levene's test 기각 -> 이분산 가정 t 검정levene's test 기각 안됨 -> 등분산 가정 t 검정 t검정에서는 중심극한정리를 사용하여 정규분포를 가정하기 때.. 2020. 6. 16.
[R 강의] 95. 일표본 t검정 도구 R로 푸는 통계95. 일표본 t검정 1. 일표본 t검정 일표본 t검정은 모집단의 알려진 평균과 표본의 평균을 비교하는 검정입니다. 예를들면 어떤 회사의 A과자의 평균무게가 30g이라고 알려져 있는데, 왠지 더 적은 것 같아 표본을 뽑아 비교할 때 사용합니다. t검정은 중심극한정리에 의한 정규분포 가정을 기반으로 하기 때문에, 일반적으로 표본의 크기가 30 이상일 때 사용 할 수 있습니다. 표본의 크기에 따른 대처 방법은 아래와 같습니다. 30 이상 : t-test10-30 : 정규성검정 여부 결정10 이하 : 윌콕슨순위합검정 위 내용을 디시전트리로 정리하면 아래와 같습니다. 한가지 더 고려해야할 내용은 양측, 단측검정입니다. 알려진 모집단의 평균과 같은지 다른지 여부를 알고 싶으면 '양측검정'을 선.. 2020. 6. 16.
[R 강의] 94. 정규분포에 색칠하기 도구 R로 푸는 통계 94. 정규분포에 색칠하기 91강에서 배운 폴리곤 함수를 이용하여 정규분포 색칠을 하는 방법을 알아봅시다. 설명은 주석으로 대체합니다. ##정규분포 함수를 그리기 위한 데이터 생성 set.seed(2) x=seq(-4,4,0.001) y=dnorm(x) ##정규분포 함수 그리기 plot(x,y,type="l",ann=FALSE) title(main="normal distribution",xlab="x",ylab="f(x)", cex.lab=1.3,cex.main=1.5) ##색칠할 범위 설정하기 areaX=seq(1.96,4,0.01) areaY=dnorm(areaX) ##폴리곤 함수에 사용할 수 있도록 데이터 가공하기 xp=c(areaX,rev(areaX)) yp=c(rep(0,l.. 2020. 6. 6.
[R강의] 93. 맘에 드는 색을 RGB로 가져오기 도구 R로 푸는 통계 93. 맘에 드는 색을 RGB로 가져오기 웹서핑을 하다가 괜찮은 색(color)을 발견했다고 합시다. 이 색을 R에 가져와서 사용하는 방법을 설명드리겠습니다. 먼저 이 색의 RGB 정보를 알아야 합니다. 윈도우의 캡쳐도구를 이용하여 캡쳐한 뒤 그림판에 붙여넣습니다. 그림판의 '색 선택 도구'로 해당 색을 클릭해줍니다. '색 편집' 버튼을 클릭하면 RGB 정보를 알 수 있습니다. 그래프를 하나 그리고 색을 위에서 찾은 RGB로 설정합시다. rgb 함수를 이용합니다. 최대값 디폴트가 1이기 때문에 255로 바꿔줍니다. plot(1,1,cex=5,pch=19, col=rgb(98,158,156,maxColorValue=255)) 영상이 더 편하신 분 2020. 5. 29.
[R강의] 92. 정규분포 함수 그려보기 도구 R로 푸는 통계 92. 정규분포 함수 그려보기 정규분포 함수를 그려보겠습니다. 설명은 주석으로 대신합니다. #평균과 표준편차를 설정합니다. 이 값을 바꾸면 그래프도 자동으로 바뀌도록 할 것입니다. m=3 std=1 #x값을 생성합니다. 평균으로 부터 표준편차의 5배 만큼의 범위 사이의 값을 갖고, 0.01 단위인 x값을 생성합니다. x=seq((m-5*std),(m+5*std),0.01) #dnorm 함수를 이용하여 위에서 생성한 x값에 대한 확률밀도값을 생성합니다. y=dnorm(x,mean=m,sd=std) #그래프를 그립시다. x범위를 설정합니다. #type 은 "l" 로 놓습니다. 점을 연결한 선입니다. #ann 은 FALSE로 놓아 축 이름을 제거합니다. plot(x,y,xlim=c((m-.. 2020. 5. 28.
[R강의] 91. 그래프 색칠에 사용하는 polygon 함수 도구 R로 푸는 통계 91. 그래프 색칠에 사용하는 polygon 함수 Polygon함수는 점을 언결하여 다각형을 만들어주는 함수입니다. 다각형 내부 색과 다각형 테두리 색을 설정할 수 있습니다. 저는 함수의 영역을 표시할 때 주로 사용합니다. 예를들면 기각역을 표시할 때 사용합니다. 이번 강의에서는 polygon 함수의 사용 방법을 알아보고 다음 강의에서는 정규분포에 색칠해보겠습니다. 아래와 같이 세 점이 있다고 합시다. (1 2) (6 2) (3 7) 세 점을 연결해 다각형을 만들 것입니다. 연결 순서를 정해봅시다. 아래 순서로 연결하겠습니다. (6 2) (1 2) (3 7) 폴리곤 함수는 아래와 같이 입력합니다. polygon(c(6,1,3),c(2,2,7)) 먼저 x를 연결 순서대로 벡터형태로 입.. 2020. 5. 27.
[R 강의] 90. 결측치를 일괄 변경하는 함수 만들기 도구 R로 푸는 통계 90. 결측치를 일괄 변경하는 함수 만들기 R에서 결측치를 일괄변형해봅시다. 먼저 89강에서 만든 결측치의 위치를 알아내는 함수를 가져옵시다. findNA=function(D) { nrow=dim(D)[1] ncol=dim(D)[2] for (i in 1:nrow) { for (j in 1:ncol) { if (is.na(D[i,j])) { print(paste(i,',',j)) } } } } 이 함수를 아래와 같이 수정하면됩니다. S에 NA를 괄적으로 바꿀 값을 입력합니다. ChangeNA=function(D,S) { nrow=dim(D)[1] ncol=dim(D)[2] for (i in 1:nrow) { for (j in 1:ncol) { if (is.na(D[i,j])) { D.. 2020. 5. 25.
[R 강의] 89. 데이터프레임에서 결측치(NA)의 위치를 알아내기 도구 R로 푸는 통계 89. 데이터프레임에서 결측치(NA)의 위치를 알아내기 결측치가 있는 데이터프레임에서, 결측치 NA의 위치를 "행,열"형태로 출력해봅시다. 예를들어 3행 2열에 결측치가 있다면 "3,2"가 출력되는 것입니다. 설명은 주석으로 대신합니다. #먼저 결측치가 들어있는 벡터를 2개 정의합시다. V1=c(1,2,3,NA,5) V2=c(1,2,NA,NA,3) #벡터 2개를 이용하여 데이터프레임을 만들겠습니다. df=data.frame(V1,V2) #dim 함수를 이용하여 데이터프레임의 행과 열의 수를 알아냅니다. dim(df)[1] 은 행의 수 입니다. dim(df)[2]는 열의 수 입니다. nrow=dim(df)[1] ncol=dim(df)[2] #For문을 이중으로 사용할 것입니다. i가 .. 2020. 5. 22.
[R 강의] 88. 히스토그램 여러 개 겹쳐서 그리는 방법 도구 R로 푸는 통계 88. 히스토그램 여러 개 겹쳐서 그리는 방법 히스토그램 2개를 겹쳐서 그려보겠습니다. 3개 이상에도 동일한 방법이 적용됩니다. 설명은 주석으로 대체합니다. #데이터 생성하기. 정규분포에서 임의추출하여 데이터 생성. M_H=rnorm(500,170,5) F_H=rnorm(500,160,5) #x 축 범위 설정 x_range=seq(130,200,by=2) #히스토그램 만들어서 저장, plot=FALSE로 설정하여 그려지지 않게함 M_H_hist=hist(M_H, breaks=x_range, plot = FALSE) F_H_height_hist=hist(F_H, breaks=x_range, plot = FALSE) #y축 범위 설정을 위해 y축 최댓값을 찾아줌 y_max=max(max.. 2020. 5. 19.
[R 강의] 87. 마진(margin)과 테두리 선 넣기 도구 R로 푸는 통계 87. 마진(margin)과 테두리 선 넣기 마진은 '여백'을 의미합니다. R에는 두가지 마진이 있습니다 inner margin과 outer margin입니다. 주석을 통해 설명드리겠습니다. #mar은 inner margin 의 아래,왼쪽,위,오른쪽 간격을 설정합니다. #oma는 outer margin의 아래,왼쪽,위,오른쪽 간격을 설정합니다. #mar default c(5.1, 4.1, 4.1, 2.1) #oma default c(0,0,0,0) par(mar=c(6,6,6,6), oma=c(4,4,4,4)) #아무 그래프나 그렸습니다 plot(1,type="n",xlim=c(0,5),ylim=c(0,5)) #mtest는 margin에 text를 표시합니다. #outer=FALSE.. 2020. 5. 18.
[R 강의] 86. 결측치(NA) 확인, 제거, 수정하는 방법 도구 R로 푸는 통계 86. 결측치(NA) 확인, 제거, 수정하는 방법 오늘 사용할 데이터입니다. C1=c(1,2,NA,NA,5) C2=(1,2,3,4,5) C3=(NA,2,3,4,5) md=data.frame(C1,C2,C3) > md C1 C2 C3 1 1 1 NA 2 2 2 2 3 NA 3 3 4 NA 4 4 5 5 5 5 1) 결측치 확인 결측치를 확인할 때는 is.na( ) 함수를 사용합니다. 위 데이터프레임에 적용해봅시다. C1=c(1,2,NA,NA,5) C2=(1,2,3,4,5) C3=(NA,2,3,4,5) md=data.frame(C1,C2,C3) > is.na(md) C1 C2 C3 [1,] FALSE FALSE TRUE [2,] FALSE FALSE FALSE [3,] TRUE FALS.. 2020. 5. 15.
[R 강의] 85. R에서 정의된 벡터는 열벡터일까 행벡터일까 도구 R로 푸는 통계 85. R에서 정의된 벡터는 열벡터일까 행벡터일까 R에서 정의된 벡터는 행벡터일까요 열벡터일까요. 벡터를 하나 정의해봅시다. v=c(1,2,3) > v [1] 1 2 3 열벡터인지 행벡터인지 알고 싶어 dim함수를 적용해보면 NULL값이 반환됩니다. > dim(v) NULL 반면에 matrix함수를 이용하여 열벡터 혹은 행벡터를 정의하면 dim 함수 적용이 가능합니다. > m1=matrix(c(1,2,3),nrow=1) > dim(m1) [1] 1 3 1행3열짜리 행렬이라는 의미입니다. 벡터가 행렬에 포함되는 개념이고, 이 둘은 다시 배열에 포함됩니다. 1차원 배열이 벡터이고, 2차원배열이 행렬입니다. 개념상으로는 그렇긴 한데, marix함수로 만든 벡터와, c() 로 만든 벡터는 .. 2020. 4. 4.
[R 강의] 84. 행렬의 곱셈 도구 R로 푸는 통계 84. 행렬의 곱셈 2행2열짜리 행렬을 두개 정의합시다. m1=matrix(c(1,2,3,4),nrow=2) m2=matrix(c(1,2,3,4),nrow=2) > m1 [,1] [,2] [1,] 1 3 [2,] 2 4 > m2 [,1] [,2] [1,] 1 3 [2,] 2 4 먼저 곱셈 기호를 사용해서 곱해봅시다. > m1*m2 [,1] [,2] [1,] 1 9 [2,] 4 16 행렬곱의 결과가 아닙니다. 같은 위치에 있는 값끼리 곱해준 결과입니다. 행렬곱은 아래와 같은 연산자를 사용합니다. %*% 이 연산자를 이용하여 곱셈을 해봅시다. > m1%*%m2 [,1] [,2] [1,] 7 15 [2,] 10 22 이번에는 크기가 다른 두 행렬을 정의합시다. m1=matrix(c(1,2.. 2020. 4. 4.
[R 강의] 83. 행렬 또는 데이터프레임의 행과 열을 바꾸는 방법 t() 도구 R로 푸는 통계 83. 행렬 또는 데이터프레임의 행과 열을 바꾸는 방법 t() t()함수를 이용하면 행렬이나 데이터프레임의 행과 열을 바꿀 수 있습니다. 행과열을 바꾼다는 것을 예를들면 2행1열에 있던 값과 1행2열에 있는 값의 자리를 바꾸는 것입니다. 이렇게 모든 쌍의 자리를 서로 바꿔줍니다. 선형대수학에서는 '전치행렬(transposed matrix)'이라고 합니다. 1. 행렬에 t() 적용하기 행렬을 정의하고 행과 열을 바꿔봅시다. 아래와 같이 2행2열로 된 행렬을 정의했습니다. > M1=matrix(c(1,2,3,4,5,6),nrow=2) > M1 [,1] [,2] [,3] [1,] 1 3 5 [2,] 2 4 6 정의한 행렬에 t() 함수를 적용해봅시다. > t(M1) [,1] [,2] [1.. 2020. 4. 2.
[R 강의] 82.R스튜디오 레이아웃 바꾸는 방법 도구 R로 푸는 통계 82.R스튜디오 레이아웃 바꾸는 방법 R 스튜디오의 기본 레이아웃은 아래와 같습니다. 레이아웃을 바꾸는 방법을 알아봅시다. 왼쪽에 source가 나오고, 오른쪽에 console을 놓으려고 합니다. plot창은 좌측 하단에 놓고 싶습니다. 메뉴바에서 Tools-Global Options를 클릭합니다. Pane Layout을 클릭합니다. 네개의 선택창은, 사분할된 화면을 의미합니다. 클릭해서 다른 화면으로 바꿀 수 있습니다. 저는 아래와 같이 변경하였습니다. 적용 결과는 아래와 같습니다. 영상이 더 편하신 분 2020. 4. 2.
[R 강의] 81. 알고보니 R Gui에도 있던 스트립트 run 기능 도구 R로 푸는 통계 81. 알고보니 R Gui에도 있던 스트립트 run 기능 R Gui에도 스크립트를 콘솔창에서 실행하는 기능이 있습니다. R studio에만 있는 줄 알았는데 아니더군요. 1. 아래처럼 R Gui를 열고 파일 → 새 스크립트를 클릭합니다. 2. 아래 처럼 코드를 적습니다. 3. 실행하기 원하는 줄에 커서를 놓고 우클릭을 합니다. 줄 또는 선택영역 실행을 클릭합니다. 4. 아래와 같이 실행됩니다. 5. 이번에는 전체 코드를 선택하고, 실행해봅시다. 6. 아래와 같이 코드가 실행됩니다. 영상이 더 편하신 분 2020. 4. 2.
[R 강의] 80. R 스튜디오 간단한 사용법 도구 R로 푸는 통계 80. R 스튜디오 간단한 사용법 RGui을 사용하다가 R스튜디오로 넘어왔습니다. RGui은 아래와 같이 명령어를 입력하면 즉시 실행하는 console 창을 말합니다. 그래프를 그리면 아래처럼 R Graphics 창이 뜹니다. RGui 로 긴 코드를 짤 때는 메모장이나 노트패드를 이용하여 코드를 짜고 복사, 붙여넣기 형태로 코드를 작동시킵니다. R Studio는 이 모든기능을 하나의 화면에 넣어놓은 프로그램입니다. 물론 더 많은 편리한 기능들이 있습니다. R 스튜디오를 열먼 아래와 같은 화면이 뜹니다. 먼저 글자 크기를 키워봅시다. Tools → Global Options 를 들어갑니다. Appearance → Zoom(150%) 를 선택합니다. 아래처럼 확대됩니다. 왼쪽 화면은 R.. 2020. 4. 2.
[R 강의] 79. R 스튜디오 설치 도구 R로 푸는 통계 79. R 스튜디오 설치 1. 아래 링크로 들어갑니다. https://www.rstudio.com/products/rstudio/download/#download 2. RStudio Desktop 의 Free version 에서 Download를 클릭합니다. 3. 자신의 운영체제에 맞는 설치파일을 다운받고 설치합니다. 영상이 더 편하신 분 2020. 4. 1.
[R 강의] 78. match.arg 함수 도구 R로 푸는 통계 78. match.arg 함수 match.arg 함수는 첫번째 문자형 벡터의 인수(argument)가 두번째 벡터의 인수에 있을 때, 그 값을 반환해줍니다. 문자형벡터만 가능합니다. 아래와 같은 기본형을 갖습니다. match.arg(arg, choices, several.ok = FALSE) > match.arg('a',c('a','b','c')) [1] "a" 앞글자가 같아도 반환해줍니다. > match.arg('a',c('apple','banana','chicken')) [1] "apple" > match.arg('ap',c('apple','banana','chicken')) [1] "apple" > match.arg('app',c('apple','banana','chicken'.. 2020. 4. 1.
[R 강의] 77. match 함수 도구 R로 푸는 통계 77. match 함수 match 함수는 첫번째 벡터의 인수(argument)가 두번째 벡터의 인수의 몇번째에 있는지를 알려줍니다. 없는 경우는 NA를 반환합니다. > a=c(1,2,3,4,5) > b=c(2,5,7,8,9) > match(a,b) [1] NA 1 NA NA 2 1은 b에 없기 때문에 NA가 반환되고, 2는 b의 첫번째 원소이므로 1이 반환되는 것입니다. 반환되는 NA 값을 바꿀 수도 있습니다 . > match(a,b,nomatch=0) [1] 0 1 0 0 2 문자로는 반환할 수 없습니다. > match(a,b,nomatch="a") [1] NA 1 NA NA 2 경고메시지(들): In match(a, b, nomatch = "a") : 강제형변환에 의해 생성 영상.. 2020. 4. 1.
[R 강의] 76. table 함수는 분할표를 만든다 도구 R로 푸는 통계 76. table 함수는 분할표를 만든다 table 함수는 '분할표'를 출력해주는 함수입니다. 예시를 통해 분할표가 무엇인지 이해해봅시다. 5명의 남성과 4명의 여성을 대상으로 종교를 조사했습니다. 남자를 M, 여자를 F라는 약어로 표기하였습니다. 기독교는 Ch, 이슬람은 I, 카톨릭은 Ca, 불교는 B, 무교는 N으로 표기하였습니다. 번호 성별 종교 1 M Ch 2 F I 3 M N 4 M B 5 F N 6 M Ch 7 F Ca 8 M B 9 F N 위 데이터를 벡터에 저장합시다. > gender=c('M','F','M','M','F','M','F','M','F') > religion=c('Ch','I','N','B','N','Ch','Ca','B','N') 결과를 출력하면 아래와.. 2020. 4. 1.
[R 강의] 75. R에서 제공하는 모든 색상 살펴보기(colors) 도구 R로 푸는 통계 75. R에서 제공하는 모든 색상 살펴보기(colors) R에서는 기본적으로 설정되어 있는 색상들이 있습니다. colors라는 함수를 이용해서 색상들을 불러올 수 있습니다. 먼저 R 콘솔창에 colors() 라고 입력해봅시다 . 657개의 색상이 불러와집니다. 먼저 1~50번의 색을 파이그래프로 그려봅시다. (파이그래프 그리는 법 : 링크) slices=rep(1,times=50) Rcolor={} for (i in 1:50){ Rcolor[i]=colors()[i] } pie(slices,col=Rcolor) 이번에는 화면을 분할하고 전체 색상을 여러개의 파이그래프를 이용하여 출력해봅시다. for 문을 이중으로 적용하여 짧은 코드로 22개의 파이그래프가 출력되도록 하였습니다. #그.. 2020. 4. 1.
[R 강의] 74. R코드 주석 처리 방법 도구 R로 푸는 통계 74. R코드 주석 처리 방법 R편집기나, 노트패드등을 이용해서 R 코드를 길게 짜는 경우에는 코드의 설명을 붙여놓아야 나중에 어떤 코드인지 쉽게 알아볼 수가 있습니다. 이때 사용하는 것이 '주석'인데요. R 콘솔창에 붙여넣어도 실행은 되지 않는 코드를 '주석'이라고 합니다. R의 주석은 앞에 샾('#')을 붙여주시면 됩니다. 아래 코드의 초록색 글자들이 주석입니다. #그래프 주변 마진을 제거함 par(mar=c(0,0,0,0)) #화면을 5행7열로 분할 par(mfrow = c(5, 7)) #20개의 1을 원소로 갖는 벡터 생성 slices=rep(1,times=20) #이름이 Rcolor이고 비어있는 벡터 생성 Rcolor={} #값이 1인 변수 생성 j=1 #colors 함수의.. 2020. 3. 31.
[R 강의] 73. R 콘솔창 폰트 크기 영구적으로 바꾸기 도구 R로 푸는 통계 73. R 콘솔창 폰트 크기 영구적으로 바꾸기 R 커멘드창의 기본 폰트크기는 10입니다. 사람마다 원하는 폰트 크기가 다를텐데 R 커멘드창을 켤 때마다 [편집] - [GUI 설정] 에 들어가서 폰트를 바꿔주기가 여간 귀찮은게 아닙니다. 오늘은 R 커멘드창의 폰트 크기를 영구적을 바꾸는 방법이 있어서 알려드리겠습니다. 먼저 컴퓨터에 R이 설치된 경로로 들어갑니다. 제 경우는 아래 경로였습니다. C:\Program Files\R 찾으셨으면 아래 경로로 들어가줍니다. C:\Program Files\R\R-3.5.2\etc 이 경로에 들어가면 아래와 같은 파일과 폴더들이 있을 것입니다. Rconsole 이라는 파일을 메모장이나 노트패드로 열어줍니다. points 라고 되어있는 부분을 찾고 .. 2020. 3. 31.
[R 강의] 72. 여러 데이터의 산점도를 하나의 그래프에 그리기(points 함수) 도구 R로 푸는 통계 72. 여러 데이터의 산점도를 하나의 그래프에 그리기 (points 함수) 서로 다른 데이터를 하나의 그래프에 그려야하는 경우가 있습니다. 예를들어 A반 학생과 B반 학생의 수학,영어 점수 분포를 한눈에 비교하고 싶은 상황을 가정해봅시다. A반 학생 5명의 수학점수와 영어점수는 아래와 같습니다. A반(수학점수, 영어점수) 1. 93,82 2. 77,63 3. 59, 90 4. 75, 69 5. 100, 98 B반(수학점수, 영어점수) 1. 57,33 2. 98,75 3. 66, 68 4. 30, 26 5. 100, 100 먼저 '비어있는'그래프를 하나 그리겠습니다. plot함수의 데이터 자리에는 전체 구간을 입력해줍니다. 시험점수니까 0점부터 100점 사이 값을 가질 것입니다. 따라.. 2020. 3. 31.
[R 강의] 71. 산점도에서 점의 색 서로 다르게 설정하기 도구 R로 푸는 통계 71. 산점도에서 점의 색 서로 다르게 설정하기 먼저 산점도를 하나 그려봅시다. x=c(1,2,3,4,5,6) y=c(1,2,3,4,5,6) plot(x,y) 산점도의 색을 바꿔봅시다. col 옵션을 사용합니다. x=c(1,2,3,4,5,6) y=c(1,2,3,4,5,6) plot(x,y,col='red') 산점도에 색을 바꾸긴 했는데, 점마다 다른 색을 입력하고 싶은 상황입니다. 첫 두점은 빨간색, 나머지 네 점은 파란색으로 입력하려고 합니다. 이때는 col 옵션에 원소가 색으로 이루어진 벡터를 입력해주면 됩니다. x=c(1,2,3,4,5,6) y=c(1,2,3,4,5,6) plot(x,y,col=c('red','red','blue','blue','blue','blue')) 만약 .. 2020. 3. 31.
[R 강의] 70. 파이그래프에 범례(legend) 추가하기 도구 R로 푸는 통계 70. 파이그래프에 범례(legend) 추가하기 68강에서 그렸던 파이그래프를 변형했습니다. 회사 이름을 빼고 퍼센트만 남겼습니다. 회사 이름은 오늘 배울 범례(legend)를 이용해서 나타내겠습니다. data= c(21.6,22.3,16.4,15.7,9.9,14.2) labels=paste(data,'%') mycolor=c(colors()[1],colors()[13],colors()[53],colors()[45],colors()[23],colors()[18]) title=c("Global large-area display market share 2017.1") pie(data,labels,col=mycolor,main=title) 위 그래프에 범례를 추가해봅시다. 회사 이름으로 .. 2020. 3. 30.
[R 강의] 69. 문자열을 연결하는 paste 함수 paste 함수는 우리가 정의한 벡터의 원소에 무언가를 붙이거나 벡터의 원소를 하나로 합쳐주는 기능을 합니다. 설명만 들어서는 감이 안올 수 있으니 간단한 예제부터 시작해봅시다. > a=c(1,2,3,4,5) > paste(a) [1] "1" "2" "3" "4" "5" 아무 조건 없이 paste 함수를 적용하면, 우리가 정의한 벡터가 문자열 벡터로 변경됩니다. as.character 과 동일한 기능을 합니다. 일단 벡터를 문자열로 바꿔야 합치던지 다른 문자를 붙이던지 할 수 있기 때문입니다. 이번에는 모든 원소에 hi 라는 단어를 추가해보겠습니다. > a=c(1,2,3,4,5) > paste(a,"hi") [1] "1 hi" "2 hi" "3 hi" "4 hi" "5 hi" 기능이 이해가 되시나요? 이.. 2020. 3. 30.
반응형