본문 바로가기
반응형

R 주제/R 기초 및 통계 강의176

[R 강의] 86. 결측치(NA) 확인, 제거, 수정하는 방법 도구 R로 푸는 통계 86. 결측치(NA) 확인, 제거, 수정하는 방법 오늘 사용할 데이터입니다. C1=c(1,2,NA,NA,5) C2=(1,2,3,4,5) C3=(NA,2,3,4,5) md=data.frame(C1,C2,C3) > md C1 C2 C3 1 1 1 NA 2 2 2 2 3 NA 3 3 4 NA 4 4 5 5 5 5 1) 결측치 확인 결측치를 확인할 때는 is.na( ) 함수를 사용합니다. 위 데이터프레임에 적용해봅시다. C1=c(1,2,NA,NA,5) C2=(1,2,3,4,5) C3=(NA,2,3,4,5) md=data.frame(C1,C2,C3) > is.na(md) C1 C2 C3 [1,] FALSE FALSE TRUE [2,] FALSE FALSE FALSE [3,] TRUE FALS.. 2020. 5. 15.
[R 강의] 85. R에서 정의된 벡터는 열벡터일까 행벡터일까 도구 R로 푸는 통계 85. R에서 정의된 벡터는 열벡터일까 행벡터일까 R에서 정의된 벡터는 행벡터일까요 열벡터일까요. 벡터를 하나 정의해봅시다. v=c(1,2,3) > v [1] 1 2 3 열벡터인지 행벡터인지 알고 싶어 dim함수를 적용해보면 NULL값이 반환됩니다. > dim(v) NULL 반면에 matrix함수를 이용하여 열벡터 혹은 행벡터를 정의하면 dim 함수 적용이 가능합니다. > m1=matrix(c(1,2,3),nrow=1) > dim(m1) [1] 1 3 1행3열짜리 행렬이라는 의미입니다. 벡터가 행렬에 포함되는 개념이고, 이 둘은 다시 배열에 포함됩니다. 1차원 배열이 벡터이고, 2차원배열이 행렬입니다. 개념상으로는 그렇긴 한데, marix함수로 만든 벡터와, c() 로 만든 벡터는 .. 2020. 4. 4.
[R 강의] 84. 행렬의 곱셈 도구 R로 푸는 통계 84. 행렬의 곱셈 2행2열짜리 행렬을 두개 정의합시다. m1=matrix(c(1,2,3,4),nrow=2) m2=matrix(c(1,2,3,4),nrow=2) > m1 [,1] [,2] [1,] 1 3 [2,] 2 4 > m2 [,1] [,2] [1,] 1 3 [2,] 2 4 먼저 곱셈 기호를 사용해서 곱해봅시다. > m1*m2 [,1] [,2] [1,] 1 9 [2,] 4 16 행렬곱의 결과가 아닙니다. 같은 위치에 있는 값끼리 곱해준 결과입니다. 행렬곱은 아래와 같은 연산자를 사용합니다. %*% 이 연산자를 이용하여 곱셈을 해봅시다. > m1%*%m2 [,1] [,2] [1,] 7 15 [2,] 10 22 이번에는 크기가 다른 두 행렬을 정의합시다. m1=matrix(c(1,2.. 2020. 4. 4.
[R 강의] 83. 행렬 또는 데이터프레임의 행과 열을 바꾸는 방법 t() 도구 R로 푸는 통계 83. 행렬 또는 데이터프레임의 행과 열을 바꾸는 방법 t() t()함수를 이용하면 행렬이나 데이터프레임의 행과 열을 바꿀 수 있습니다. 행과열을 바꾼다는 것을 예를들면 2행1열에 있던 값과 1행2열에 있는 값의 자리를 바꾸는 것입니다. 이렇게 모든 쌍의 자리를 서로 바꿔줍니다. 선형대수학에서는 '전치행렬(transposed matrix)'이라고 합니다. 1. 행렬에 t() 적용하기 행렬을 정의하고 행과 열을 바꿔봅시다. 아래와 같이 2행2열로 된 행렬을 정의했습니다. > M1=matrix(c(1,2,3,4,5,6),nrow=2) > M1 [,1] [,2] [,3] [1,] 1 3 5 [2,] 2 4 6 정의한 행렬에 t() 함수를 적용해봅시다. > t(M1) [,1] [,2] [1.. 2020. 4. 2.
[R 강의] 82.R스튜디오 레이아웃 바꾸는 방법 도구 R로 푸는 통계 82.R스튜디오 레이아웃 바꾸는 방법 R 스튜디오의 기본 레이아웃은 아래와 같습니다. 레이아웃을 바꾸는 방법을 알아봅시다. 왼쪽에 source가 나오고, 오른쪽에 console을 놓으려고 합니다. plot창은 좌측 하단에 놓고 싶습니다. 메뉴바에서 Tools-Global Options를 클릭합니다. Pane Layout을 클릭합니다. 네개의 선택창은, 사분할된 화면을 의미합니다. 클릭해서 다른 화면으로 바꿀 수 있습니다. 저는 아래와 같이 변경하였습니다. 적용 결과는 아래와 같습니다. 영상이 더 편하신 분 2020. 4. 2.
[R 강의] 81. 알고보니 R Gui에도 있던 스트립트 run 기능 도구 R로 푸는 통계 81. 알고보니 R Gui에도 있던 스트립트 run 기능 R Gui에도 스크립트를 콘솔창에서 실행하는 기능이 있습니다. R studio에만 있는 줄 알았는데 아니더군요. 1. 아래처럼 R Gui를 열고 파일 → 새 스크립트를 클릭합니다. 2. 아래 처럼 코드를 적습니다. 3. 실행하기 원하는 줄에 커서를 놓고 우클릭을 합니다. 줄 또는 선택영역 실행을 클릭합니다. 4. 아래와 같이 실행됩니다. 5. 이번에는 전체 코드를 선택하고, 실행해봅시다. 6. 아래와 같이 코드가 실행됩니다. 영상이 더 편하신 분 2020. 4. 2.
[R 강의] 80. R 스튜디오 간단한 사용법 도구 R로 푸는 통계 80. R 스튜디오 간단한 사용법 RGui을 사용하다가 R스튜디오로 넘어왔습니다. RGui은 아래와 같이 명령어를 입력하면 즉시 실행하는 console 창을 말합니다. 그래프를 그리면 아래처럼 R Graphics 창이 뜹니다. RGui 로 긴 코드를 짤 때는 메모장이나 노트패드를 이용하여 코드를 짜고 복사, 붙여넣기 형태로 코드를 작동시킵니다. R Studio는 이 모든기능을 하나의 화면에 넣어놓은 프로그램입니다. 물론 더 많은 편리한 기능들이 있습니다. R 스튜디오를 열먼 아래와 같은 화면이 뜹니다. 먼저 글자 크기를 키워봅시다. Tools → Global Options 를 들어갑니다. Appearance → Zoom(150%) 를 선택합니다. 아래처럼 확대됩니다. 왼쪽 화면은 R.. 2020. 4. 2.
[R 강의] 79. R 스튜디오 설치 도구 R로 푸는 통계 79. R 스튜디오 설치 1. 아래 링크로 들어갑니다. https://www.rstudio.com/products/rstudio/download/#download 2. RStudio Desktop 의 Free version 에서 Download를 클릭합니다. 3. 자신의 운영체제에 맞는 설치파일을 다운받고 설치합니다. 영상이 더 편하신 분 2020. 4. 1.
[R 강의] 78. match.arg 함수 도구 R로 푸는 통계 78. match.arg 함수 match.arg 함수는 첫번째 문자형 벡터의 인수(argument)가 두번째 벡터의 인수에 있을 때, 그 값을 반환해줍니다. 문자형벡터만 가능합니다. 아래와 같은 기본형을 갖습니다. match.arg(arg, choices, several.ok = FALSE) > match.arg('a',c('a','b','c')) [1] "a" 앞글자가 같아도 반환해줍니다. > match.arg('a',c('apple','banana','chicken')) [1] "apple" > match.arg('ap',c('apple','banana','chicken')) [1] "apple" > match.arg('app',c('apple','banana','chicken'.. 2020. 4. 1.
[R 강의] 77. match 함수 도구 R로 푸는 통계 77. match 함수 match 함수는 첫번째 벡터의 인수(argument)가 두번째 벡터의 인수의 몇번째에 있는지를 알려줍니다. 없는 경우는 NA를 반환합니다. > a=c(1,2,3,4,5) > b=c(2,5,7,8,9) > match(a,b) [1] NA 1 NA NA 2 1은 b에 없기 때문에 NA가 반환되고, 2는 b의 첫번째 원소이므로 1이 반환되는 것입니다. 반환되는 NA 값을 바꿀 수도 있습니다 . > match(a,b,nomatch=0) [1] 0 1 0 0 2 문자로는 반환할 수 없습니다. > match(a,b,nomatch="a") [1] NA 1 NA NA 2 경고메시지(들): In match(a, b, nomatch = "a") : 강제형변환에 의해 생성 영상.. 2020. 4. 1.
[R 강의] 76. table 함수는 분할표를 만든다 도구 R로 푸는 통계 76. table 함수는 분할표를 만든다 table 함수는 '분할표'를 출력해주는 함수입니다. 예시를 통해 분할표가 무엇인지 이해해봅시다. 5명의 남성과 4명의 여성을 대상으로 종교를 조사했습니다. 남자를 M, 여자를 F라는 약어로 표기하였습니다. 기독교는 Ch, 이슬람은 I, 카톨릭은 Ca, 불교는 B, 무교는 N으로 표기하였습니다. 번호 성별 종교 1 M Ch 2 F I 3 M N 4 M B 5 F N 6 M Ch 7 F Ca 8 M B 9 F N 위 데이터를 벡터에 저장합시다. > gender=c('M','F','M','M','F','M','F','M','F') > religion=c('Ch','I','N','B','N','Ch','Ca','B','N') 결과를 출력하면 아래와.. 2020. 4. 1.
[R 강의] 75. R에서 제공하는 모든 색상 살펴보기(colors) 도구 R로 푸는 통계 75. R에서 제공하는 모든 색상 살펴보기(colors) R에서는 기본적으로 설정되어 있는 색상들이 있습니다. colors라는 함수를 이용해서 색상들을 불러올 수 있습니다. 먼저 R 콘솔창에 colors() 라고 입력해봅시다 . 657개의 색상이 불러와집니다. 먼저 1~50번의 색을 파이그래프로 그려봅시다. (파이그래프 그리는 법 : 링크) slices=rep(1,times=50) Rcolor={} for (i in 1:50){ Rcolor[i]=colors()[i] } pie(slices,col=Rcolor) 이번에는 화면을 분할하고 전체 색상을 여러개의 파이그래프를 이용하여 출력해봅시다. for 문을 이중으로 적용하여 짧은 코드로 22개의 파이그래프가 출력되도록 하였습니다. #그.. 2020. 4. 1.
[R 강의] 74. R코드 주석 처리 방법 도구 R로 푸는 통계 74. R코드 주석 처리 방법 R편집기나, 노트패드등을 이용해서 R 코드를 길게 짜는 경우에는 코드의 설명을 붙여놓아야 나중에 어떤 코드인지 쉽게 알아볼 수가 있습니다. 이때 사용하는 것이 '주석'인데요. R 콘솔창에 붙여넣어도 실행은 되지 않는 코드를 '주석'이라고 합니다. R의 주석은 앞에 샾('#')을 붙여주시면 됩니다. 아래 코드의 초록색 글자들이 주석입니다. #그래프 주변 마진을 제거함 par(mar=c(0,0,0,0)) #화면을 5행7열로 분할 par(mfrow = c(5, 7)) #20개의 1을 원소로 갖는 벡터 생성 slices=rep(1,times=20) #이름이 Rcolor이고 비어있는 벡터 생성 Rcolor={} #값이 1인 변수 생성 j=1 #colors 함수의.. 2020. 3. 31.
[R 강의] 73. R 콘솔창 폰트 크기 영구적으로 바꾸기 도구 R로 푸는 통계 73. R 콘솔창 폰트 크기 영구적으로 바꾸기 R 커멘드창의 기본 폰트크기는 10입니다. 사람마다 원하는 폰트 크기가 다를텐데 R 커멘드창을 켤 때마다 [편집] - [GUI 설정] 에 들어가서 폰트를 바꿔주기가 여간 귀찮은게 아닙니다. 오늘은 R 커멘드창의 폰트 크기를 영구적을 바꾸는 방법이 있어서 알려드리겠습니다. 먼저 컴퓨터에 R이 설치된 경로로 들어갑니다. 제 경우는 아래 경로였습니다. C:\Program Files\R 찾으셨으면 아래 경로로 들어가줍니다. C:\Program Files\R\R-3.5.2\etc 이 경로에 들어가면 아래와 같은 파일과 폴더들이 있을 것입니다. Rconsole 이라는 파일을 메모장이나 노트패드로 열어줍니다. points 라고 되어있는 부분을 찾고 .. 2020. 3. 31.
[R 강의] 72. 여러 데이터의 산점도를 하나의 그래프에 그리기(points 함수) 도구 R로 푸는 통계 72. 여러 데이터의 산점도를 하나의 그래프에 그리기 (points 함수) 서로 다른 데이터를 하나의 그래프에 그려야하는 경우가 있습니다. 예를들어 A반 학생과 B반 학생의 수학,영어 점수 분포를 한눈에 비교하고 싶은 상황을 가정해봅시다. A반 학생 5명의 수학점수와 영어점수는 아래와 같습니다. A반(수학점수, 영어점수) 1. 93,82 2. 77,63 3. 59, 90 4. 75, 69 5. 100, 98 B반(수학점수, 영어점수) 1. 57,33 2. 98,75 3. 66, 68 4. 30, 26 5. 100, 100 먼저 '비어있는'그래프를 하나 그리겠습니다. plot함수의 데이터 자리에는 전체 구간을 입력해줍니다. 시험점수니까 0점부터 100점 사이 값을 가질 것입니다. 따라.. 2020. 3. 31.
[R 강의] 71. 산점도에서 점의 색 서로 다르게 설정하기 도구 R로 푸는 통계 71. 산점도에서 점의 색 서로 다르게 설정하기 먼저 산점도를 하나 그려봅시다. x=c(1,2,3,4,5,6) y=c(1,2,3,4,5,6) plot(x,y) 산점도의 색을 바꿔봅시다. col 옵션을 사용합니다. x=c(1,2,3,4,5,6) y=c(1,2,3,4,5,6) plot(x,y,col='red') 산점도에 색을 바꾸긴 했는데, 점마다 다른 색을 입력하고 싶은 상황입니다. 첫 두점은 빨간색, 나머지 네 점은 파란색으로 입력하려고 합니다. 이때는 col 옵션에 원소가 색으로 이루어진 벡터를 입력해주면 됩니다. x=c(1,2,3,4,5,6) y=c(1,2,3,4,5,6) plot(x,y,col=c('red','red','blue','blue','blue','blue')) 만약 .. 2020. 3. 31.
[R 강의] 70. 파이그래프에 범례(legend) 추가하기 도구 R로 푸는 통계 70. 파이그래프에 범례(legend) 추가하기 68강에서 그렸던 파이그래프를 변형했습니다. 회사 이름을 빼고 퍼센트만 남겼습니다. 회사 이름은 오늘 배울 범례(legend)를 이용해서 나타내겠습니다. data= c(21.6,22.3,16.4,15.7,9.9,14.2) labels=paste(data,'%') mycolor=c(colors()[1],colors()[13],colors()[53],colors()[45],colors()[23],colors()[18]) title=c("Global large-area display market share 2017.1") pie(data,labels,col=mycolor,main=title) 위 그래프에 범례를 추가해봅시다. 회사 이름으로 .. 2020. 3. 30.
[R 강의] 69. 문자열을 연결하는 paste 함수 paste 함수는 우리가 정의한 벡터의 원소에 무언가를 붙이거나 벡터의 원소를 하나로 합쳐주는 기능을 합니다. 설명만 들어서는 감이 안올 수 있으니 간단한 예제부터 시작해봅시다. > a=c(1,2,3,4,5) > paste(a) [1] "1" "2" "3" "4" "5" 아무 조건 없이 paste 함수를 적용하면, 우리가 정의한 벡터가 문자열 벡터로 변경됩니다. as.character 과 동일한 기능을 합니다. 일단 벡터를 문자열로 바꿔야 합치던지 다른 문자를 붙이던지 할 수 있기 때문입니다. 이번에는 모든 원소에 hi 라는 단어를 추가해보겠습니다. > a=c(1,2,3,4,5) > paste(a,"hi") [1] "1 hi" "2 hi" "3 hi" "4 hi" "5 hi" 기능이 이해가 되시나요? 이.. 2020. 3. 30.
[R 강의] 68. 파이차트(원그래프) 그리는 방법 도구 R로 푸는 통계 68. 파이차트(원그래프) 그리는 방법 파이(pie)그래프를 그려봅시다. 파이(빵)를 잘라놓은 모양이어서 이런 이름이 붙었구요. 원그래프라고도 부릅니다. 파이그래프는 보통 전체에 대한 비율을 나타낼 때 사용합니다. 전체를 100%라고 했을 때, 각각이 차지하는 비율을 한 눈에 볼 수 있는 것이죠. 먼저 데이터를 하나 가져오겠습니다. 2017년 대형디스플레이 패널 점유율 데이터입니다. (출처 : IHS 마킷) LG디스플레이 : 21.6% BOE : 22.3% AOU : 16.4% Innolux : 15.7 Samsung Display : 9.9% Others : 14.2 % 데이터를 원소로 하는 벡터를 생성하고 가장 기본형태의 파이그래프를 그려보겠습니다. pie 함수를 사용합니다. d.. 2020. 3. 30.
[R 강의] 67. 산점도 '점'의 모양 25가지 도구 R로 푸는 통계 67. 산점도 '점'의 모양 25가지 산점도를 꾸미는 방법을 이전에 다뤘었는데, 이번 강의에서는 점의 모양을 바꾸는 방법을 더 자세히 다루려고 합니다. 먼저 오늘 강의에 활용할 예시를 하나 만들어봅시다. > x=c(1,2,3)ㅁ > y=c(1,2,3) > plot(x,y) 점의 모양을 바꿔봅시다. 점의 모양은 pch=숫자 로 바꿉니다. cex=숫자 는 점의 크기입니다. 25가지의 모양을 전부 출력해봅시다. par함수를 이용하여 5x5 창을 만들고 for문을 이용하여 출력함수를 코딩하겠습니다. x=c(1,2,3) y=c(1,2,3) par(mfrow=c(5,5)) for (i in 1:25){ plot(x,y,pch=i,cex=3) } 아래와 같은 에러가 출력될 지도 모릅니다. 이때는.. 2020. 3. 30.
[R 강의] 66. 산점도 '점'의 색 바꾸기 도구 R로 푸는 통계 66. 산점도 '점'의 색 바꾸기 산점도를 꾸미는 방법을 이전에 다뤘었는데, 이번 강의에서는 색을 바꾸는 방법을 더 자세히 다루려고 합니다. 먼저 오늘 강의에 활용할 예시를 하나 만들어봅시다. > x=c(1,2,3,4,5) > y=c(1,2,3,4,5) > plot(x,y) 점의 색을 바꿔봅시다. 색은 col='이름 or RGB or Hex color code' 옵션을 추가해주면 됩니다. 1. 이름으로 입력하기 점의 색을 이름으로 입력해봅시다. 어떤 색들을 제공하는지 궁금하신 분들은 R에 colors() 라고 입력하시면 색들을 보여줍니다. 3.5.1 버전 기준으로 무려 657가지나 제공합니다. > x=c(1,2,3,4,5) > y=c(1,2,3,4,5) > plot(x,y,col='.. 2020. 3. 29.
[R 강의] 65. 균등분포 (uniform distribution) 도구 R로 푸는 통계 65. 균등분포 (uniform distribution) 균등분포는 확률밀도함수 값이 일정한 분포입니다. 균등분포와 관련된 함수는 네 가지가 있습니다. 1. 확률밀도함수 dunif(x, min = 0, max = 1, log = FALSE) 정의역이 0~5인 균등분포에서 3의 확률밀도 값을 구하겠습니다. > dunif(3,0,5) [1] 0.2 이번에는 log를 TRUE로 설정해서 구해보겠습니다. > dunif(3,0,5,log=TRUE) [1] -1.609438 0.2에 로그를 씌운 log(0.2)와 값이 동일합니다. > log(0.2) [1] -1.609438 2. 누적분포함수 punif(x, min = 0, max = 1, lower.tail = TRUE, log.p = FAL.. 2020. 3. 29.
[R 강의] 64. 엑셀에서 저장한 CSV 파일 R로 불러오기 도구 R로 푸는 통계 64. 엑셀에서 저장한 CSV 파일 R로 불러오기 엑셀 시트에 데이터를 입력합시다. 아래 그림 처럼 10사람의 몸무게,키,나이라는 변수를 입력하겠습니다. 저장할 때, 파일 형식을 CSV로 바꿔줍니다. 이름은 excel_to_R 로 저장하겠습니다. R을 실행하고, 작업폴더를 CSV파일이 저장된 폴더로 바꿔줍니다. (작업 폴더 바꾸는 방법 : http://hsm-edu.tistory.com/477) > setwd("C:/Users/") read.csv 함수를 이용하여 엑셀에서 저장한 csv 파일을 열어줍니다. > my_csv=read.csv('excel_to_R.csv',header=FALSE) > my_csv V1 V2 V3 1 blood type height age 2 A 188 3.. 2020. 3. 29.
[R 강의] 63. R에서 CSV 파일 저장하고 엑셀에서 열어보기 도구 R로 푸는 통계 63. R에서 CSV 파일 저장하고 엑셀에서 열어보기 1. 데이터를 CSV 파일로 저장하기 먼저 CSV 파일이 저장될 폴더를 작업폴더(working directory)로 설정해줍니다. (작업폴더 설정하는 방법 : http://hsm-edu.tistory.com/477) >setwd('C:/Users/Desktop/HSM') R 내장 데이터셋 중에서 trees를 CSV파일로 출력할 것입니다. trees는 데이터프레임입니다. 아래와 같이 my.trees에 trees를 저장해줍니다. > my.trees=trees > my.trees Girth Height Volume 1 8.3 70 10.3 2 8.6 65 10.3 3 8.8 63 10.2 4 10.5 72 16.4 5 10.7 81 1.. 2020. 3. 29.
[R 강의] 62. order 함수 도구 R로 푸는 통계 62. order 함수 order 함수는 n번째 순위에 해당하는 원소가 원래 벡터에서 몇 번째 원소인지를 알려줍니다. 설명만으로는 이해가 어렵구요. 예제를 통해 이해해봅시다. > A=c(21,11,23,15,29,24,13) > order(A) [1] 2 7 4 1 3 6 5 order(A)에서 반환된 벡터의 첫번째 열에 입력된 값은 벡터 A에서 가장 작은 원소가 몇번째 원소인지를 알려줍니다. 2라는 것은 두번째 원소를 뜻하고 A벡터에서 11을 가리킵니다. 11이 벡터 A의 가장 작은 원소이기 때문입니다. 같은 원리로 두번째 열에 입력된 값은 벡터 A에서 두번째로 작은 원소가 몇번째 원소인지를 알려줍니다. 7번째 원소구요. 벡터 A의 7번째 원소는 13입니다. NA를 처리하는 방법은.. 2020. 3. 28.
[R 강의] 61. 데이터가 너무 클 때 일부만 보여주는 함수 (head, tail) 도구 R로 푸는 통계 61. 데이터가 너무 클 때 일부만 보여주는 함수 (head, tail) 데이터 크기가 큰 경우에 일부 데이터만 출력해주는 함수가 head와 tail 입니다. head는 앞에서 부터, tail 은 뒤에서 부터 출력해줍니다. R에서 제공하는 내부 데이터셋 중 CO2로 예를 들겠습니다. 84행으로 이루어진 데이터프레임입니다. 1. head 함수 head 함수는 아래 형식으로 사용합니다. head(데이터, 보기 원하는 개수) > head(CO2,n=3) Plant Type Treatment conc uptake 1 Qn1 Quebec nonchilled 95 16.0 2 Qn1 Quebec nonchilled 175 30.4 3 Qn1 Quebec nonchilled 250 34.8 개수.. 2020. 3. 28.
[R 강의] 60. 객체의 내부 구조 보는 법 (str) 도구 R로 푸는 통계 60. 객체의 내부 구조 보는 법 (str) str 함수는 structure의 약어입니다. 벡터, 행렬, 리스트, 데이터프레임 등 객체의 '내부구조'를 보여줍니다. 내부를 한 눈에 볼 수 있어서 데이터프레임에 주로 사용됩니다. ex1) 벡터의 내부구조 보기 > a=c(1,2,3,4,5) > str(a) num [1:5] 1 2 3 4 5 ex2) 리스트의 내부구조 보기 > li=list(a=c(1,2,3),b=c("a","b","c")) > str(li) List of 2 $ a: num [1:3] 1 2 3 $ b: chr [1:3] "a" "b" "c" ex3) 데이터프레임의 내부구조 보기 > a=c(1,2,3) > b=c(1+1i,2+2i,3+3i) > c=c("a","b",".. 2020. 3. 28.
[R 강의] 59. R에서 제공하는 내장 데이터셋(Dataset) 확인하는 방법 도구 R로 푸는 통계 59. R에서 제공하는 내장 데이터셋(Dataset) 확인하는 방법 R을 설치할 때 다양한 내장 데이터셋들도 함께 설치됩니다. 다양한 예제들이라고 보시면 됩니다. 이 데이터셋들은 R과 통계를 공부하는데 많은 도움이 됩니다. 데이터셋 목록을 불러오는 방법은 아래와 같습니다. > data() 새로운 윈도우 창에 데이터셋 목록이 출력됩니다. 왼쪽에는 데이터셋 이름이 있고 오른쪽에는 간단한 설명이 있습니다. 데이터셋 이름을 Console 창에 입력하면 저장된 데이터를 볼 수 있습니다. 이들중 첫번째 데이터셋을 불러와보겠습니다. > AirPassengers Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec 1949 112 118 132 129 121 135.. 2020. 3. 28.
[R 강의] 58. 데이터프레임 열추가, 행과 열에 이름 붙이기 (data.frame) 도구 R로 푸는 통계 58. 데이터프레임 열추가, 행과 열에 이름 붙이기 (data.frame) 데이터프레임을 하나 만들겠습니다. (데이터 프레임 만들기 : http://hsm-edu.tistory.com/481) 벡터를 먼저 정의하고 데이터프레임을 만들 수도 있지만, 아래와 같이 데이터 프레임 안에 직접 정의할 수도 있습니다. > DF=data.frame(a=c(1,2,3),b=c(1+1i,2+2i,3+3i),c=c("a","b","c")) > DF a b c 1 1 1+1i a 2 2 2+2i b 3 3 3+3i c 1. 데이터프레임에 열 추가하기 열을 추가하는 방법은 아래와 같습니다. d라는 열을 추가해보겠습니다. > DF$d=c(11,22,33) > DF a b c d 1 1 1+1i a 11 2.. 2020. 3. 27.
[R 강의] 57. 데이터프레임에 접근하기 (data.frame) 도구 R로 푸는 통계 57. 데이터프레임에 접근하기 (data.frame) 데이터 프레임을 하나 정의하겠습니다. > a=c(1,2,3) > b=c(1+1i,2+2i,3+3i) > c=c("a","b","c") > DF=data.frame(a,b,c) > DF a b c 1 1 1+1i a 2 2 2+2i b 3 3 3+3i c 데이터 프레임에 접근하는 방법은 리스트와 동일합니다. $를 이용해서 접근합니다. > DF$a [1] 1 2 3 > DF$b [1] 1+1i 2+2i 3+3i > DF$c [1] a b c Levels: a b c 데이터프레임에 문자열 벡터를 입력했을 때, 자동으로 요인으로 인식한다는 것을 알 수 있습니다. 대괄호를 사용한 인덱싱도 가능합니다. > DF[1] a 1 1 2 2 3 3.. 2020. 3. 27.
반응형