본문 바로가기
반응형

R통계124

[R강의] 174. 특정 문자로 벡터 원소 연결해서 문자열로 만들기 아래와 같은 벡터가 있다고 합시다. v=c("HEIGHT","WEIGHT","INCOME") 위 원소들을 특정 기호를 이용하여 연결하여 하나의 문자열을 만들어봅시다. 아래와 같은 코드를 사용합니다. > paste(v,collapse='+') [1] "HEIGHT+WEIGHT+INCOME" 2023. 8. 29.
[R강의] 173. 데이터프레임 인덱싱에서 df[3, ] 와 df['3', ] 의 차이 아래 두 인덱싱을 봅시다. df[3, ] df['3', ] 세번째 행을 인덱싱한다는 의미로 두 코드가 같아 보이지만 전혀 다른 코드입니다. df[3, ] 는 세번째 행을 인덱싱한다는 의미이고, df['3', ] 는 이름이 3인 행을 인덱싱한다는 의미입니다. 일반적으로는 세번쨰 행의 이름이 3이기 때문에 결과가 같지만, 행 이름이 달라지는 경우에는 위 두 코드를 구분해주어야 합니다. 아래와 같은 데이터프레임이 있다고 합시다. id=c('A','B','C','D','E') height=c(156,176,167,189,196) weight=c(65,77,84,67,75) df=data.frame(id,height,weight) 행 이름을 아래와 같이 바꾸겠습니다. rownames(df)=c(3,2,1,4,5).. 2023. 8. 29.
[R강의] 171. R스튜디오 유용한 단축키 (주석, 줄맞춤, 실행, 콘솔창 지우기) 1. 주석 Ctrl + Shift + C 2. 줄 맞춤 Ctrl + Shift + A 3. 실행 블록 씌운 뒤 Ctrl + Enter 4. 콘솔 창 지우기 Ctrl+l (영어 엘) 2023. 8. 29.
[R강의] 170. 산점도 점에 좌표와 점이름 출력하는 방법 (bquote) 먼저 산점도를 하나 그려봅시다. x=c(1,2,4,4,1) y=c(1,3,6,2,1) plot(x,y,xlim=c(0,5),ylim=c(0,6)) 각 점의 좌표를 먼저 화면에 출력해봅시다. x=c(1,2,4,4,1) y=c(1,3,6,2,1) plot(x,y,xlim=c(0,5),ylim=c(0,6)) for (i in 1:length(x)){ text(x[i],y[i],labels=paste0('(',x[i],',',y[i],')'),pos=1,cex=0.8) } 각 점의 이름을 순서 대로 P1부터 이름을 붙이겠습니다. $P_1(1,1)$ 과 같은 형태로 출력해봅시다. bquote 에서 ~은 한칸을 띄우고 연결하는 것이고, *은 공백 없이 연결한다는 뜻입니다. 변수를 입력할 때는 .(변수)형태로 입력하.. 2023. 8. 29.
[R강의] 168. 그래프에 아래첨자,위첨자 넣는 방법 (exprssion) 아래와 같이 이차함수의 그래프를 하나 그려줍니다. x=seq(-4,4,0.01) y=x^2 plot(x,y,type='l') 그래프 제목을 $y=x^2$으로 하고 싶은 상황입니다. 위첨자를 넣어야 합니다. 위첨자는 아래와 같이 넣어줄 수 있습니다. x=seq(-4,4,0.01) y=x^2 plot(x,y,type='l',main=expression(y==x^2)) 아래첨자는 아래와 같이 넣습니다. x=seq(-4,4,0.01) y=x^2 plot(x,y,type='l',main=expression(y==x[2])) 2023. 8. 29.
[R강의] 165. 데이터프레임의 특정 열을 기준으로 결측치를 제거하는 방법 데이터프레임을 하나 만들어봅시다. v1=c(1,2,NA,4,NA) v2=c(10,20,NA,NA,50) df=data.frame(v1,v2) > df v1 v2 1 1 10 2 2 20 3 NA NA 4 4 NA 5 NA 50 결측치를 제거할 건데요. NA가 포함된 모든 행을 제거하는 방법은 간단합니다. na.omit 함수를 적용하면 됩니다. > na.omit(df) v1 v2 1 1 10 2 2 20 오늘 우리가 하고 싶은 것은 이게 아닙니다. 특정 열을 기준으로 결측치를 제거하고 싶습니다. 예를 들어 1열을 기준으로 결측치를 제거하면 3,5행만 제거되는 것입니다. 1열을 기준으로 결측치를 제거하는 방법을 알아봅시다. 먼저 1열의 원소들이 NA인지 여부를 논리값으로 출력해봅시다. > is.na(df$v.. 2023. 8. 29.
[R강의] 164. 데이터프레임의 결측치 위치를 알려주는 함수 만들어보기 아래와 같은 데이터프레임이 있다고 합시다. v1=c(NA,2,3,4,NA) v2=c(10,20,NA,NA,50) df=data.frame(v1,v2) > df v1 v2 1 NA 10 2 2 20 3 3 NA 4 4 NA 5 NA 50 긱 원소의 결측치 여부를 확인하는 것은 is.na 로 가능합니다. > is.na(df) v1 v2 [1,] TRUE FALSE [2,] FALSE FALSE [3,] FALSE TRUE [4,] FALSE TRUE [5,] TRUE FALSE 오늘 하고 싶은 것은 결측치의 위치를 출력해주는 함수를 만드는 것입니다. 위 데이터 프레임을 예로 들면 아래와 같이 출력되는 것입니다. 1,1 3,2 4,2 5,1 함수를 만들기 전에 먼저 데이터프레임의 NA 위치를 출력해주는 코드를.. 2023. 8. 29.
[R강의] 163. 벡터 결측치의 위치를 알려주는 함수 만들기 아래와 같은 벡터가 있다고 합시다. v=c(NA,2,3,4,NA) 결측치 여부를 확인하는 것은 is.na 로 가능합니다. > is.na(v) [1] TRUE FALSE FALSE FALSE TRUE 오늘 하고 싶은 것은 결측치의 위치를 출력해주는 함수를 만드는 것입니다. 위 벡터를 예로 들면 결측치의 위치인 1과 5를 출력해주는 것입니다. 함수를 만들기 전에 먼저 하나의 벡터의 NA 위치를 출력해주는 코드를 짜봅시다. 아래와 같습니다. v=c(NA,2,3,4,NA) res=c() for (i in 1:length(v)){ if (is.na(v[i])){ res=append(res,i) } } v[i] 가 NA 인 경우에 i를 res에 추가하는 코드입니다. 예를들어 v[3]이 NA라면 3이 res에 추가됩.. 2023. 8. 29.
[R강의] 153. 함수에 인자를 여러 조합으로 입력하는 방법 (mapply) mapply 함수는 이해하기가 까다로운 함수입니다. 한번 이해하면 쉬운데 감을 잡는 것이 다른 apply 함수들 보다 어렵습니다. 먼저 예시를 하나 봅시다. > mapply(rep,c(1,2,3),c(2,3,4)) [[1]] [1] 1 1 [[2]] [1] 2 2 2 [[3]] [1] 3 3 3 3 mapply 가 어떤 역할을 하는지 감이 오시나요? 출력 결과가 리스트라는 것은 알 수 있습니다. 위 함수가 입력되면 R에서 어떤 일이 벌어지는지 알아봅시다. mapply 함수의 소스를 뜯어본 것은 아니라 순서는 약간 다를 수 있습니다. 위 함수가 입력되면 R에서는 아래와 같은 일이 벌어집니다. 1) rep(1,2) 가 실행되어 리스트의 첫번째 원소로 들어갑니다. 2) rep(2,3) 이 실행되어 리스트의 두.. 2023. 4. 7.
[R강의] 148. with 함수와 그래프 (열이름을 표현식에 사용) with 함수란? with 함수가 무엇인지 알아보고, with 함수를 그래프와 어떻게 함께 사용되는지도 알아봅시다. with 함수의 기본적인 형태는 아래와 같습니다. with(data,표현식) data에는 데이터프레임이나 리스트가 올 수 있습니다. with 함수는 데이터프레임에 있는 열 이름을 표현식에 바로 사용할 수 있게 해주는 함수입니다. with 함수를 사용하기 위해 아래와 같은 데이터프레임을 하나 정의해봅시다. df=data.frame(A=c(1,2,3),B=c(4,5,6),C=c(7,8,9)) > df A B C 1 1 4 7 2 2 5 8 3 3 6 9 아래와 같이 코드를 입력해봅시다. 어떤 결과가 출력될까요? with(df, A) A가 출력됩니다. > with(df,A) [1] 1 2 3 벡.. 2023. 3. 28.
[ggplot2의 이해] 4. 선그래프 (geom_line) 1. 선 그래프 그리기 내장데이터인 Orange 를 이용하여 선그래프를 그려보았습니다. Orange 데이터는 다섯 종류 나무의 나이에 따른 테두리 둘레 데이터입니다. 1번 나무의 데이터만 Orange_1 에 저장합시다. Orange_1=Orange[Orange['Tree']==1,] 그래프를 그려봅시다. 주요한 옵션들만 넣었습니다. 주요 옵션은 제목, 축이름, 서식, 가운데정렬입니다. 설명은 주석으로 대신합니다. library(tidyverse) ggplot(data=Orange_1,aes(x=age,y=circumference))+ geom_line()+ labs(title="geom_line",x='age',y='circumference')+ #제목, 축이름 theme(title = element_t.. 2023. 2. 6.
[R강의] 137. 데이터프레임 결합의 끝판왕 (merge) merge 함수는 두 데이터프레임을 합쳐주는 함수입니다. rbind 보다는 cbind 와 유사한데요. cbind와 구벌되는 점은 특정 열을 기준으로 하여 합친다는 것입니다. 총 네가지 방법이 있는데요. 그림을 보면 쉽게 이해가 되실겁니다. 데이터프레임을 가지고 직접 해봅시다. 사용할 두 데이터는 아래와 같습니다. A=data.frame(id=c(1,2,3),weight=c(78,88,98),height=c(170,175,180)) B=data.frame(id=c(2,3,4),math=c(75,85,85),eng=c(100,85,60)) 콘솔창에 입력해보면 아래와 같습니다. > A id weight height 1 1 78 170 2 2 88 175 3 3 98 180 > B id math eng 1 2 .. 2023. 1. 31.
[R강의] 135. 데이터프레임을 열로 결합하기 (cbind) 데이터프레임을 열로 결합하는 방법을 알아봅시다. 열로 결합한다는 것은 아래와 같은 결합을 뜻합니다. 이때 cbind 함수가 사용됩니다. cbind 는 column(열) 을 bind(결합하다) 를 의미합니다. cbind 를 사용하려면 합치려는 데이터프레임들의 '행 개수'가 같아야 합니다. 아래와 같은 데이터프레임이 있다고 합시다. A 반 학생 세명의 번호, 몸무게, 키입니다. A=data.frame(id=c(1,2,3), weight=c(78,88,98), height=c(170,175,180)) > A id weight HEight 1 1 78 170 2 2 88 175 3 3 98 180 아래와 같이 학생들의 수학,영어 점수를 추가로 조사하였다고 합시다. A2=data.frame(math=c(75,80.. 2023. 1. 25.
[R강의] 134. 데이터프레임 열이름이 다른 경우 rbind 적용하기 rbind 함수는 데이터프레임들의 행을 결합하는 함수입니다. 데이터프레임들의 열 이름이 같아야 사용이 가능합니다. 변수 종류는 같은데 열 이름이 다르게 쓰여진 경우에 rbind 함수를 적용하는 방법을 알아봅시다. 아래와 같은 두 데이터프레임이 있습니다. A=data.frame(id=c(1,2,3), weight=c(78,88,98), HEight=c(170,175,180)) B=data.frame(id=c(4,5,6), weight=c(58,68,78), height=c(140,155,160)) > A id weight HEight 1 1 78 170 2 2 88 175 3 3 98 180 > B id weight height 1 4 58 140 2 5 68 155 열 이름이 달라서 rbind 함수 적용.. 2023. 1. 25.
[R강의] 133. 데이터프레임을 행으로 결합하기 (rbind) 데이터프레임을 행으로 결합하는 방법을 알아봅시다. 행으로 결합한다는 것은 아래와 같은 결합을 뜻합니다. 이때 rbind 함수가 사용됩니다. rbind 는 row(행) 을 bind(결합하다) 를 의미합니다. rbind 를 사용하려면 합치려는 데이터프레임들의 '열 이름'이 같아야 합니다. R코드로 예를 들어봅시다. 두개의 데이터 프레임을 생성합시다. A=data.frame(id=c(1,2,3), weight=c(78,88,98), height=c(170,175,180)) B=data.frame(id=c(4,5,6), weight=c(58,68,78), height=c(140,155,160)) 콘솔창에 출력해보면 아래와 같습니다. > A id weight height 1 1 78 170 2 2 88 175 3.. 2023. 1. 24.
[하루만에 끝내는 R기초] 8교시. 함수, 패키지 지난시간에 조건문인 if 문과 반복문인 for문을 배웠습니다. if문은 특정 조건이 만족하면 문장을 실행하는 것이었습니다. for은 어떤 자료구조 안에 있는 원소를 하나씩 대입하며 문장을 실행하는 것이었습니다. 목차를 가져와서 오늘 배울 내용이 무엇인지 알아봅시다. 1교시) 강의 소개 2교시) R설치, R스튜디오 설치 3교시) 자료형 4교시) 변수 5교시) 자료구조 6교시) 연산자(산술,비교,논리) 7교시) 조건문, 반복문 8교시) 함수, 패키지 9교시) 그래프(박스플롯), t검정 10교시) 단축키 소개 및 전체요약 오늘 배울 내용은 함수와 패키지입니다. 함수는 값을 입력하면 어떤 조작을 한 뒤, 값을 출력해주는 것을 말합니다. 함수를 직접 만든는 법을 배우기 전에 R에서 기본 제공하는 함수를 사용해보며.. 2022. 11. 14.
[R강의] 128. 엑셀 데이터 불러와서 통계량,그래프,t검정 하기 (템플릿) 오늘 배워볼 내용의 요약은 아래와 같습니다. 좌측과 같은 엑셀 데이터를 R에서 불러와서, 우측 위의 그림과 같은 그래프를 그릴 것입니다. 우측 아래와 같이 요약 통계량과 t검정 결과가 요약된 표도 출력할 것입니다. 먼저 R에서 엑셀 데이터를 불러오겠습니다. 메뉴탭에서 [File]-[Import Dataset]-[From Excel] 을 클릭합니다. Browse 를 누르고 엑셀 데이터를 찾아서 열어줍니다. 데이터가 있는 Sheet를 선택한 뒤 우측 'Code Preview' 의 코드를 복사합니다. Cancel을 눌러서 끄고 스크립트 창에 붙여넣어줍니다. View 코드는 지우고, 변수 이름이 길기 때문에 짧게 dt 로 바꿔줍니다. library(readxl) dt dt # A tibble: 60 x 3 반 .. 2021. 12. 30.
[R강의] 118. 표기법 설정하기 (지수표기 vs 일반표기) R에서 숫자를 출력할 때 표기하는 방법은 크게 두가지가 있습니다. 지수표기법과 일반표기법입니다. 1100을 표기한다고 할 때 1.1e^2 는 지수표기법, 1100은 일반표기법입니다. R에서는 어떤 룰을 가지고 두 표기법 중 하나를 선택합니다. 정확히 어떤 룰인지는 저도 잘 모르겠습니다. 예를 들면 아래와 같습니다. > 1000 [1] 1000 > 1000000 [1] 1e+06 > 2222 [1] 2222 > 222222222222222 [1] 2.222222e+14 한쪽 표기 방법을 선택하고 싶은 경우 options(scipen=값) 을 설정해주면 됩니다. 값이 양수로 커질 수록 일반표기법이 우세해 지고, 음수로 커질 수록 지수 표기법이 우세해집니다. > options(scipen=999) > 2222.. 2021. 7. 11.
[R강의] 116. 01,02,03,.. 형태의 벡터 만드는 방법 01,02,03,04...와 같은 벡터를 만드는 방법입니다. sprintf 함수를 사용합니다. sprintf 함수는 포멧팅 방식을 설정할 수 있습니다. sprintf(포멧팅 방식, 인자) ex) 01~50 까지의 벡터를 01,02,03...으로 출력 > num=sprintf("%02d", 1:50) > num [1] "01" "02" "03" "04" "05" "06" "07" "08" "09" "10" "11" "12" "13" "14" "15" "16" "17" "18" "19" [20] "20" "21" "22" "23" "24" "25" "26" "27" "28" "29" "30" "31" "32" "33" "34" "35" "36" "37" "38" [39] "39" "40" "41" "42" .. 2021. 6. 28.
[R강의] 115. 데이터프레임에서 한 열을 기준으로 나머지열도 정렬하는법 아래와 같은 데이터프레임이 있습니다. 내장데이터인 CO2 데이터입니다. > head(CO2,10) Plant Type Treatment conc uptake 1 Qn1 Quebec nonchilled 95 16.0 2 Qn1 Quebec nonchilled 175 30.4 3 Qn1 Quebec nonchilled 250 34.8 4 Qn1 Quebec nonchilled 350 37.2 5 Qn1 Quebec nonchilled 500 35.3 6 Qn1 Quebec nonchilled 675 39.2 7 Qn1 Quebec nonchilled 1000 39.7 8 Qn2 Quebec nonchilled 95 13.6 9 Qn2 Quebec nonchilled 175 27.3 10 Qn2 Quebec .. 2021. 6. 11.
[R강의] 114. 여러 그래프의 제목과 축이름 글자 크기 한번에 바꾸는법 아래와 같이 세개의 그래프를 그렸다고 합시다. par(mfrow=c(1,3)) x=seq(-4,4,0.01) y=dnorm(x) plot(x,y,type='l',main="확률밀도함수 PDF",xlab="X",ylab="f(X)") x=seq(-4,4,0.01) y=pnorm(x) plot(x,y,type='l',main="누적분포함수 CDF",xlab="X",ylab="cumulative P") x=seq(0,1,0.01) y=qnorm(x) plot(x,y,type='l',main="역누적분포함수",xlab="cumulative P",ylab="X") 글자 크기를 바꾸려면 각 plot 내부에 cex 옵션을 정의해야 하는데 번거롭습니다. par 함수를 이용하면 한번에 바꿀 수 있습니다. par(mfro.. 2021. 6. 11.
[R강의] 110. 데이터분석 결과를 '표'로 출력하는 방법 두 가지 검정결과 등을 커멘드 창에서 입력해서 보는 것이 불편합니다. t검정을 예로 들면, t검정 결과가 오른쪽 plot 창에 출력되면 편리할 것입니다. 또는 새 탭에 표 형식으로 출력할 수도 있습니다. 두 방법 모두 설명드리겠습니다. 한가지 상황을 가정하겠습니다. A,B 두 집단의 키와 몸무게 비교하는 상황입니다. 아래와 같은 표를 출력하는 것이 목적입니다. A집단 B집단 p-value 키 평균±표준편차 평균±표준편차 p값 몸무게 평균±표준편차 평균±표준편차 p값 1. View로 출력하는 방법 설명은 코드 주석으로 대신합니다. library(plotrix) library(dplyr) #데이터 생성 A_Height=rnorm(100,183,3) B_Height=rnorm(100,172,5) A_Weight=rno.. 2021. 5. 26.
R의 lapply 함수(리스트에 원하는 함수를 원하는 방향으로 적용) lapply 함수는 리스트에 원하는 함수를 카테고리마다 적용해줍니다. 예를들어봅시다. 아래와 같은 데이터가 있습니다. 어떤 반의 인원이 다섯명이고, 다섯사람이 세과목의 시험을 본 결과 데이터입니다. > Math=c(94,82,45,55,67) > English=c(88,86,56,90,50) > Science=c(87,76,65,43,55) 리스트에 넣었습니다. > Li1=list(Math=Math,English=English,Science=Science) > Li1 $Math [1] 94 82 45 55 67 $English [1] 88 86 56 90 50 $Science [1] 87 76 65 43 55 laaply 함수를 적용해봅시다. 각 카테고리별로 평균이 구해지고, 결과가 리스트 형태로 출력됩.. 2021. 3. 18.
R의 apply 함수(함수를 배열에 원하는 방향으로 적용) apply 함수는 벡터,행렬,배열에 원하는 함수를 원하는 방향으로 적용해줍니다. 예를들어봅시다. 아래와 같은 데이터가 있습니다. 어떤 반의 인원이 다섯명이고, 다섯사람이 세과목의 시험을 본 결과 데이터입니다. > Math=c(94,82,45,55,67) > English=c(88,86,56,90,50) > Science=c(87,76,65,43,55) 데이터프레임에 넣었습니다. > DF1=data.frame(Math,English,Science) > DF1 Math English Science 1 94 88 87 2 82 86 76 3 45 56 65 4 55 90 43 5 67 50 55 apply 함수를 적용해봅시다. apply함수는 아래와 같은 형식으로 입력합니다. apply(데이터, 방향, 함수).. 2021. 3. 18.
R에서 날짜 데이터의 연산하기 날짜 데이터를 만들어봅시다. > d1=as.Date("1919-04-13") 날짜데이터에 자연수를 더하거나 뻬는 연산이 가능합니다. 실수와 무리수로도 가능합니다. > d1+1 [1] "1919-04-14" > d1-23 [1] "1919-03-21" > d1+sqrt(2) [1] "1919-04-14" 곱셈과 나눗셈은 불가능합니다. > d1*3 Error in Ops.Date(d1, 3) : * not defined for "Date" objects > d1/2 Error in Ops.Date(d1, 2) : / not defined for "Date" objects 이번에는 두개의 날짜데이터를 만들어봅시다. d1은 대한민국 임시정부수립일이고 d2는 오늘 날짜입니다. > d1=as.Date("1919-0.. 2021. 3. 18.
R에서 날짜데이터 입력하기 (as.Date) R에서 날짜를 입력할 때는 일반적으로 아래와 같은 표기를 사용합니다. 2018-12-25 문자열을 이용해서 입력하고, as.Date 함수를 이용하여 문자열을 날짜 타입으로 변형해줍니다. > a=c("2018-12-21") > b=as.date(a) 정의한 벡터의 이름을 입력해 보면 둘의 차이를 알 수 없습니다. > b [1] "2018-12-21" > a [1] "2018-12-21" str 함수를 이용하면 날짜로 타입이 바뀐 것을 알 수 있습니다. > str(a) chr "2018-12-21" > str(b) Date[1:1], format: "2018-12-21" as.Date 함수에 사용되는 옵션을 알아봅시다. as.Date(x, format, tryFormats = c("%Y-%m-%d", "%Y.. 2021. 3. 18.
[R 텍스트마이닝] 창세기 단어구름(wordcloud) 만들기 (3) 단어구름 만들기 R 텍스트마이닝창세기 단어구름(wordcloud) 만들기 (3) 단어구름 만들기 지난 코드에 이어서 설명하겠습니다. library(stringr)library(dplyr) #텍스트 불러오기gen=readLines("E:/ONE_DRIVE/OneDrive/21.textmining/bible_example/genesis.txt",encoding="EUC-KR") #단어 단위로 쪼개기gen_word = strsplit(gen ,split=" ") %>% unlist() #불필요한 단어 찾아 위치 저장하기rm_obj=which(str_detect(gen_word,":")|str_detect(gen_word,"")) #불필요한 단어 제거하기 gen_word_r1=gen_word[-rm_obj] 원본에서 불필요한 .. 2020. 10. 6.
[R 텍스트마이닝] 창세기 단어구름(wordcloud) 만들기 (2) 전처리 R 텍스트마이닝창세기 단어구름(wordcloud) 만들기 (2) 전처리 지난 글에서 창세기 텍스트를 불러왔습니다. gen=readLines("E:/ONE_DRIVE/OneDrive/21.textmining/bible_example/genesis.txt",encoding="EUC-KR") 오늘은 텍스트를 단어 단위로 쪼개고, 불필요한 단어를 제거하도록 하겠습니다. 단어단위로 쪼개기 위해 stringr 패키지를 설치하겠습니다. 파이프 연산자 사용을 위해 dplyr 패키지도 설치합시다. > install.packages("stringr")> install.packages("dplyr") 설치한 패키지를 불러옵시다. library(stringr)library(dplyr) 1. 단어 단위로 쪼개기 strsplit.. 2020. 10. 6.
[R 텍스트마이닝] 창세기 단어구름(wordcloud) 만들기 (1) 개역개정 텍스트 불러오기 R 텍스트마이닝창세기 단어구름(wordcloud) 만들기 (1) 개역개정 텍스트 불러오기 단어구름은 빈도분석 결과를 시각화하는 방법입니다. 등장횟수가 높은 단어일 수록 크기가 크고 구름 중앙에 놓이게 됩니다. 아래 순서로 진행될 것입니다. 1. 개역개정 텍스트 불러오기2. 전처리3. 단어구름 만들기 오늘은 첫시간입니다. 텍스트를 불러와보겠습니다. txt 파일은 구글에 '개역개정 창세기' 라고 검색하시면 쉽게 구하실 수 있습니다. genesis.txt라고 저장했습니다. readLines함수로 불러옵니다. 경로는 각자의 경로를 입력하셔야 됩니다. encoding 방식은 EUC-KR로 설정해줍니다. gen=readLines("E:/ONE_DRIVE/OneDrive/21.textmining/bible_examp.. 2020. 10. 6.
[R강의] 105. attr 이 무엇인가요? R을 사용하다 보면 attr 을 보게될 때가 있습니다. 예를들어 x라는 벡터에 scale 함수를 적용하면, 결과 데이터 이외에 아래 sttr 이라는 내용이 출력됩니다. > x=1:5 > scale(x) [,1] [1,] -1.2649111 [2,] -0.6324555 [3,] 0.0000000 [4,] 0.6324555 [5,] 1.2649111 attr(,"scaled:center") [1] 3 attr(,"scaled:scale") [1] 1.581139 attr 는 attribute 의 약어입니다. 속성이라는 뜻입니다. 변수에 속성을 지정할 수가 있는데요. 그럴 경우 입력되는 정보입니다. 벡터를 하나 정의하고 속성을 입력해보겠습니다. v1=c(1,2,3,4,5) attr을 입력할건데요. 입력하는 방.. 2020. 10. 3.
반응형