본문 바로가기
반응형

R80

[하루만에 끝내는 R 데이터프레임] 3. 유용한 기본함수 (tail, head, str, dim) 이번시간에는 데이터프레임에 사용하는 유용한 함수를 알아봅시다. 1교시. 강의 소개 2교시. 데이터프레임 정의하고 행이름, 열이름 바꾸기 3교시. 유용한 기본함수 (tail, head, str, dim) 4교시. 벡터의 인덱싱 5교시. 데이터 프레임 원소에 접근하기 (데이터프레임 인덱싱) 6교시. 데이터프레임 열과 행에 접근하기 7교시. 데이터프레임 행 또는 열 제거, 추가, 변경하기 8교시. 특정 조건으로 데이터프레임 추리기 9교시. 여러 데이터프레임 결합하기 10교시. 엑셀파일을 데이터프레임으로 불러오기 네 가지 함수를 배워볼 건데요. tail, haed, str, dim 입니다. 간단한 설명은 아래와 같습니다. tail : 데이터프레임의 앞부분 출력 head : 데이터프레임 뒷부분 출력 str : 데.. 2023. 6. 2.
[하루만에 끝내는 R 데이터프레임] 2. 데이터프레임 정의하고 열이름, 행이름 바꾸기 이번시간에는 데이터프레임을 정의하는 방법을 배우고, 행과 열의 이름을 바꿔볼 것입니다. 1교시. 강의 소개 2교시. 데이터프레임 정의하고 행이름, 열이름 바꾸기 3교시. 유용한 기본함수 (tail, head, str, dim) 4교시. 벡터의 인덱싱 5교시. 데이터 프레임 원소에 접근하기 (데이터프레임 인덱싱) 6교시. 데이터프레임 열과 행에 접근하기 7교시. 데이터프레임 행 또는 열 제거, 추가, 변경하기 8교시. 특정 조건으로 데이터프레임 추리기 9교시. 여러 데이터프레임 결합하기 10교시. 엑셀파일을 데이터프레임으로 불러오기 1. 데이터프레임 정의하기 데이터프레임을 하나 정의해봅시다. 데이터프레임은 벡터를 이용하여 정의합니다. 각 벡터들은 데이터프레임의 열이 됩니다. 학생들의 정보를 담고 있는 데이.. 2023. 6. 2.
[하루만에 끝내는 R 데이터프레임] 1. 강의 소개 본 강의는 하루만에 끝내는 R 기초에 이은 하루만에 끝내는 시리즈 두번째 강의입니다. 제목은 하루만에 끝내는 R 데이터프레임 입니다. 아마 많은 분들이 통계분석과 시각화를 위해 R을 배우시는 것이라 생각됩니다. 통계분석과 시각화를 배우기 전에 '데이터프레임'을 정복해야 합니다. 데이터프레임은 R에서 가장 많이 사용되는 자료구조입니다. 데이터프레임을 잘 다룰 줄 알아야 통계분석과 시각화가 한결 편해집니다. 하루만에 끝내는 데이터프레임에서 배울 내용은 아래와 같습니다. 1교시. 강의 소개 2교시. 데이터프레임 정의하고 행이름, 열이름 바꾸기 3교시. 유용한 기본함수 (tail, head, str, dim) 4교시. 벡터의 인덱싱 5교시. 데이터 프레임 원소에 접근하기 (데이터프레임 인덱싱) 6교시. 데이터프.. 2023. 6. 2.
[R강의] 142. var, sd 함수는 모집단일까 표본일까 var 함수 R에서 분산을 계산할 때 사용하는 var 함수가 모분산을 계산하는지 표본분산을 계산하는지 알아봅시다. data=c(1,2,3,4,5) #모 분산 직접 계산하기 var_cal_p=sum((data-mean(data))**2)/length(data) #표본 분산 직접 계산하기 var_cal_s=sum((data-mean(data))**2)/(length(data)-1) #var 함수 사용 var_fun=var(data) #출력 print(var_cal_p) print(var_cal_s) print(var_fun) > print(var_cal_p) [1] 2 > print(var_cal_s) [1] 2.5 > print(var_fun) [1] 2.5 var 로 계산된 결과가 표본분산임을 알 수 있.. 2023. 2. 27.
[R강의] 140. 데이터 프레임을 쉽게 조작하는 transform 함수 데이터프레임을 하나 정의합시다. num=1:10 score=c(78,62,65,94,71,97,57,83,71,96) md=data.frame(num,score) > md num score 1 1 78 2 2 62 3 3 65 4 4 94 5 5 71 6 6 97 7 7 57 8 8 83 9 9 71 10 10 96 둘째 열에 5를 더해서 셋째 열을 추가하는 상황을 가정합시다. 아래와 같이 인덱싱을 이용하여 추가할 수 있습니다. > md[,'add']=md$score+5 > md num score add 1 1 78 83 2 2 62 67 3 3 65 70 4 4 94 99 5 5 71 76 6 6 97 102 7 7 57 62 8 8 83 88 9 9 71 76 10 10 96 101 이번에는 tran.. 2023. 2. 27.
[R dplyr의 이해] 4. 주요 함수 한눈에 보기 tidyverse 의 dplyr 패키지에는 아래와 같은 주요 함수들이 있습니다. 1) filter 함수 : 행 선택 2) select 함수 : 열 선택 3) arrange : 정렬 4) distinct : 유니크한 값만 출력 5) mutate 함수 : 연산을 통한 열 변환 혹은 생성 6) summarise 함수 : 원하는 열의 통계량 출력 7) group_by 함수 : 그룹화 다음시간부터 하나씩 공부해봅시다. 2023. 2. 7.
[R강의] 138. 데이터프레임 행 추가할 때 리스트를 사용해야하는 이유 데이터프레임에 행을 추가할 때 왜 리스트를 사용해야 하는지 이야기해보려고 합니다. 먼저 데이터프레임을 하나 정의하겠습니다. name=c('KYS','OJH','PSK') gender=c('M','F','M') height=c(182,165,177) df=data.frame(name,gender,height,stringsAsFactors=FALSE) > df name gender height 1 KYS M 182 2 OJH F 165 3 PSK M 177 1열은 이름, 2열은 성별, 3열은 키입니다. 사람 한명의 정보를 더 추가하고 싶은 상황입니다. 가장 쉽게 떠오르는 방법은 인덱싱을 통해 추가하는 것입니다. 아래와 같이 추가할 수 있습니다. > df[4,]=c('CYR','F',163) > df name.. 2023. 1. 31.
[R강의] 137. 데이터프레임 결합의 끝판왕 (merge) merge 함수는 두 데이터프레임을 합쳐주는 함수입니다. rbind 보다는 cbind 와 유사한데요. cbind와 구벌되는 점은 특정 열을 기준으로 하여 합친다는 것입니다. 총 네가지 방법이 있는데요. 그림을 보면 쉽게 이해가 되실겁니다. 데이터프레임을 가지고 직접 해봅시다. 사용할 두 데이터는 아래와 같습니다. A=data.frame(id=c(1,2,3),weight=c(78,88,98),height=c(170,175,180)) B=data.frame(id=c(2,3,4),math=c(75,85,85),eng=c(100,85,60)) 콘솔창에 입력해보면 아래와 같습니다. > A id weight height 1 1 78 170 2 2 88 175 3 3 98 180 > B id math eng 1 2 .. 2023. 1. 31.
[R강의] 136. rbind로 데이터프레임들 결합할 때, 구분하는 열 추가하기 데이터프레임을 두개 만들어봅시다. 하나는 남자의 키와 몸무게이고, 하나는 여자의 키와 몸무게 입니다. weight=c(78,88,98) height=c(170,175,180) male_df=data.frame(weight,height) weight=c(48,58,68) height=c(150,160,170) female_df=data.frame(weight,height) 우리는 두 데이터프레임을 합치고 싶은 상태인데요. 데이터프레임이 합쳐진 후에도 남녀를 구분하고 싶습니다. 각 데이터프레임에 열을 하나씩 추가합시다. 아래와 같이 입력합니다. male_df['gender']='M' female_df['gender']='F' 각 데이터프레임은 아래와 같이 변했습니다. > male_df weight heigh.. 2023. 1. 31.
[R dplyr의 이해] 3. 파이프 연산자 %>% tidyverse나 dplyr은 몰라도 파이프 연산자는 아는 사람이 있을 정도로 유명하고 유용한 연산자입니다. 우리가 어떤 변수 x에 평균과 반올림 함수를 적용했다고 합시다. 아래와 같습니다. round(mean(x)) 파이프 연산자를 이용하면 위 코드를 아래와 같이 쓸 수 있습니다. x %>% mean %>% round 만약 옵션이 있다면, 옵션은 어떻게 설정해야할까요? iris 데이터에 head 함수를 사용하는 상황을 생각해봅시다. 옵션을 설정하여 세 줄만 출력할 것입니다. > head(iris,n=3) Sepal.Length Sepal.Width Petal.Length Petal.Width Species 1 5.1 3.5 1.4 0.2 setosa 2 4.9 3.0 1.4 0.2 setosa 3 4.. 2023. 1. 30.
[R dplyr의 이해] 2. tibble 자료구조 dplyr 에서는 데이터프레임과 비슷한 자료구조인 tibble 자료구조를 제공합니다. tibble 자료구조 대신 그냥 데이터프레임을 사용해도 상관은 없습니다. tibble 자료구조는 나름 데이터프레임을 '개선'한 자료구조입니다. iris 자료를 가져옵시다. iris 자료는 데이터프레임입니다. > df=iris > df Sepal.Length Sepal.Width Petal.Length Petal.Width Species 1 5.1 3.5 1.4 0.2 setosa 2 4.9 3.0 1.4 0.2 setosa 3 4.7 3.2 1.3 0.2 setosa 4 4.6 3.1 1.5 0.2 setosa 5 5.0 3.6 1.4 0.2 setosa 6 5.4 3.9 1.7 0.4 setosa 7 4.6 3.4 1.. 2023. 1. 29.
[ggplot2의 이해] 2. ggplot2의 기본구조 ggplot2 를 공부하기 전에 먼저 아래 패키지를 설치합시다. install.packages("tidyverse") 이 패키지를 설치하면 tidyverse 의 모든 패키지를 사용할 수 있습니다. 이제 본격적으로 ggplot2 를 공부해봅시다. ggplot2 는 데이터프레임(또는 tibble)을 이용하여 그리는 것을 원칙으로 합니다. 우리가 다루는 데이터프레임이 변수 df 에 들어있다고 합시다. 어떤 그래프를 그릴 것인지와 상관 없이 아래 코드로 시작합니다. ggplot(data=df) "그래프를 그릴 것이고 데이터는 df 를 사용할 것이다" 라는 뜻입니다. 이제 그릴 그래프를 선택해야 합니다. 그래프를 그려주는 함수들은 아래와 같습니다. 더 여러가지 종류가 있지만 자주 사용되는 함수들만 가져왔습니다. .. 2023. 1. 28.
[R강의] 138. 엑셀파일 수백개를 자동으로 불러와서 for문과 rbind 이용하여 결합하기 아래와 같이 엑셀파일이 있다고 합시다. 어떤 도시에 사는 사람을 모집해서 나이와 키를 조사한 것입니다. 도시마다 따로 조사했기 때문에 각각의 엑셀파일이 있습니다. 파일이 수백개라고 가정합시다. R에서 엑셀파일을 불러오는 방법은 아래와 같습니다. setwd('경로') read_excel('파일이름.xlsx') 예시는 아래와 같습니다. 아래 경로는 제 컴퓨터에 파일이 들어있는 경로이고, 경로는 여러분이 파일을 넣은 경로로 설정하셔야 합니다. library(readxl) library(dplyr) setwd('C:/Users/PC1/Documents/data') df1=read_excel("city1.xlsx") %>% as.data.frame 만약 엑셀파일이 수백개라면 마지막줄을 백번 적어야 합니다. df1.. 2023. 1. 19.
[R dplyr의 이해] 1. dplyr이란 무엇인가 R 안에는 tidyverse 라는 또 하나의 세계가 있습니다. tidyverse는 Hadley Wickham과 그의 팀이 개발한 패키지 모음을 말합니다. tidyverse 없이도 R을 사용하는데 전혀 문제가 없지만, tidyverse 를 사용하면 데이터 전처리,시각화 등이 편해집니다. 시중에 출시되고 있는 R을 이용한 데이터분석 및 시각화 책들은 tidyverse 패키지를 사용하고 있기 때문에 R로 데이터 분석을 한다면 거의 필수적으로 사용해야 하는 패키지가 되었습니다. tidyverse 안에는 아래 패키지들이 있습니다. dplyr : 데이터 전처리 ggplot2 : 시각화 readr : 데이터 호출 lubridate : 시계열 데이터 전처리 stringr : 텍스트 전처리 purrr : 함수형 패키지 .. 2023. 1. 17.
[R강의] 132. 여러 점들 사이의 거리 한번에 구하는 법 (dist함수) 아래와 같이 5개의 점이 있다고 합시다. P1=c(1,2,3) P2=c(3,5,2) P3=c(5,5,4) P4=c(1,4,7) P5=c(2,2,4) 이들 중 어느 두 점이 가장 가까운 거리에 있는지 알고 싶은 상황입니다. 유클리드 거리를 행렬 형태로 출력해주는 함수가 있습니다. dist 함수입니다. 먼저 위 점들을 하나의 행렬로 묶어줍니다. mat1=matrix(c(P1,P2,P3,P4,P5),byrow=TRUE,nrow=5) > mat1 [,1] [,2] [,3] [1,] 1 2 3 [2,] 3 5 2 [3,] 5 5 4 [4,] 1 4 7 [5,] 2 2 4 위에서 만든 행렬에 dist 함수를 적용해봅시다. > dist(mat1) 1 2 3 4 2 3.741657 3 5.099020 2.828427 .. 2022. 12. 23.
[R강의] 131. 연속형 변수를 구간에 따라 범주형 변수로 바꾸는 방법 점수를 학점으로 바꿔봅시다. 바꾸는 기준은 아래와 같습니다. 점수는 연속형 변수이고, 학점은 범주형 변수입니다. R에는 위와 같이 범위로 표현된 연속형 변수를 범주형 변수로 바꿔주는 함수가 있습니다. cut 함수를 사용합니다. 먼저 데이터를 생성합시다. 10명의 점수를 생성하겠습니다. num은 번호이고 score 은 점수입니다. #데이터 생성 num=1:10 score=c(78,62,65,94,71,97,57,83,71,100) md=data.frame(num,score) > md num score 1 1 78 2 2 62 3 3 65 4 4 94 5 5 71 6 6 97 7 7 57 8 8 83 9 9 71 10 10 100 cut 함수는 아래와 같이 사용합니다. #점수를 학점으로 변환 gpa=cut(.. 2022. 12. 23.
[R강의] 144. 엑셀에서 데이터 불러와서 분할표 만들고 카이제곱검정 또는 피셔의 정확검정 하기 아래와 같은 범주형 데이터가 있습니다. 남자 10명과 여자 10명을 대상으로 무서운 영화 선호 여부를 조사한 것입니다. 우리는 위 데이터를 아래와 같은 형태의 표로 만들고 카이제곱검정을 하고 싶은 상황입니다. 남자 여자 무서운영화 선호 OO명 OO명 무서운 영화 비선호 OO명 OO명 1. 데이터 불러오기 먼저 아래 데이터를 다운받습니다. R에서 아래 메뉴를 클릭합니다. Browse를 누르고 데이터를 불러옵니다. Import를 누르지 말고, 우측 하단에 Code Preview 내용을 복사해서 스크립트 창에 붙여넣습니다. 아래와 같이 변수 이름을 간단하게 만들어줍니다. library(readxl) dt chisq.test(tb) Pearson's Chi-squared test with Yates' conti.. 2022. 12. 21.
[하루만에 끝내는 R기초] 10교시. 전체 내용 요약 지난시간인 9교시까지 하루만에 끝내는 R기초 강의에서 준비한 내용을 다 배웠습니다. 1강부터 9강까지 총 시간을 계산해보니 55분 55초입니다. 한시간에 끝내는 R 기초라고 이름을 붙일걸 그랬어요. 이번시간은 마지막 시간인 10교시입니다. 1교시) 강의 소개 2교시) R설치, R스튜디오 설치 3교시) 자료형 4교시) 변수 5교시) 자료구조 6교시) 연산자(산술,비교,논리) 7교시) 조건문, 반복문 8교시) 함수, 패키지 9교시) 그래프(박스플롯), t검정 10교시) 단축키 소개 및 전체요약 1) 단축키 소개 자주 사용하는 단축키를 소개하고 전체 내용을 요약하겠습니다. 저는 두가지 단축키만 사용합니다. 아래와 같습니다. Ctrl + Enter : 선택된 줄 실행 Ctrl + L : 콘솔 창 비우기 콘솔창이.. 2022. 11. 19.
[하루만에 끝내는 R기초] 8교시. 함수, 패키지 지난시간에 조건문인 if 문과 반복문인 for문을 배웠습니다. if문은 특정 조건이 만족하면 문장을 실행하는 것이었습니다. for은 어떤 자료구조 안에 있는 원소를 하나씩 대입하며 문장을 실행하는 것이었습니다. 목차를 가져와서 오늘 배울 내용이 무엇인지 알아봅시다. 1교시) 강의 소개 2교시) R설치, R스튜디오 설치 3교시) 자료형 4교시) 변수 5교시) 자료구조 6교시) 연산자(산술,비교,논리) 7교시) 조건문, 반복문 8교시) 함수, 패키지 9교시) 그래프(박스플롯), t검정 10교시) 단축키 소개 및 전체요약 오늘 배울 내용은 함수와 패키지입니다. 함수는 값을 입력하면 어떤 조작을 한 뒤, 값을 출력해주는 것을 말합니다. 함수를 직접 만든는 법을 배우기 전에 R에서 기본 제공하는 함수를 사용해보며.. 2022. 11. 14.
[하루만에 끝내는 R기초] 7교시. 조건문,반복문 지난시간에는 연산자를 배웠습니다. 연산자에는 산술, 비교, 논리연산자 있었는데요. 산술연산자와 비교연산자만 배웠습니다. 산술연산자는 사칙연산, 제곱과 같이 수학적인 연산을 말합니다. 비교연산은 크기를 비교하는 연산이고, 참 또는 거짓값을 반환합니다. 목차를 가져와서 오늘 배울 내용을 알아봅시다. 1교시) 강의 소개 2교시) R설치, R스튜디오 설치 3교시) 자료형 4교시) 변수 5교시) 자료구조 6교시) 연산자(산술,비교,논리) 7교시) 조건문, 반복문 8교시) 함수, 패키지 9교시) 그래프(박스플롯), t검정 10교시) 단축키 소개 및 전체요약 오늘 배울 내용은 조건문과 반복문입니다. '문'이라는 말이 붙어있는데요. 문장이라는 뜻입니다. 조건문은 조건이 들어있는 문장, 반복문은 반복이 들어있는 문장이라.. 2022. 11. 12.
[하루만에 끝내는 R기초] 5교시. 자료구조 지난시간에는 변수가 무엇인지 배웠습니다. 변수에 원하는 값을 입력해 놓고 사용할 수 있었습니다. 목차를 한번 더 꺼내봅시다. 1교시) 강의 소개 2교시) R설치, R스튜디오 설치 3교시) 자료형 4교시) 변수 5교시) 자료구조 6교시) 연산자(산술,비교,논리) 7교시) 조건문, 반복문 8교시) 함수, 패키지 9교시) 그래프(박스플롯), t검정 10교시) 단축키 소개 및 전체요약 오늘은 자료구조를 배울 것입니다. 먼저 지난시간에 사용한 데이터를 가져옵시다. 김함수/남/35/183/72 박산술/남/27/177/69 이비교/남/42/175/78 송논리/여/33/167/58 최검정/여/25/155/47 유반복/여/47/173/65 지난시간에 우리는 사람의 이름을 변수로 입력했습니다. 사람 이름 마다 하나씩 변수.. 2022. 11. 11.
[하루만에 끝내는 R기초] 4교시. 변수 지난시간에는 자료형이 무엇인지 배웠습니다. 자료형에는 숫자형, 문자형, 논리형이 있습니다. 문자형은 따옴표를 사용하여 입력하고, 논리형은 TRUE와 FALSE가 있습니다. 목차를 한번 더 꺼내봅시다. 1교시) 강의 소개 2교시) R설치, R스튜디오 설치 3교시) 자료형 4교시) 변수 5교시) 자료구조 6교시) 연산자(산술,비교,논리) 7교시) 조건문, 반복문 8교시) 함수, 패키지 9교시) 그래프(박스플롯), t검정 10교시) 단축키 소개 및 전체요약 오늘은 변수라는 것을 배울겁니다. 변수는 R에서 없어서는 안되는 존재입니다. 변수가 있기 때문에 코딩이 아주 편해졌습니다. R콘솔에 숫자 하나를 입력해봅시다. 우리가 100을 입력하면, 컴퓨터 메모리 어딘가에 100이 저장됩니다. 하지만 이렇게 저장된 10.. 2022. 11. 11.
[하루만에 끝내는 R기초] 3교시. 자료형 지난 시간에는 R과 R스튜디오를 설치했습니다. 목차를 한번 더 꺼내봅시다. 1교시) 강의 소개 2교시) R설치, R스튜디오 설치 3교시) 자료형 4교시) 변수 5교시) 자료구조 6교시) 연산자(산술,비교,논리) 7교시) 조건문, 반복문 8교시) 함수, 패키지 9교시) 그래프(박스플롯), t검정 10교시) 단축키 소개 및 전체요약 오늘은 3교시구요. 자료형에 대해서 배울겁니다. R을 다 배운 뒤에 R로 하게될 일을 생각해봅시다. 아마도 데이터를 가지고 그래프를 그리고 통계검정을 하레 될겁니다. 이 일을 하려면 먼저 데이터를 R에 입력해야 합니다. 우리가 사용하는 데이터는 숫자 아니면 문자입니다. 아래 데이터를 봅시다. 김함수/남/35/183/72 박산술/남/27/177/69 이비교/남/42/175/78 송.. 2022. 11. 11.
[하루만에 끝내는 R기초] 2교시. R설치, R스튜디오 설치 R을 배우려면 먼저 R을 설치해야합니다. R과 R스튜디오를 설치할 것입니다. R스튜디오는 R을 편하게 쓸 수 있도록 만들어진 소프트웨어입니다. R스튜디오는 R이 설치되어 있어야 사용이 가능합니다. R을 먼저 설치합시다. 제가 사용하는 운영체제는 윈도우라서 윈도우를 기준으로 설명하겠습니다. 1. R설치 구글에 R download 라고 검색합니다. 가장 처음나오는 링크에 들어갑니다. Download R-4.2.2 for Windows 가 보이시죠. 클릭하면 다운로드가 시작됩니다. 다운로드가 완료되면 설치파일을 실행합니다. '다음'을 계속 누르며 진행하면 됩니다. 이번에는 R스튜디오를 설치합시다. 2. R스튜디오 설치 구글에 rstudio desktop download 를 검색합니다. 가장 처음 나오는 링크로.. 2022. 11. 11.
[하루만에 끝내는 R기초] 1교시. 강의 소개 하루만에 끝내는 R기초 강의입니다. 본 강의는 R을 처음 접하는 분들을 대상으로 만들었습니다. R이라는 언어의 핵심적인 기능들 위주로 설명할 것이구요. 너무 복잡한 내용은 다루지 않을겁니다. 가볍게 R의 전반적인 내용을 살펴본다는 생각으로 들어주시면 됩니다. 총 10교시로 구성되구요. 하루만에 전부 들을 수 있는 러닝타임으로 기획한 강의입니다. 이번 시간은 1교시입니다. 어떤 강의인지 간단히 소개하는 시간입니다. 통계분석을 할 수 있는 대표적인 소프트웨어는 엑셀, SPSS, R 이 있습니다. 기본적인 통계분석은 엑셀로도 가능한데 없는 기능이 많습니다. 그래서 보통 엑셀을 처음에 쓰다가 SPSS나 R로 갈아타게 되죠. 엑셀과 SPSS는 버튼을 눌러서 통계분석을 하게됩니다. 순서 대로 버튼만 누르면 되기 때.. 2022. 11. 11.
[R 코딩 연습문제] 함수 사용 문제 아래와 같은 데이터프레임을 입력받아서, > df_wh w h 1 63 163 2 67 177 3 88 185 아래 결과를 출력하는 함수를 만드시오. > bmi2(df_wh) w h bmi 1 63 163 23.71184 2 67 177 21.38594 3 88 185 25.71220 정답 w=c(63,67,88) h=c(163,177,185) df_wh=data.frame(w,h) bmi1=function(myvec) { return(myvec[1]/myvec[2]^2*1e4) } bmi2=function(mydf) { bmi=apply(mydf,1,bmi1) result=cbind(df_wh,bmi) return(result) } 2022. 11. 7.
[R 코딩 연습문제] 누적분포 그래프 그리기 (R 코딩실력 향상을 위한 연습문제입니다.) Question 아래 데이터의 누적분포 그래프를 그리시오. 1,2,7,8,10,11,13,15,17,19 Answer data=c(1,2,7,8,10,11,13,15,17,19) cd=1:length(data)/length(data) plot(data,cd) 2022. 5. 13.
[R 코딩 연습문제] 가장 가까운 원소 인덱스 출력 (R 코딩실력 향상을 위한 연습문제입니다.) Question 주어진 데이터는 아래와 같다. data=1:100 1~100 사이의 임의의 실수가 주어졌을 때 해당 값과 가장 가까운 data 원소의 index 를 출력하는 코드를 작성하시오. 가장 가까운 숫자가 두개인 경우 둘 중 아무거나 출력해도 됩니다. Answer data=1:100 a=24.5 order(abs(data-a))[1] 2022. 5. 11.
[R 코딩 연습문제] 두배씩 커지는 수열 만들기 (R 코딩실력 향상을 위한 연습문제입니다.) Question 특정한 숫자로 부터 두배씩 커지는 수열을 만드시오. 시작 숫자와 원소의 개수를 설정할 수 있도록 하시오. Answer sequence=10 length=5 for (i in 1:length){ sequence[i+1]=sequence[i]*2 } 출력결과 > sequence [1] 10 20 40 80 160 320 2022. 5. 5.
[R강의] 999. 평균절대편차, 중앙값절대편차 구하는 법 1) 중앙값 절대편차 (median absolute deviation, mad) mad 함수 사용 > dt=c(1,2,3,4,50) > mad(dt) [1] 1.4826 2) 평균 절대편차 (average absolute deviation, aad) lsr 패키지 필요 install.packages("lsr") library(lsr) aad 함수 사용 > dt=c(1,2,3,4,50) > aad(dt) [1] 15.2 2022. 4. 30.
반응형