[R강의] 139. 데이터프레임 열이름, 행이름 출력하고 수정하기
데이터프레임을 하나 정의합시다. A=c(1,2,3) B=c(4,5,6) C=c(7,8,9) df=data.frame(A,B,C) > df A B C 1 1 4 7 2 2 5 8 3 3 6 9 열 이름은 names 함수로 가져옵니다. > names(df) [1] "A" "B" "C" 행이름은 rownames 로 가져옵니다. > rownames(df) [1] "1" "2" "3" 열 이름과 행 이름을 수정하는 방법은 아래와 같습니다. names(df)=c('C1','C2','C3') rownames(df)=c('R1','R2','R3') > df C1 C2 C3 R1 1 4 7 R2 2 5 8 R3 3 6 9
2023. 2. 3.
[ggplot2의 이해] 3. 산점도 (geom_point)
1. 산점도 그리기 내장데이터인 iris 를 이용하여 산점도를 그려보았습니다. 주요한 옵션들만 넣었습니다. 주요 옵션은 제목, 축이름, 서식, 가운데정렬입니다. 설명은 주석으로 대신합니다. library(tidyverse) ggplot(data=iris,aes(x=Sepal.Length,y=Sepal.Width))+ geom_point()+ labs(title="geom_point",x='Sepal Length',y='Sepal Width')+ #제목, 축이름 theme(title = element_text(size=20,face='bold'))+ #제목 서식 theme(axis.title = element_text(size=10,face='bold'))+ #축서식 theme(plot.title = el..
2023. 2. 3.
[R강의] 138. 데이터프레임 행 추가할 때 리스트를 사용해야하는 이유
데이터프레임에 행을 추가할 때 왜 리스트를 사용해야 하는지 이야기해보려고 합니다. 먼저 데이터프레임을 하나 정의하겠습니다. name=c('KYS','OJH','PSK') gender=c('M','F','M') height=c(182,165,177) df=data.frame(name,gender,height,stringsAsFactors=FALSE) > df name gender height 1 KYS M 182 2 OJH F 165 3 PSK M 177 1열은 이름, 2열은 성별, 3열은 키입니다. 사람 한명의 정보를 더 추가하고 싶은 상황입니다. 가장 쉽게 떠오르는 방법은 인덱싱을 통해 추가하는 것입니다. 아래와 같이 추가할 수 있습니다. > df[4,]=c('CYR','F',163) > df name..
2023. 1. 31.
[R강의] 137. 데이터프레임 결합의 끝판왕 (merge)
merge 함수는 두 데이터프레임을 합쳐주는 함수입니다. rbind 보다는 cbind 와 유사한데요. cbind와 구벌되는 점은 특정 열을 기준으로 하여 합친다는 것입니다. 총 네가지 방법이 있는데요. 그림을 보면 쉽게 이해가 되실겁니다. 데이터프레임을 가지고 직접 해봅시다. 사용할 두 데이터는 아래와 같습니다. A=data.frame(id=c(1,2,3),weight=c(78,88,98),height=c(170,175,180)) B=data.frame(id=c(2,3,4),math=c(75,85,85),eng=c(100,85,60)) 콘솔창에 입력해보면 아래와 같습니다. > A id weight height 1 1 78 170 2 2 88 175 3 3 98 180 > B id math eng 1 2 ..
2023. 1. 31.
[R강의] 136. rbind로 데이터프레임들 결합할 때, 구분하는 열 추가하기
데이터프레임을 두개 만들어봅시다. 하나는 남자의 키와 몸무게이고, 하나는 여자의 키와 몸무게 입니다. weight=c(78,88,98) height=c(170,175,180) male_df=data.frame(weight,height) weight=c(48,58,68) height=c(150,160,170) female_df=data.frame(weight,height) 우리는 두 데이터프레임을 합치고 싶은 상태인데요. 데이터프레임이 합쳐진 후에도 남녀를 구분하고 싶습니다. 각 데이터프레임에 열을 하나씩 추가합시다. 아래와 같이 입력합니다. male_df['gender']='M' female_df['gender']='F' 각 데이터프레임은 아래와 같이 변했습니다. > male_df weight heigh..
2023. 1. 31.
[R강의] 135. 데이터프레임을 열로 결합하기 (cbind)
데이터프레임을 열로 결합하는 방법을 알아봅시다. 열로 결합한다는 것은 아래와 같은 결합을 뜻합니다. 이때 cbind 함수가 사용됩니다. cbind 는 column(열) 을 bind(결합하다) 를 의미합니다. cbind 를 사용하려면 합치려는 데이터프레임들의 '행 개수'가 같아야 합니다. 아래와 같은 데이터프레임이 있다고 합시다. A 반 학생 세명의 번호, 몸무게, 키입니다. A=data.frame(id=c(1,2,3), weight=c(78,88,98), height=c(170,175,180)) > A id weight HEight 1 1 78 170 2 2 88 175 3 3 98 180 아래와 같이 학생들의 수학,영어 점수를 추가로 조사하였다고 합시다. A2=data.frame(math=c(75,80..
2023. 1. 25.
[R강의] 134. 데이터프레임 열이름이 다른 경우 rbind 적용하기
rbind 함수는 데이터프레임들의 행을 결합하는 함수입니다. 데이터프레임들의 열 이름이 같아야 사용이 가능합니다. 변수 종류는 같은데 열 이름이 다르게 쓰여진 경우에 rbind 함수를 적용하는 방법을 알아봅시다. 아래와 같은 두 데이터프레임이 있습니다. A=data.frame(id=c(1,2,3), weight=c(78,88,98), HEight=c(170,175,180)) B=data.frame(id=c(4,5,6), weight=c(58,68,78), height=c(140,155,160)) > A id weight HEight 1 1 78 170 2 2 88 175 3 3 98 180 > B id weight height 1 4 58 140 2 5 68 155 열 이름이 달라서 rbind 함수 적용..
2023. 1. 25.
[R강의] 133. 데이터프레임을 행으로 결합하기 (rbind)
데이터프레임을 행으로 결합하는 방법을 알아봅시다. 행으로 결합한다는 것은 아래와 같은 결합을 뜻합니다. 이때 rbind 함수가 사용됩니다. rbind 는 row(행) 을 bind(결합하다) 를 의미합니다. rbind 를 사용하려면 합치려는 데이터프레임들의 '열 이름'이 같아야 합니다. R코드로 예를 들어봅시다. 두개의 데이터 프레임을 생성합시다. A=data.frame(id=c(1,2,3), weight=c(78,88,98), height=c(170,175,180)) B=data.frame(id=c(4,5,6), weight=c(58,68,78), height=c(140,155,160)) 콘솔창에 출력해보면 아래와 같습니다. > A id weight height 1 1 78 170 2 2 88 175 3..
2023. 1. 24.
[R강의] 132. 여러 점들 사이의 거리 한번에 구하는 법 (dist함수)
아래와 같이 5개의 점이 있다고 합시다. P1=c(1,2,3) P2=c(3,5,2) P3=c(5,5,4) P4=c(1,4,7) P5=c(2,2,4) 이들 중 어느 두 점이 가장 가까운 거리에 있는지 알고 싶은 상황입니다. 유클리드 거리를 행렬 형태로 출력해주는 함수가 있습니다. dist 함수입니다. 먼저 위 점들을 하나의 행렬로 묶어줍니다. mat1=matrix(c(P1,P2,P3,P4,P5),byrow=TRUE,nrow=5) > mat1 [,1] [,2] [,3] [1,] 1 2 3 [2,] 3 5 2 [3,] 5 5 4 [4,] 1 4 7 [5,] 2 2 4 위에서 만든 행렬에 dist 함수를 적용해봅시다. > dist(mat1) 1 2 3 4 2 3.741657 3 5.099020 2.828427 ..
2022. 12. 23.
[R강의] 131. 연속형 변수를 구간에 따라 범주형 변수로 바꾸는 방법
점수를 학점으로 바꿔봅시다. 바꾸는 기준은 아래와 같습니다. 점수는 연속형 변수이고, 학점은 범주형 변수입니다. R에는 위와 같이 범위로 표현된 연속형 변수를 범주형 변수로 바꿔주는 함수가 있습니다. cut 함수를 사용합니다. 먼저 데이터를 생성합시다. 10명의 점수를 생성하겠습니다. num은 번호이고 score 은 점수입니다. #데이터 생성 num=1:10 score=c(78,62,65,94,71,97,57,83,71,100) md=data.frame(num,score) > md num score 1 1 78 2 2 62 3 3 65 4 4 94 5 5 71 6 6 97 7 7 57 8 8 83 9 9 71 10 10 100 cut 함수는 아래와 같이 사용합니다. #점수를 학점으로 변환 gpa=cut(..
2022. 12. 23.
[하루만에 끝내는 R기초] 9교시. 그래프, t검정
지난시간에 함수와 패키지를 배웠습니다. R의 기본적인 내용은 다 배운 것 입니다. 목차를 가져와서 오늘 배울 내용이 무엇인지 알아봅시다. 1교시) 강의 소개 2교시) R설치, R스튜디오 설치 3교시) 자료형 4교시) 변수 5교시) 자료구조 6교시) 연산자(산술,비교,논리) 7교시) 조건문, 반복문 8교시) 함수, 패키지 9교시) 그래프(박스플롯), t검정 10교시) 단축키 소개 및 전체요약 오늘은 그래프를 그려보고, t검정을 해보려고 합니다. R이 실제 업무에 사용되는 상황을 맛보는 시간입니다. 통계를 잘 모르시는 분들은 이해가 잘 안되는 부분이 많을 텐데요. 미리 경험해본다고 생각하고 한번 따라해봅시다. 4강에서 만든 데이터를 가져옵시다. name=c('김함수','박산술','이비교','송논리','최검정..
2022. 11. 19.
[하루만에 끝내는 R기초] 7교시. 조건문,반복문
지난시간에는 연산자를 배웠습니다. 연산자에는 산술, 비교, 논리연산자 있었는데요. 산술연산자와 비교연산자만 배웠습니다. 산술연산자는 사칙연산, 제곱과 같이 수학적인 연산을 말합니다. 비교연산은 크기를 비교하는 연산이고, 참 또는 거짓값을 반환합니다. 목차를 가져와서 오늘 배울 내용을 알아봅시다. 1교시) 강의 소개 2교시) R설치, R스튜디오 설치 3교시) 자료형 4교시) 변수 5교시) 자료구조 6교시) 연산자(산술,비교,논리) 7교시) 조건문, 반복문 8교시) 함수, 패키지 9교시) 그래프(박스플롯), t검정 10교시) 단축키 소개 및 전체요약 오늘 배울 내용은 조건문과 반복문입니다. '문'이라는 말이 붙어있는데요. 문장이라는 뜻입니다. 조건문은 조건이 들어있는 문장, 반복문은 반복이 들어있는 문장이라..
2022. 11. 12.
[하루만에 끝내는 R기초] 6교시. 연산자 (산술,비교,논리)
목차를 가져와서 오늘 배울 내용이 무엇인지 알아봅시다 . 1교시) 강의 소개 2교시) R설치, R스튜디오 설치 3교시) 자료형 4교시) 변수 5교시) 자료구조 6교시) 연산자(산술,비교,논리) 7교시) 조건문, 반복문 8교시) 함수, 패키지 9교시) 그래프(박스플롯), t검정 10교시) 단축키 소개 및 전체요약 우리는 지금까지 자료형, 변수, 자료구조를 배웠습니다. 오늘 배울 내용은 연산자입니다. 연산자는 연산을 수행하게 해주는 것을 말합니다. 연산은 둘 이상의 대상을 조작하여 새로운 것을 만들어 내는 것을 말합니다. 이렇게 말하면 어려운데요. 예시를 하나 말씀드리면 쉽게 이해할 수 있을겁니다. 대표적인 연산에는 덧셈이 있습니다. 덧셈이라는 연산에서 연산자는 + 입니다. 연산과 연산자가 무엇인지 이해되시..
2022. 11. 12.