본문 바로가기
반응형

R기초8

[R강의] 136. rbind로 데이터프레임들 결합할 때, 구분하는 열 추가하기 데이터프레임을 두개 만들어봅시다. 하나는 남자의 키와 몸무게이고, 하나는 여자의 키와 몸무게 입니다. weight=c(78,88,98) height=c(170,175,180) male_df=data.frame(weight,height) weight=c(48,58,68) height=c(150,160,170) female_df=data.frame(weight,height) 우리는 두 데이터프레임을 합치고 싶은 상태인데요. 데이터프레임이 합쳐진 후에도 남녀를 구분하고 싶습니다. 각 데이터프레임에 열을 하나씩 추가합시다. 아래와 같이 입력합니다. male_df['gender']='M' female_df['gender']='F' 각 데이터프레임은 아래와 같이 변했습니다. > male_df weight heigh.. 2023. 1. 31.
[R강의] 135. 데이터프레임을 열로 결합하기 (cbind) 데이터프레임을 열로 결합하는 방법을 알아봅시다. 열로 결합한다는 것은 아래와 같은 결합을 뜻합니다. 이때 cbind 함수가 사용됩니다. cbind 는 column(열) 을 bind(결합하다) 를 의미합니다. cbind 를 사용하려면 합치려는 데이터프레임들의 '행 개수'가 같아야 합니다. 아래와 같은 데이터프레임이 있다고 합시다. A 반 학생 세명의 번호, 몸무게, 키입니다. A=data.frame(id=c(1,2,3), weight=c(78,88,98), height=c(170,175,180)) > A id weight HEight 1 1 78 170 2 2 88 175 3 3 98 180 아래와 같이 학생들의 수학,영어 점수를 추가로 조사하였다고 합시다. A2=data.frame(math=c(75,80.. 2023. 1. 25.
[하루만에 끝내는 R기초] 4교시. 변수 지난시간에는 자료형이 무엇인지 배웠습니다. 자료형에는 숫자형, 문자형, 논리형이 있습니다. 문자형은 따옴표를 사용하여 입력하고, 논리형은 TRUE와 FALSE가 있습니다. 목차를 한번 더 꺼내봅시다. 1교시) 강의 소개 2교시) R설치, R스튜디오 설치 3교시) 자료형 4교시) 변수 5교시) 자료구조 6교시) 연산자(산술,비교,논리) 7교시) 조건문, 반복문 8교시) 함수, 패키지 9교시) 그래프(박스플롯), t검정 10교시) 단축키 소개 및 전체요약 오늘은 변수라는 것을 배울겁니다. 변수는 R에서 없어서는 안되는 존재입니다. 변수가 있기 때문에 코딩이 아주 편해졌습니다. R콘솔에 숫자 하나를 입력해봅시다. 우리가 100을 입력하면, 컴퓨터 메모리 어딘가에 100이 저장됩니다. 하지만 이렇게 저장된 10.. 2022. 11. 11.
R의 lapply 함수(리스트에 원하는 함수를 원하는 방향으로 적용) lapply 함수는 리스트에 원하는 함수를 카테고리마다 적용해줍니다. 예를들어봅시다. 아래와 같은 데이터가 있습니다. 어떤 반의 인원이 다섯명이고, 다섯사람이 세과목의 시험을 본 결과 데이터입니다. > Math=c(94,82,45,55,67) > English=c(88,86,56,90,50) > Science=c(87,76,65,43,55) 리스트에 넣었습니다. > Li1=list(Math=Math,English=English,Science=Science) > Li1 $Math [1] 94 82 45 55 67 $English [1] 88 86 56 90 50 $Science [1] 87 76 65 43 55 laaply 함수를 적용해봅시다. 각 카테고리별로 평균이 구해지고, 결과가 리스트 형태로 출력됩.. 2021. 3. 18.
R의 apply 함수(함수를 배열에 원하는 방향으로 적용) apply 함수는 벡터,행렬,배열에 원하는 함수를 원하는 방향으로 적용해줍니다. 예를들어봅시다. 아래와 같은 데이터가 있습니다. 어떤 반의 인원이 다섯명이고, 다섯사람이 세과목의 시험을 본 결과 데이터입니다. > Math=c(94,82,45,55,67) > English=c(88,86,56,90,50) > Science=c(87,76,65,43,55) 데이터프레임에 넣었습니다. > DF1=data.frame(Math,English,Science) > DF1 Math English Science 1 94 88 87 2 82 86 76 3 45 56 65 4 55 90 43 5 67 50 55 apply 함수를 적용해봅시다. apply함수는 아래와 같은 형식으로 입력합니다. apply(데이터, 방향, 함수).. 2021. 3. 18.
R에서 날짜 데이터의 연산하기 날짜 데이터를 만들어봅시다. > d1=as.Date("1919-04-13") 날짜데이터에 자연수를 더하거나 뻬는 연산이 가능합니다. 실수와 무리수로도 가능합니다. > d1+1 [1] "1919-04-14" > d1-23 [1] "1919-03-21" > d1+sqrt(2) [1] "1919-04-14" 곱셈과 나눗셈은 불가능합니다. > d1*3 Error in Ops.Date(d1, 3) : * not defined for "Date" objects > d1/2 Error in Ops.Date(d1, 2) : / not defined for "Date" objects 이번에는 두개의 날짜데이터를 만들어봅시다. d1은 대한민국 임시정부수립일이고 d2는 오늘 날짜입니다. > d1=as.Date("1919-0.. 2021. 3. 18.
R에서 날짜데이터 입력하기 (as.Date) R에서 날짜를 입력할 때는 일반적으로 아래와 같은 표기를 사용합니다. 2018-12-25 문자열을 이용해서 입력하고, as.Date 함수를 이용하여 문자열을 날짜 타입으로 변형해줍니다. > a=c("2018-12-21") > b=as.date(a) 정의한 벡터의 이름을 입력해 보면 둘의 차이를 알 수 없습니다. > b [1] "2018-12-21" > a [1] "2018-12-21" str 함수를 이용하면 날짜로 타입이 바뀐 것을 알 수 있습니다. > str(a) chr "2018-12-21" > str(b) Date[1:1], format: "2018-12-21" as.Date 함수에 사용되는 옵션을 알아봅시다. as.Date(x, format, tryFormats = c("%Y-%m-%d", "%Y.. 2021. 3. 18.
R에서 시간데이터로 산점도 그리기 시간데이터를 다뤄야 하는 상황이 있습니다. 예를들어 아래와 같이 제품의 판매시간-판매량이 표로 정리되어 있고 이 표를 가지고 그래프를 그리고 싶다고 해봅시다. Time Sales_Volume 2018-10-21 08:23:12 1 2018-10-28 15:33:55 5 2018-11-02 13:23:52 12 2018-11-08 17:12:01 3 2018-12-12 10:08:01 7 판매량은 숫자벡터로 입력하면 되는데, 시간의 경우는 조금 복잡합니다. 먼저 시간을 문자열 벡터로 입력합니다. 입력한 뒤 산점도를 그리겠습니다. > SV=c(1,5,12,3,7) > time=c("2018-10-21 08:23:12","2018-10-28 15:33:55","2018-11-02 13:23:52","2018-.. 2021. 3. 18.
반응형