이번시간에는 데이터프레임에 사용하는 유용한 함수를 알아봅시다.
1교시. 강의 소개
2교시. 데이터프레임 정의하고 행이름, 열이름 바꾸기
3교시. 유용한 기본함수 (tail, head, str, dim)
4교시. 벡터의 인덱싱
5교시. 데이터 프레임 원소에 접근하기 (데이터프레임 인덱싱)
6교시. 데이터프레임 열과 행에 접근하기
7교시. 데이터프레임 행 또는 열 제거, 추가, 변경하기
8교시. 특정 조건으로 데이터프레임 추리기
9교시. 여러 데이터프레임 결합하기
10교시. 엑셀파일을 데이터프레임으로 불러오기
네 가지 함수를 배워볼 건데요. tail, haed, str, dim 입니다. 간단한 설명은 아래와 같습니다.
tail : 데이터프레임의 앞부분 출력
head : 데이터프레임 뒷부분 출력
str : 데이터 프레임 구조를 한눈에 보기
dim : 데이터프레임의 차원 출력 (열의 수,행의 수)
1. head
head 함수는 데이터프레임의 앞부분을 출력합니다. iris 라는 내장데이터에 head 함수를 적용한 결과는 아래와 같습니다.
> head(iris)
Sepal.Length Sepal.Width Petal.Length Petal.Width Species
1 5.1 3.5 1.4 0.2 setosa
2 4.9 3.0 1.4 0.2 setosa
3 4.7 3.2 1.3 0.2 setosa
4 4.6 3.1 1.5 0.2 setosa
5 5.0 3.6 1.4 0.2 setosa
6 5.4 3.9 1.7 0.4 setosa
기본적으로 여섯 행이 출력됩니다. 아래와 같이 출력되는 행의 수를 바꿀 수도 있습니다.
> head(iris,3)
Sepal.Length Sepal.Width Petal.Length Petal.Width Species
1 5.1 3.5 1.4 0.2 setosa
2 4.9 3.0 1.4 0.2 setosa
3 4.7 3.2 1.3 0.2 setosa
2. tail
tail 함수는 데이터프레임의 앞부분을 출력합니다. iris 라는 내장데이터에 tail 함수를 적용한 결과는 아래와 같습니다.
> tail(iris)
Sepal.Length Sepal.Width Petal.Length Petal.Width Species
145 6.7 3.3 5.7 2.5 virginica
146 6.7 3.0 5.2 2.3 virginica
147 6.3 2.5 5.0 1.9 virginica
148 6.5 3.0 5.2 2.0 virginica
149 6.2 3.4 5.4 2.3 virginica
150 5.9 3.0 5.1 1.8 virginica
기본적으로 여섯 행이 출력됩니다. 아래와 같이 출력되는 행의 수를 바꿀 수도 있습니다.
> tail(iris,3)
Sepal.Length Sepal.Width Petal.Length Petal.Width Species
148 6.5 3.0 5.2 2.0 virginica
149 6.2 3.4 5.4 2.3 virginica
150 5.9 3.0 5.1 1.8 virginica
3. str 함수
str 함수는 데이터프레임의 구조를 한 눈에 볼 수 있는 정보를 출력합니다. iris데이터에 str 함수를 적용한 결과는 아래와 같습니다.
> str(iris)
'data.frame': 150 obs. of 5 variables:
$ Sepal.Length: num 5.1 4.9 4.7 4.6 5 5.4 4.6 5 4.4 4.9 ...
$ Sepal.Width : num 3.5 3 3.2 3.1 3.6 3.9 3.4 3.4 2.9 3.1 ...
$ Petal.Length: num 1.4 1.4 1.3 1.5 1.4 1.7 1.4 1.5 1.4 1.5 ...
$ Petal.Width : num 0.2 0.2 0.2 0.2 0.2 0.4 0.3 0.2 0.2 0.1 ...
$ Species : Factor w/ 3 levels "setosa","versicolor",..: 1 1 1 1 1 1 1 1 1 1 ...
데이터프레임이 어떤 열들로 구성되어 있으며, 각각의 열들은 어떤 자료형을 갖는지 출력해줍니다.
4. dim 함수
dim 함수는 데이터프레임의 차원을 출력해줍니다. 여기서 차원이랑 행과 열의 수를 말합니다. iris 데이터에 dim 함수를 적용한 결과는 아래와 같습니다.
> dim(iris)
[1] 150 5
iris 데이터가 150개의 행과 5개의 열로 구성되어 있다는 것을 알 수 있습니다.
'R특강 > 하루만에 끝내는 R 데이터프레임' 카테고리의 다른 글
[하루만에 끝내는 R 데이터프레임] 6. 데이터프레임 행과 열에 접근하기 (데이터프레임 열/행 인덱싱) (0) | 2023.07.06 |
---|---|
[하루만에 끝내는 R 데이터프레임] 5. 데이터프레임 원소에 접근하는 방법 (1) | 2023.06.16 |
[하루만에 끝내는 R 데이터프레임] 4. 벡터의 인덱싱 (0) | 2023.06.02 |
[하루만에 끝내는 R 데이터프레임] 2. 데이터프레임 정의하고 열이름, 행이름 바꾸기 (0) | 2023.06.02 |
[하루만에 끝내는 R 데이터프레임] 1. 강의 소개 (0) | 2023.06.02 |
댓글