반응형
formula 가 무엇인지 모르는 분들을 위해 간단히 설명하겠습니다. iris 데이터가 있다고 합시다.
data=iris
iris 데이터에는 아래와 같은 변수들이 있습니다.
> head(iris)
Sepal.Length Sepal.Width Petal.Length Petal.Width Species
1 5.1 3.5 1.4 0.2 setosa
2 4.9 3.0 1.4 0.2 setosa
3 4.7 3.2 1.3 0.2 setosa
4 4.6 3.1 1.5 0.2 setosa
5 5.0 3.6 1.4 0.2 setosa
6 5.4 3.9 1.7 0.4 setosa
Species 를 독립변수로 하여 Sepal.Length 의 boxplot 을 그리고 싶다면 아래와 같은 코드를 사용하면 됩니다.
boxplot(Sepal.Length~Species,data)
위 코드에서 Sepal.Length~Species 가 formula 입니다. 변수가 많은 데이터를 다루다 보면 formula 를 문자열을 이용하여 입력하면 편한 상황들이 있습니다. 위 formula 를 문자열로 입력하는 방법은 아래와 같습니다.
boxplot(eval(parse(text='Sepal.Length~Species')),data)
아래와 같이 boxplot 함수 밖에서 변수로 정의할 수도 있습니다.
a=eval(parse(text='Sepal.Length~Species'))
boxplot(a,data)
반응형
'R 주제 > R 기초 및 통계 강의' 카테고리의 다른 글
[R강의] 175. 데이터프레임에서 특정 값이 포함된 행 제거하기 (0) | 2023.08.29 |
---|---|
[R강의] 174. 특정 문자로 벡터 원소 연결해서 문자열로 만들기 (0) | 2023.08.29 |
[R강의] 173. 데이터프레임 인덱싱에서 df[3, ] 와 df['3', ] 의 차이 (0) | 2023.08.29 |
[R강의] 172. 결측치를 평균값으로 대체하기 (ifelse) (0) | 2023.08.29 |
[R강의] 171. R스튜디오 유용한 단축키 (주석, 줄맞춤, 실행, 콘솔창 지우기) (1) | 2023.08.29 |
댓글