본문 바로가기
반응형

분류 전체보기464

[R강의] 91. 그래프 색칠에 사용하는 polygon 함수 도구 R로 푸는 통계 91. 그래프 색칠에 사용하는 polygon 함수 Polygon함수는 점을 언결하여 다각형을 만들어주는 함수입니다. 다각형 내부 색과 다각형 테두리 색을 설정할 수 있습니다. 저는 함수의 영역을 표시할 때 주로 사용합니다. 예를들면 기각역을 표시할 때 사용합니다. 이번 강의에서는 polygon 함수의 사용 방법을 알아보고 다음 강의에서는 정규분포에 색칠해보겠습니다. 아래와 같이 세 점이 있다고 합시다. (1 2) (6 2) (3 7) 세 점을 연결해 다각형을 만들 것입니다. 연결 순서를 정해봅시다. 아래 순서로 연결하겠습니다. (6 2) (1 2) (3 7) 폴리곤 함수는 아래와 같이 입력합니다. polygon(c(6,1,3),c(2,2,7)) 먼저 x를 연결 순서대로 벡터형태로 입.. 2020. 5. 27.
[R 강의] 90. 결측치를 일괄 변경하는 함수 만들기 도구 R로 푸는 통계 90. 결측치를 일괄 변경하는 함수 만들기 R에서 결측치를 일괄변형해봅시다. 먼저 89강에서 만든 결측치의 위치를 알아내는 함수를 가져옵시다. findNA=function(D) { nrow=dim(D)[1] ncol=dim(D)[2] for (i in 1:nrow) { for (j in 1:ncol) { if (is.na(D[i,j])) { print(paste(i,',',j)) } } } } 이 함수를 아래와 같이 수정하면됩니다. S에 NA를 괄적으로 바꿀 값을 입력합니다. ChangeNA=function(D,S) { nrow=dim(D)[1] ncol=dim(D)[2] for (i in 1:nrow) { for (j in 1:ncol) { if (is.na(D[i,j])) { D.. 2020. 5. 25.
[R 강의] 89. 데이터프레임에서 결측치(NA)의 위치를 알아내기 도구 R로 푸는 통계 89. 데이터프레임에서 결측치(NA)의 위치를 알아내기 결측치가 있는 데이터프레임에서, 결측치 NA의 위치를 "행,열"형태로 출력해봅시다. 예를들어 3행 2열에 결측치가 있다면 "3,2"가 출력되는 것입니다. 설명은 주석으로 대신합니다. #먼저 결측치가 들어있는 벡터를 2개 정의합시다. V1=c(1,2,3,NA,5) V2=c(1,2,NA,NA,3) #벡터 2개를 이용하여 데이터프레임을 만들겠습니다. df=data.frame(V1,V2) #dim 함수를 이용하여 데이터프레임의 행과 열의 수를 알아냅니다. dim(df)[1] 은 행의 수 입니다. dim(df)[2]는 열의 수 입니다. nrow=dim(df)[1] ncol=dim(df)[2] #For문을 이중으로 사용할 것입니다. i가 .. 2020. 5. 22.
[R 강의] 88. 히스토그램 여러 개 겹쳐서 그리는 방법 도구 R로 푸는 통계 88. 히스토그램 여러 개 겹쳐서 그리는 방법 히스토그램 2개를 겹쳐서 그려보겠습니다. 3개 이상에도 동일한 방법이 적용됩니다. 설명은 주석으로 대체합니다.   #데이터 생성하기. 정규분포에서 임의추출하여 데이터 생성.M_H=rnorm(500,170,5)F_H=rnorm(500,160,5)#x 축 범위 설정x_range=seq(130,200,by=2)#히스토그램 만들어서 저장, plot=FALSE로 설정하여 그려지지 않게함M_H_hist=hist(M_H, breaks=x_range, plot = FALSE)F_H_height_hist=hist(F_H, breaks=x_range, plot = FALSE)#y축 범위 설정을 위해 y축 최댓값을 찾아줌y_max=max(max(male_h.. 2020. 5. 19.
[R 강의] 87. 마진(margin)과 테두리 선 넣기 도구 R로 푸는 통계 87. 마진(margin)과 테두리 선 넣기 마진은 '여백'을 의미합니다. R에는 두가지 마진이 있습니다 inner margin과 outer margin입니다. 주석을 통해 설명드리겠습니다. #mar은 inner margin 의 아래,왼쪽,위,오른쪽 간격을 설정합니다. #oma는 outer margin의 아래,왼쪽,위,오른쪽 간격을 설정합니다. #mar default c(5.1, 4.1, 4.1, 2.1) #oma default c(0,0,0,0) par(mar=c(6,6,6,6), oma=c(4,4,4,4)) #아무 그래프나 그렸습니다 plot(1,type="n",xlim=c(0,5),ylim=c(0,5)) #mtest는 margin에 text를 표시합니다. #outer=FALSE.. 2020. 5. 18.
[R 강의] 86. 결측치(NA) 확인, 제거, 수정하는 방법 도구 R로 푸는 통계 86. 결측치(NA) 확인, 제거, 수정하는 방법 오늘 사용할 데이터입니다. C1=c(1,2,NA,NA,5) C2=(1,2,3,4,5) C3=(NA,2,3,4,5) md=data.frame(C1,C2,C3) > md C1 C2 C3 1 1 1 NA 2 2 2 2 3 NA 3 3 4 NA 4 4 5 5 5 5 1) 결측치 확인 결측치를 확인할 때는 is.na( ) 함수를 사용합니다. 위 데이터프레임에 적용해봅시다. C1=c(1,2,NA,NA,5) C2=(1,2,3,4,5) C3=(NA,2,3,4,5) md=data.frame(C1,C2,C3) > is.na(md) C1 C2 C3 [1,] FALSE FALSE TRUE [2,] FALSE FALSE FALSE [3,] TRUE FALS.. 2020. 5. 15.
[엑셀 통계] 39. 엑셀로 대응표본 t검정을 직접 정의 해보자!! 도구 엑셀로 푸는 통계 39. 엑셀로 대응표본 t검정을 직접 정의 해보자!! *사용된 데이터는 글의 끝 부분에 첨부되어 있습니다. 엑셀에서는 통계 데이터분석 도구를 이용하여 t검정을 할 수 있습니다. t검정은 크게 둘로 나뉩니다. - 독립표본 t검정 : 서로 독립인 두 집단의 평균 비교(F검정 결과에 따라 등분산가정, 이분산가정으로 나뉨) - 대응표본 t검정 : 서로 쌍을 이루는 두 집단의 평균을 비교, 어떤 처리 전,후 평균을 비교하는 것임. 오늘은 대응표본 t검정을 직접 정의해보겠습니다. 대응표본 t검정은 처리전과 처리후를 비교할 때 사용합니다. 예를 들면 아래와 같습니다. - 키크는 약 복용 전과 후 키가 컸는가? - 탈모제 복용 후 모발양이 증가했는가? 대응표본 t검정을 위해서는 t통계량을 알아야.. 2020. 5. 8.
[엑셀 통계] 38. 엑셀로 독립표본 t검정을 직접 정의 해보자!!(이분산 가정) 도구 엑셀로 푸는 통계 38. 엑셀로 독립표본 t검정을 직접 정의 해보자!!(이분산 가정) *사용된 데이터는 글의 끝 부분에 첨부되어 있습니다. 엑셀에서는 통계 데이터분석 도구를 이용하여 독립표본 t검정을 할 수 있습니다. 오늘은 데이터 분석도구를 사용하지 않고 독립표본 t검정을 해보도록 하겠습니다. 엑셀 독립표본 t검정은 두 가지가 있습니다. - 등분산 가정 두집단 (F검정 기각되지 않음) - 이분산 가정 두집단 (F검정 기각됨) 이번강의에서는 이분산 가정 두 집단의 독립표본 t 검정을 해보겠습니다. t검정을 위해서는 t통계량과 자유도를 알아야 합니다. 두 표본의 크기가 n1과 n2라고 한다면 자유도는 아래와 같습니다. 이번에는 t통계량을 구해봅시다. t 통계량은 아래와 같이 구합니다. (xbar1은 .. 2020. 5. 7.
[엑셀 통계] 37. 엑셀로 독립표본 t검정을 직접 정의 해보자!!(등분산 가정) 도구 엑셀로 푸는 통계 37. 엑셀로 독립표본 t검정을 직접 정의 해보자!!(등분산 가정) *사용된 데이터는 글의 끝 부분에 첨부되어 있습니다. 엑셀에서는 통계 데이터분석 도구를 이용하여 독립표본 t검정을 할 수 있습니다. 오늘은 데이터 분석도구를 사용하지 않고 독립표본 t검정을 해보도록 하겠습니다. 엑셀 독립표본 t검정은 두 가지가 있습니다. - 등분산 가정 두집단 (F검정 기각되지 않음) - 이분산 가정 두집단 (F검정 기각됨) 이번강의에서는 등분산 가정 두 집단의 독립표본 t 검정을 해보겠습니다. t검정을 위해서는 t통계량과 자유도를 알아야 합니다. 두 표본의 크기가 n1과 n2라고 한다면 자유도는 아래와 같습니다. D.O.F (자유도) = n1+n2-2 이번에는 t통계량을 구해봅시다. t통계량을 .. 2020. 5. 5.
[엑셀 통계] 36. 엑셀로 t분포 그려보기 (2) 누적분포함수 36. 엑셀로 t분포 그려보기 (2) 누적분포함수 *사용된 데이터는 글의 끝 부분에 첨부되어 있습니다. 엑셀로 t분포의 그래프를 그려보겠습니다. 이번강의에서는 누적분포함수를 그려봅시다. (2) 누적분포함수 t.dist 함수를 사용합니다. 엑셀함수 형태는 아래와 같습니다. t.dist(t값, 자유도, 1) t분포의 확률밀도함수는 0에서 좌우대칭을 이룹니다. -10~10을 0.5단위로 나누고 그래프를 그리겠습니다. 아래와 같이 그릴 수 있습니다. 비교를 위해 표준정규분포의 누적분포함수 그래프도 함께 그렸습니다. 자유도가 커질 수록 표준정규분포에 가까워져가는 것을 알 수 있습니다. 데이터 다운로드 → 영상이 더 편하신 분 2020. 5. 4.
[엑셀 통계] 35. 엑셀로 t분포 그려보기 (1) 확률밀도함수 35. 엑셀로 t분포 그려보기 (1) 확률밀도함수 *사용된 데이터는 글의 끝 부분에 첨부되어 있습니다. 엑셀로 t분포 그래프를 그려보겠습니다. 이번강의에서는 확률밀도함수를 그려봅시다. (1) 확률밀도함수 t.dist 함수를 사용합니다. 엑셀함수 형태는 아래와 같습니다. t.dist(t값, 자유도, 0) t분포의 확률밀도함수는 0에서 좌우대칭을 이룹니다. -10~10을 0.5단위로 나누고 그래프를 그리겠습니다. 아래와 같이 그릴 수 있습니다. 비교를 위해 표준정규분포 그래프도 함께 그렸습니다. 그래프를 확대해봅시다. 자유도가 30만 되도, 표준정규분포와 거의 비슷해진다는 것을 알 수 있습니다. 데이터 다운로드 → 영상이 더 편하신 분 2020. 5. 3.
[엑셀 통계] 34. (엑셀 Z검정을 직접 정의 해보자!!) 반응형 2표본 Z검정 도구 엑셀로 푸는 통계 34. (엑셀 Z검정을 직접 정의 해보자!!) 반응형 2표본 Z검정 *사용된 데이터는 글의 끝 부분에 첨부되어 있습니다. 엑셀에서는 통계 데이터분석 도구를 이용하여 Z검정을 할 수 있습니다. 오늘은 데이터 분석도구를 사용하지 않고 Z검정을 해보도록 하겠습니다. 반응형이라는 이름을 붙인 이유는, 엑셀수식을 이용하여 데이터가 변하면 Z검정 결과가 자동으로 변하게끔 만들었기 때문입니다. 데이터는 남자,여자의 발사이즈 데이터를 이용하였습니다. Z검정을 하기 위해서는 모집단의 분산을 알아야 합니다. 모분산을 안다고 가정하였습니다. 한국 남성의 발사이즈 분산은 100으로 알려져 있고, 여성의 발사이즈 분산은 90으로 알려져 있다. 한국 남성 100명과 여성 100명을 각각 임의추출하였고, 평.. 2020. 5. 2.
[엑셀 통계] 33. 2표본 Z검정 도구 엑셀로 푸는 통계 33. 2표본 Z검정 *사용된 데이터는 글의 끝 부분에 첨부되어 있습니다. 엑셀에서 제공하는 Z검정을 해봅시다. Z검정은 실제로 쓸일이 없기 때문에 넘어가려고 했는데, 이해의 단계를 밟아가기 위해 설명하려고 합니다. 엑셀에서 제공하는 Z검정은 2표본 Z검정입니다. Z검정을 하기 위해서는 모집단의 분산을 알아야 합니다. 예를들면 이런 상황입니다. 한국 남성의 발사이즈 분산은 100으로 알려져 있고, 여성의 발사이즈 분산은 90으로 알려져 있다. 한국 남성 100명과 여성 100명을 각각 임의추출하였고, 평균을 구했더니 245.7과 230.0 이 나왔다. 두 집단의 유의차가 있는가? 귀무가설은 '두 모집단의 평균이 같다' 입니다. 이런 가정을 했을 때의 발생확률을 구하고, 그 확률이 .. 2020. 5. 1.
[엑셀 통계] 32. (엑셀 F검정을 직접 정의 해보자!!) 반응형 F검정, F-ratio 가 두가지인데?? 도구 엑셀로 푸는 통계 32. (엑셀 F검정을 직접 정의 해보자!!) 반응형 F검정, F-ratio 가 두가지인데?? *사용된 데이터는 글의 끝 부분에 첨부되어 있습니다. 지난 강의에서 엑셀 수식을 이용하여 F검정을 해보았습니다. 한가지 의문이 들었을겁니다. F ratio가 두가지로 구해지는 것 아닌가? 맞습니다. 우리가 세운 수식에서는 여자를 왼쪽에 놓고 구할때, F-ratio가 다르게 나옵니다. 따라서 p값도 다르게 나옵니다. 이유는 우리가 p-value를 구할 때, F.DIST.RT 함수를 사용했기 때문입니다. 그런데 오른쪽과 같이 R-ratio 가 1보다 작게 나오는 경우에는 RT가 아닌 F.DIST함수를 사용하는게 맞습니다. 그림으로 설명하면 이렇습니다. 오른쪽의 표를 RT함수가 아닌 LT함수로.. 2020. 4. 30.
[엑셀 통계] 31. (엑셀 F검정을 직접 정의 해보자!!) 반응형 F검정 도구 엑셀로 푸는 통계 31. (엑셀 F검정을 직접 정의 해보자!!) 반응형 F검정 *사용된 데이터는 글의 끝 부분에 첨부되어 있습니다. 엑셀에서는 통계 데이터분석 도구를 이용하여 F검정을 할 수 있습니다. 오늘은 데이터 분석도구를 사용하지 않고 F검정을 해보도록 하겠습니다. 반응형이라는 이름을 붙인 이유는, 엑셀수식을 이용하여 데이터가 변하면 F검정 결과가 자동으로 변하게끔 만들었기 때문입니다. 데이터는 남자,여자의 발사이즈 데이터를 이용하였습니다. 1. 평균 구하기 아래 그림처럼 데이터의 평균을 구합니다. F검정에 평균이 사용되지는 않지만, 그래도 기본통계량이라 구했습니다. 2. 분산구하기 두 데이터의 분산을 구합니다. 추출한 표본이기 때문에, var.s 함수를 이용합니다. 3. 데이터의 크기와 자유.. 2020. 4. 29.
[엑셀 통계] 30. 조건부 표준편차 구하기 도구 엑셀로 푸는 통계 30. 조건부 표준편차 구하기 *사용된 데이터는 글의 끝 부분에 첨부되어 있습니다. 평균을 구할 때, 특정 조건을 만족하는 셀만을 자동으로 선택하여 계산하는 함수가 있습니다. averageif 라는 함수인데요. 표준편차에는 이런 함수가 없지만 다른 방법으로 구현할 수 있습니다. 오늘은 표준편차 함수와 if함수를 조합하여 특정 조건을 만족하는 셀의 표준편차를 구하는 방법을 소개하겠습니다. 1. 아래의 데이터를 이용합니다. 세가지 예제를 통해서 설명드리겠습니다. 2. 먼저 10 이상의 표준편차를 구해봅시다. stdev.s함수 안에 if함수를 넣어줍니다. 형식은 아래와 같습니다. =STDEV.S(IF(조건, 대상)) 주의할 점은 엔터 대신 ctrl+shift+enter 을 입력해야 한다.. 2020. 4. 28.
[엑셀 통계] 29. 배열과 SUM 함수의 콜라보 도구 엑셀로 푸는 통계 29. 배열과 SUM 함수의 콜라보 *사용된 데이터는 글의 끝 부분에 첨부되어 있습니다. 엑셀에서는 배열계산이 가능합니다. 배열계산을 어떻게 활용할 수 있는지 알아봅시다. 오늘은 SUM 함수를 배열계산과 함께 이용하면 편리한 경우입니다. 우리가 카페를 운영하고 있는 상황을 가정합시다. 오늘 하루 아래와 같이 판매를 했고, 매출액과 영업이익이 궁금한 상황입니다. 배열을 모르는 사람에게 이 일을 지시하면 아래와 같이 열을 추가해서 각 항목별 매출과 영업이익을 계산하고, 한번 더 합계를 하여 구할 것입니다. 이번에는 배열을 이용해서 간단히 구해봅시다. 먼저 배열의 곱을 배워봅시다. 단가와 판매량을 각각 곱한 결과인 배열을 얻을 것입니다. 아래와 같이 다섯개의 셀을 선택합니다. 다섯개의 .. 2020. 4. 27.
[엑셀 통계] 28. 쉼표를 점으로 바꾸는 방법 도구 엑셀로 푸는 통계 28. 쉼표를 점으로 바꾸는 방법 *사용된 데이터는 글의 끝 부분에 첨부되어 있습니다. 데이터를 가져올 때 소수점이 쉼표로 입력되는 경우가 있습니다. 하나하나 바꾸는 것이 어려울 만큼 데이터가 많은 경우에 사용하는 방법입니다. 1. 아래와 같이 소수점이 점 대신 쉼표로 입력된 데이터가 있습니다. 2. substitute 함수를 이용하여 쉼표를 점으로 바꿔줍니다. 3. 더블클릭하여 나머지 셀에도 적용합니다. 데이터 다운로드 → 영상이 더 편하신 분 2020. 4. 26.
t.test함수는 어떻게쓰는건가요? Q) t.test함수는 어떻게쓰는건가요? t.test(range 1, range 2 , tails, type) 에서 tails 와 type에 무슨상황에서 어떤숫자를 써야하나요? A) tails에 1을 넣으면 단측검정, 2를 넣으면 양측검정입니다. 단측검정과 양측검정의 차이는 아래 링크를 참고하세요. https://hsm-edu.tistory.com/146 type은 아래와 같습니다. 1 : 대응표본 t 검정 2 : 독립표본 t 검정 (등분산) 3 : 독립표본 t 검정 (이분산) 대응표본 t검정은 처리 전과 후를 비교할 때 사용합니다. 예를 들면 약을 먹기 전과 후의 차이를 비교합니다. 독립표본 t검정은 서로 독립인 두 집단을 비교할 때 사용합니다. 예를들면 "한국인 키 vs 중국인 키"가 있습니다. 등분.. 2020. 4. 23.
[엑셀 통계] 27. 대응표본 t검정 도구 엑셀로 푸는 통계 27. 대응표본 t검정 *사용된 데이터는 글의 끝 부분에 첨부되어 있습니다. 대응표본 t검정은 동일한 집단의 사전,사후 평균을 비교할때 사용합니다. 예를 들어 봅시다. 어떤 회사에서 탈모약을 개발해서 임상실험을 하는 상황을 가정합시다. 50명을 모집하여 6개월간 탈모약을 복용하게 했고, 복용 전과 후 모발 수를 비교하였습니다. 귀무가설 : 복용 후 모발 수가 복용 전보다 크지 않다. (작거나 같다.) 대립가설 : 복용 후 모발 수가 복용 전보다 크다. 1. 데이터탭에서 [데이터 분석]을 클릭합니다. t검정: 쌍체비교를 선택하고 확인을 누릅니다. 2. 변수 1의 입력범위에는 복용전 데이터, 변수 2의 입력범위에는 복용후 데이터를 입력합니다. 3. 출력범위에 입력되기 원하는 셀을 선택.. 2020. 4. 23.
[엑셀 통계] 26. 숫자가 아닌 셀 찾는 방법 도구 엑셀로 푸는 통계 26. 숫자가 아닌 셀 찾는 방법 *사용된 데이터는 글의 끝 부분에 첨부되어 있습니다. 많은 양의 데이터로 통계 검정을 하다 보면, 숫자가 아닌 데이터가 섞여있어서 말썽을 일으키는 경우가 있습니다. 아래와 같은 경우죠. 숫자가 아닌 셀을 찾아서 제거하거나 수정해주어야 합니다. 데이터가 몇십개일 때는 눈으로 보면서 찾을 수 있지만 데이터가 많으면 눈으로 찾기가 어렵습니다. 이럴때는 isnumber 함수를 이용합니다. isnubmer 함수는 해당 셀이 숫자이면 TRUE, 숫자가 아니면 FALSE를 반환해줍니다. 1. 아래와 같이 C2셀에 isnumber 함수를 적용해줍니다. 2. 더블클릭, 혹은 드레그하여 모든 행에 적용해줍니다. 3. D열을 복사해서, E열에 붙여넣어 줄겁니다. 선택.. 2020. 4. 21.
[엑셀 통계] 25. 독립표본 t검정 (2) t검정 도구 엑셀로 푸는 통계 25. 독립표본 t검정 (2) t검정 지난 글에서 우리가 다루는 두 집단의 분산이 다르다는 것을 알았습니다. 따라서 '이분산 가정 두집단'으로 t검정을 진행해야 합니다. 오늘은 지난 글에 이어서 t검정을 수행하겠습니다. (데이터는 글 끝부분에서 다운로드하실 수 있습니다.) 1. 데이터 탭의 '데이터 분석'을 클릭하면 새로운 창이 뜹니다. 이 창에서 't검정 : 이분산 가정 두 집단'을 선택하고 확인을 누릅니다. 2. 변수 1에는 남자의 발길이, 변수 2에는 여자의 발길이 데이터를 입력합니다. 3. 출력범위를 체크하고 결과가 출력되기 원하는 위치를 선택합니다. 확인을 누릅니다. 4. 평균의 크기비교가 아니기 때문에 양측검정의 p값을 사용합니다. 0.05보다 작으므로 귀무가설이 기각됩.. 2020. 4. 21.
[엑셀 통계] 24. 독립표본 t검정 (1) F검정 도구 엑셀로 푸는 통계 24. 독립표본 t검정 (1) F검정 t검정은 두 집단의 평균차이가 있는지 없는지 여부를 판단하는 검정입니다. 엑셀에서는 크게 두가지 t검정이 있습니다. 독립표본 t검정과 대응표본 t검정(쌍체비교) 입니다. 둘의 간단한 차이는 아래와 같습니다. 독립표본 t검정 : 서로 다른 두 집단의 평균을 비교 (ex.남녀 발 사이즈 차이) 대응표본 t검정 : 동일한 집단의 사전,사후 평균을 비교 (ex. 탈모 치료제 복용 전후 머리숱) 오늘은 독립표본 t검정을 하는 방법을 설명드리겠습니다. 엑셀에서 독립표본 t검정은 다시 둘로 나뉘는데 엑셀에서 직접 확인해봅시다. 엑셀의 [데이터] 탭에 가장 오른쪽에 있는 데이터분석을 클릭합니다. 독립표본 t검정이 둘로 아래와 같이 둘로 나뉩니다. - 등분산 .. 2020. 4. 16.
[엑셀 통계] 23. 데이터 분석 도구 추가 방법 도구 엑셀로 푸는 통계 23. 데이터 분석 도구 추가 방법 엑셀에서 t검정 등의 통계 분석 기능은 데이터 탭에 있습니다. '데이터 분석'이라는 기능입니다. 그런데 데이터탭을 클릭해도 데이터분석 기능이 없는 경우가 있습니다. 데이터분석 기능을 추가하는 방법을 알려드리겠습니다. 1. [파일] → [옵션] 에 '추가기능' 탭으로 갑니다. 이동을 클릭합니다. 2. 분석도구를 체크하고 확인을 누릅니다. 3. 데이터 탭에 데이터 분석 도구가 생겼습니다. 영상이 더 편하신 분 2020. 4. 16.
[엑셀 통계] 22. 피벗테이블 (2변수) 도구 엑셀로 푸는 통계 22. 피벗테이블 (2변수) 엑셀의 피벗테이블은 변수들을 자동으로 분류하고 카운트해주는 표입니다. 잘 사용하면 많은 노동과 시간을 아낄 수 있습니다. 오늘은 두개의 변수로 이루어진 데이터의 피벗테이블을 만들어봅시다. 1. 아래 예시를 봅시다. B열에는 탑승객이 유아,소아,여자,남자로 구분이 되어 있고 C열에는 거주지로 구분되어 있습니다. 2. 탑승객 데이터를 선택한 뒤 [삽입]-[피벗테이블]을 클릭합니다. 3. [기존워크시트]를 선택하고 결과 테이블이 입력되기 원하는 셀을 클릭합니다. 4. (case1) 화면 오른쪽에 '피벗 테이블 필드'가 뜨는데, 탑승객과 거주지를 드레그하여 열에 넣어줍니다. 값에는 둘중 아무 값이나 넣어줘도 됩니다. 피벗테이블을 여러가지로 만들어볼 수 있는데 .. 2020. 4. 16.
[엑셀 통계] 21. 피벗테이블 (1변수) 도구 엑셀로 푸는 통계 21. 피벗테이블 (1변수) 엑셀의 피벗테이블은 변수들을 자동으로 분류하고 카운트해주는 표입니다. 잘 사용하면 많은 노동과 시간을 아낄 수 있습니다. 1. 아래 예시를 봅시다. 총 30명의 탑승객이 유아,소아,여자,남자로 구분되어 있습니다. 이 데이터에 피벗테이블을 사용해봅시다. 2. 탑승객 데이터를 선택한 뒤 [삽입]-[피벗테이블]을 클릭합니다. 3. [기존워크시트]를 선택하고 결과 테이블이 입력되기 원하는 셀을 클릭합니다. 4. 화면 오른쪽에 '피벗 테이블 필드'가 뜨는데, 탑승객을 드레그하여 행과 값에 드랍해줍니다. 행 대신 열에 드랍해도 상관은 없는데 행이 더 보기가 편합니다. 5. 아래와 같이 피벗테이블이 생성됩니다. 탑승객을 자동으로 분류하고 카운트한 결과가 나타납니다... 2020. 4. 14.
[엑셀 통계] 20. IF 함수 다중사용 (if else 문) 도구 엑셀로 푸는 통계 20. IF 함수 다중사용 (if else 문) 다중 if 함수을 사용하는 방법을 알아봅시다. 다중 if함수는 R이나 파이썬의 if else 문과 동일한 역할을 합니다. 한가지 상황을 가정하고 다중 if문의 필요와 사용법을 설명하겠습니다. 아래 그림을 봅시다. 비행기에 탑승한 30명의 승객이 있고 각각의 승객 번호 옆에 라벨이 입력되어 있습니다. 라벨1은 유아, 라벨2는 소아, 라벨3은 여자, 라벨4는 남자입니다. 이 라벨번호에 해당되는 대상을 자동으로 입력하고 싶은 상황입니다. if(A1=1,"유아") 1행 A열에 1이 입력되어있을 경우 유아를 입력한다는 코드입니다. 2가 입력되었을 때 소아를 입력하도록 함수를 설정해보겠습니다. a if(A1=1,"유아",if(A1=2,"소아").. 2020. 4. 14.
[엑셀 통계] 19. 막대그래프와 선그래프 동시에 그리는 방법 1. 다섯 회사의 4년간 영업이익을 표로 정리한 것입니다. 각 회사의 영업이익을 연도별로 막대그래프로 그릴 것이고, 전체 평균을 선 그래프로 그려볼 것입니다. 2. 아래 그림과 같이 데이터를 선택하고 [삽입] 텝에서 [2차원 세로 막대형] - [묷은 세로 막대형]을 클릭합니다. 3. 그래프에서 우클릭을 하고 [데이터 선택]을 클릭합니다. 4. [행/열 전환] 을 클릭하고 확인을 누릅니다. 5. 그래프 제목을 '회사 별 영업이익' 으로 바꿔줍니다. 6. 막대그래프 위에서 우클릭을 하고 [계열 차트 종류 변경]을 클릭합니다. 7. 평균의 차트 종류를 '표식이 있는 꺾은선형'으로 변경합니다. 8. 꺾은선 그래프에서 우클릭을 하고 [데이터 계열 서식]을 클릭합니다. 9. [보조축]을 클릭합니다. 10. 그래프를.. 2020. 4. 14.
[엑셀 통계] 18. 그래프에 표준오차 오차막대 자동생성과의 차이 도구 엑셀로 푸는 통계 18. 그래프에 표준오차 오차막대 자동생성과의 차이 1. 지난 17강에서 완료된 데이터를 가져옵니다. 2. 그래프를 복사합니다. 그래프 이름을 막대 자동삽입으로 바꿔줍니다. 3. 오차막대를 더블클릭해서 서식텝을 열고, 오차량을 '표준편차'로 바꿔줍니다. "기존에 그렸던 오차막대와 다르다는 것을 알 수 있습니다. 엑셀에서 자동으로 그려주는 표준오차막대는 그래프에 그려진 데이터들의 표준오차입니다. 즉 평균들의 표준오차입니다. 이를 더 잘 이해하기 위해 우리도 표준오차를 구해서 직접 오차막대를 그려봅시다." 4. 평균들의 표준오차를 구합니다. 5. 왼쪽 그래프에서 오차막대를 더블클릭합니다. 오차량을 '사용자 지정'으로 변경하고 입력값에 앞에서 구한 평균들의 표준오차를 넣어줍니다. 6. .. 2020. 4. 13.
[엑셀 통계] 17. 그래프에 표준오차 오차막대 추가하는 방법 도구 엑셀로 푸는 통계 17. 그래프에 표준오차 오차막대 추가하는 방법 1. 지난 15강에서 완료된 데이터를 가져옵니다. 2. 표준오차를 구해줍니다. 표준오차는 표준편차를 표본수의 루트값으로 나눠주면 됩니다. 3. 나머지 셀에도 적용합니다. 4. 오차막대를 더블클릭하고, 아래 그림과 같이 사용자지정 값을 '표준오차'로 선택해줍니다. 5. 아래와 같이 그려집니다. 영상이 더 편하신 분 2020. 4. 13.
반응형