Upload
others
View
4
Download
0
Embed Size (px)
Citation preview
통계이론의 이해 3 -통계분석
한국성서대학교 간호학과
장 인 순
Copyright © by Ryu Kyoung Mu All rights reserved.
❏모수통계학(parametric statistics) 모집단의 분포에 대한 가정을 필요로 하는 통계적 방법으로서 대체로 연속형의 수량적 자료를 분석할 때 사용 ❏비모수통계학(non‐parametric statistics) 모집단의 분포에 대한 가정을 필요로 하지 않으며 질적 자료 혹은 비연속형의 수량적 자료를 분석할 때 사용
모수/비모수통계
Copyright © by Ryu Kyoung Mu All rights reserved.
가설검정을 위한 통계방법 선택
모수(parameter) 비모수
(non-parameter)
모집단의 평균과 분산, 정규분포
비정규분포, 표본수가 작은 경우, 명목, 순위척도
교차분석 Chi-square
(Fisher exact test)
두집단 평균비교 T-test Wilcoxon rank sum test
K집단 평균비교 ANOVA Kruskal wallis test
짝지은 평균비교 Paired-test Wilcoxon signed rank sum test
상관관계 Pearson correlation Spearman test
모수/비모수통계
Copyright © by Ryu Kyoung Mu All rights reserved.
통계분석
1. 데이터를 가지고 통계분석을 하기 위해서는 1) 데이터에 있는 변수들의 성질 파악 - 변수들은 측정 방법에 따라 명목척도 변수, 순서척도 변수, 구간∙비율척도 변수로 구분 - 변수의 척도에 따라 분석방법이 달라짐 2) 명목척도, 순위척도 변수-범주형(categorical) 변수 3) 구간 ∙비율척도 변수- 척도변수
Copyright © by Ryu Kyoung Mu All rights reserved. 5
1. 설문조사에 의한 데이터의 수집과 통계분석 (1) 설문조사에 의한 데이터의 수집절차
연구목적, 연구내용 및 분석방법 결정
설문지 작성, 표본추출방법과 표본크기결정, 조사방법 결정, 조사원 훈령, 예비조사
설 문 조 사
데이터의 코딩과 컴퓨터 입력 및 오류데이터 수정
수정 완료된 데이터
통계분석
Copyright © by Ryu Kyoung Mu All rights reserved. 6
(2) 통계분석 작업의 단계 (가) 제1단계: 각 변수의 분포 파악
- 빈도분석(Frequency Analysis) - 기술 통계분석(Descriptive Statistics Analysis)
각 변수에 대한 분포 파악
범주형 변수 빈도분석
구간 ∙비율척도 변수 기술 통계분석
통계분석
Copyright © by Ryu Kyoung Mu All rights reserved. 7
(나) 제2단계: 데이터의 타당성 및 신뢰성 검토 - 요인분석(Factor Analysis) - 신뢰도 분석(Reliability Analysis)
데이터의 타당성과 신뢰성
여러 개의 순서척도(3점, 5점, 7점척도)변수
요인분석 신뢰도분석
통 계 분 석
Copyright © by Ryu Kyoung Mu All rights reserved. 8
(다) 제3단계: 통계분석기법의 선정 1. 몇 개의 변수를 동시에 분석할 것인가? 2. 변수의 측정척도는 무엇인가? 3. 분석목적은 무엇인가?
통 계 분 석
Copyright © by Ryu Kyoung Mu All rights reserved. 9
1.빈도분석: 명목척도나 순서척도 변수에 대해 빈도(Frequency)분포를 알아보는 분석 2.기술 통계분석: 구간 ∙비율척도 변수에 대해 요약 통계략(평균, 표준편차 등)을 구하는 분석. 3.요인분석: 많은 문항(변수)를 적은 수의 요인변수로 축소하는데 사용하는 분석 -하나의 개념을 측정하기 위해 여러 개의 문항(변수)들을 사용했을 경우에 이 문항들이 한 개의 요인으로 묶여지는 것은 그 측정도구가 타당함을 나타냄 4.신뢰도분석: 동일한 개념을 여러 문항(변수)으로 질문하였을 경우에, 응답들이 비슷하게 나타나는지를 측정하는 신뢰계수를 계산
통 계 분 석
Copyright © by Ryu Kyoung Mu All rights reserved. 10
두 변수의 연관성 정도
두 개 모두 범주형 변수 => 교차분석
두 개 모두 구간 ∙비율척도변수
=> 상관분석
집단간 평균 비교
독립변수: 범주형변수(2개범주) 종속변수: 구간 ∙비율척도 변수 => T-검정(t-test)
독립변수: 범부형변수(3개이상범주) 종속변수: 구간 ∙비율척도 변수 => 일원배치분산분석(ANOVA)
두 변수의 연관성 정도
통 계 분 석
Copyright © by Ryu Kyoung Mu All rights reserved.
인하대학교 통계학과
11
여러 개의 독립변수와 한 개의 종속변수 간의 관계
독립변수 모두: 범주형 변수 종속변수: 구간 ∙비율척도 변수 => 분산분석(ANOVA)
독립변수, 종속변수모두 구간 ∙비율척도 변수
=>다중회귀 분석
통 계 분 석
독립 변수가 종속변수에 영향을 주는지 파악
독립변수와 종속변수: 구간 ∙비율척도 변수 => 단순회귀분석
Copyright © by Ryu Kyoung Mu All rights reserved.
12
2. 통계적 추론과 가설검정 (1) 모집단(Population)과 표본(Sample)
우리나라 간호학생
2000명의 간호학생
모집단
표본추출
표본
통 계 분 석
Copyright © by Ryu Kyoung Mu All rights reserved.
13
(2) 통계적 추론(Statistical Inference) - 표본은 모집단의 아주 작은 일부이기 때문에 이 표본만을 가지고 모집단 전체에 대해 정확히 알아낼 수는 없음 -> 모집단에 대한 통계적 추측방법을 통계적 추론 이라고 함 -> 추론방법: 신뢰구간에 의한 방법, 가설검정방법 -> 신뢰구간(흔히 95% 신뢰구간): 모집단의 한 특성의 값을 신뢰구간 내에서 추측하는 구간을 말함 -> 가설검정: 모집단에 대한 가설을 세워놓고서 이 가설이 옳거나 그르다고 추측하는 방법
[Ex]
어느 도시의 실업률에 대한 95%신뢰구간은 (0.058,0.106)으로 나타났다.
통 계 분 석
Copyright © by Ryu Kyoung Mu All rights reserved.
14
(3) 가설 검정(Hypothesis Testing) -많은 통계분석 방법(T-검정, 분산분석, 회귀분석 등)에서는 가설검정방법을 통해 추측을 함. -가설검정에 대한 추측의 단계
1단계
가성을 세운다.
H0(귀무가설)
H1(대립가설)
2단계
표본자료를 가지고
검정통계량
(T, x2, F등)값을 계산한다.
3단계
검정통계량 값의
P값(유의확률)을 계산한다.
4단계
결론을 내린다.
P값 유의수준이면
H1을 채택한다.(H0기각)
통 계 분 석
Copyright © by Ryu Kyoung Mu All rights reserved.
15
1단계:가설 - 연구자는 귀무가설과 대립가설, 두 개의통계적 가설을 세움. -가설은 모두 모집단에 대한 기술이어야 함 - 예상하거나 새로 알아내고자 하는 명제를 대립가설(연구가설, 목적가설 alternative hypothesis)로 하고 대립가설에 반대되는 명제를 귀무가설(null hypothesis)로 설정함 - 귀무가설(영가설)은 흔히’동일하다’,’차이가 없다’, 등으로 표현됨
[Ex1]
HO: 두 변수는 상관(correlation)이 없다.
H1: 두 변수는 상관이 있다.
[Ex2]
H0: 새로운 간호중재와 기존 간호중재의 효과에 차이가 없다.
H1: 새로운 간호중재는 기존 간호중재보다 효과가 좋다.
통 계 분 석
Copyright © by Ryu Kyoung Mu All rights reserved.
16
가설
통 계 분 석
1.가설: 모수에 대한 예상, 주장, 또는 단순한 추측 예) 인간은 질병에 걸린다 -> 아직은 하나의 추측일 뿐임. 통계적 가설검정은 이러한 가설에 대해 증거를 수집하여 과학적으로 증명하는 것임 2.귀무가설(영가설): 기각하기를 희망하여 형식화한 가설. 기존에 받아들이던 가설, 모수에 관한 귀무가설은 항상 모수의 정확한 값을 지정하도록 진술될 것인 반면 대립가설은 여러 개의 값의 가능성이 허용됨 ->보통 같다, 차이가 없다, 0이다 3. 대립가설(연구가설): 표본을 통해 입증하고자 하는 새로운 가설, 모수에 대한 관심의 영역 중에서 귀무가설로 지정되지 않은 모든 경우를 포괄적으로 지정함 ->보통 다르다, 차이가 있다, 0이 아니다
Copyright © by Ryu Kyoung Mu All rights reserved.
17
2단계: 검정통계량 값 (Test Statistics) - 가설을 검정하기 위한 통계량 값 - T 검정통계량, x2 검정통계량, F 검정통계량 등이 있는데, 이것은 표본자료 값을 가지고 계산됨 3단계: P값(유의확률, p-value, significance probability) - 귀무가설이 참(true)일 경우, 2단계에서 계산된 검정통계량 값이 얼마나 빈번하게 일어날지에 대한 확률 값임 -만약 P값이 작으면 귀무가설하에서 일반적인 현상이 아니므로 귀무가설을 기각하고 대립가설을 채택하게 됨 - 이 때의 기준으로 유의수준을 사용함. 유의수준으로는 1%, 5%, 10%를 일반적으로 설정하는데 5%수준이 가장 널리 사용됨
통 계 분 석
Copyright © by Ryu Kyoung Mu All rights reserved.
18
4단계: 결론 - 통계적으로 결론은 ‘H0를 기각한다’나 ‘H0를 기각할 수 없다’의 두 가지인데, 연구자는 통계적 결론을 바탕으로 연구의 결론을 내리게 됨 - 즉, 표본 데이터에 의거해서 연구의 목적하던 바를 옳다고 받아들이거나, 받아들일 수 없다고 기술함
통 계 분 석
Copyright © by Ryu Kyoung Mu All rights reserved.
통계분석방법
Copyright © by Ryu Kyoung Mu All rights reserved.
통계분석방법
Copyright © by Ryu Kyoung Mu All rights reserved.
통계분석방법
Copyright © by Ryu Kyoung Mu All rights reserved.
통계분석방법
Copyright © by Ryu Kyoung Mu All rights reserved.
통계분석방법
Copyright © by Ryu Kyoung Mu All rights reserved.
주제에 맞는 분석방법?? 1. 학생의 성별에 따른 삶의 질 정도의 차이
2. 혈중 콜레스테롤 농도와 지방간 발생과의 관계
① t-test ② 분산분석 ③ 상관분석 ④ 회귀분석 ⑤ 카이스키 검정
Q&A
Copyright © by Ryu Kyoung Mu All rights reserved.
주제에 맞는 분석방법?? 1. 정신과 환자의 성별에 따른 우울 정도의 차이
2. 실험군과 대조군의 암발생 여부 비교
① t-test ② 분산분석 ③ 상관분석 ④ 회귀분석 ⑤ 카이스키 검정 ⑥ paired t-test
Q&A
Copyright © by Ryu Kyoung Mu All rights reserved.
주제에 맞는 분석방법?? 3. 환자 기분상태를 상,중, 하로 나누었을 때 혈압의
차이
4. 혈중 크레아틴 농도와 하루 소변량의 관계 ① t-test ② 분산분석 ③ 상관분석 ④ 회귀분석 ⑤ 카이스키 검정 ⑥ paired t-test
Q&A
Copyright © by Ryu Kyoung Mu All rights reserved.
주제에 맞는 분석방법?? 5. 대학생의 건강증진행위에 영향을 주는 요인
6. 여대생의 흡연정도와 친구의 흡연정도의 관계 ① t-test ② 분산분석 ③ 상관분석 ④ 회귀분석 ⑤ 카이스키 검정 ⑥ paired t-test
Q&A