검정
From Biocourse
분포의 관한 추론
1. 모 평균에 관한 추론 ( 모 분산을 모를때 )
자료 구조 : X1, X2, ..., Xn ~ N(mu, sigma^2)

예 n = 64에서 mean(x) = 27.75, 표분편차(s) = 5.083일때 모평균의 99% 신뢰구간?
답 : mean(x) - t(0,005,63) * 표준편차(s) / 8 <= 모평균 <= mean(x) + t(0,005,63) * 표준편차(s) / 8
27.750 - 2.66*5.083/8 <= 모평균 <= 27.750 + 2.66*5.083/8
26.06 <= 모평균 <= 29.44
2. 가설 검정 ( t-검정)
Ho = mu = mu0 의 검정

* 일반적으로 n이 적을 경우 정규 모집단을 가정하거나 비모수적인 방법을 사용한다.
n이 충분히 클 때 T = sqrt(n) * (표본평균 - 모평균) / 표본표준편차 =. N(0,1)임을 이용한다.
3. 대응 비교(쌍체 비교)에 대한 모 평균의 비교
두 모집단의 평균을 비교할 때 실험 단위를 동질적인 쌍으로 묶은 다음, 각 쌍에 두 처리를 임의로 적용하고,
각 쌍에서 모은 관측값의 차로 mu1 - mu2에 관한 추론을 하는 방법을
대응 비교 또는 쌍체 비교 (paired comparison)라고 한다.
(1) 용어 정리
실험단위(experimental units) : 실험이 행해지는 개체
처리(treatment) : 각각의 실험 단위에 특정한 실험환경, 실험 조건을 가하는 것
처리군(treatment group), 치료군 : 처리를 받는 집단
대조군(control group) : 처리를 받지 않는 집단
이중눈가림실험(double blind experiments)
: 실험자와 피실험자 모두가 처리 여부를 모르는 실험
위약(placebo)효과 : 어떤 종류의 처방에도 긍정적이거나 부정적으로 반응
(2) 대응 비교를 하는 경우의 예
(a) 두 종류의 운동화의 밑창의 마모정도 비교
: 피 실험자의 왼발, 오른발의 각기 다른 운동화 착용
(b) 약의 효능 검사
환자의 초기 증상의 정도에 따라 차이가 나는 것을 통제하기 위해 복용적과 복용후의 효과 측정
(c) 눈의 좌, 우 시력 비교
(3) 자료 구조

(4) 추정및 검정



4. 이표본에 의한 모평균의 비교
- 각각의 모집단에서 표본을 랜덤추출하여 얻게되는 서로 독립인 두 표본을 이용하여 각각의
모집단에 대한 추론을 통하여 도 모집단을 비교한다.
(1) 자료 구조

(2) 조건 및 가정
i) 각 그룹에서 관측값은 각 모집단에서의 랜덤 표본이다.
ii) 서로 다른 그룸에서의 관측값들은 독립적으로 관측된 것이다.

(3) 자료의 요약

(4) 집단1의 모분산과 집단2의 모분산을 알때

(5) 집단1의 모분산 = 집단2의 모분산이나 미지일때


(6) 집단1의 모분산 != 집단2의 모분산
n1, n2가 작을 경우에, 근사적으로


5. 모분산에 관한 추론
1) 모 분산에 관한 추론
점추정 :

표본분포 :

2) 모 분산의 신뢰구간

3) H0 : 집단1의 모분산 = 집단2의 모분산 검정

4) 카이제곱분포를 이용하여 모분산을 추론할 때 모평균에 관한 t 검정 또는 t 신뢰구간과 달리
정규모집단이라는 가정에 추론의 타당선이 깊게 의존하고 있으므로 이러한 가정 검토 후에
적정한 추론을 하여야한다.
5) H0 : 집단1의 모분산 / 집단2의 모분산 검정


6-1. 모비율에 관한 추론
1) 모비율의 추정과 검정
X ~ B(n,p) 일때, E(X) = np, Var(X) = np(1-p)
i) 추정량과 표준오차

ii) 모 비율 p에 대한 추정
( 표본의 크기가 클때 즉, np >= 5이고, n(1-p) >= 5 일때)

- 신뢰구간

- 예 : 단순랜덤추출한 500가구 중에서 79가구가 귀향을 하려고 한다. 귀향률 p의 95%신뢰구간을 구하라.

- 표본크기의 결정

- 문제 : p의 추정에서 95% 오차한계를 3%이내로 하기 위한 표본 크기를 구하라.
답 :

iii) 검정
H0 : p = p0 의 검정
- X ~ B(n,p0)임을 이용 (표본크기가 작을 경우)
기각역 :

- 예 : n = 20, x =3, alpha = 0.05, X ~ B(20,0.05)
H0 : p = 0.05, H1 : p > 0.05
답 :

- 정규근사 ( 표본크기가 큰 경우 )
검정 통계량 :

기각역 :

6-2. 두 모비율의 비교
두 모집단에서 n1, n2개의 랜덤 표본을 서로 독립적으로 추출하여 두 모비율 p1, p2을 비교하는 방법
X1 ~ B(n1,p1), X2 ~ B(n2, p2), p1 = X1/n1, p2 = X2/n2
1) p1 - p2의 추정

예 :

p1 : 대조 집단 어린이들이 마비증세를 보이는 비율
p2 : 대조 집단 어린이들이 마비증세를 보이는 비율
문제 : p1 - p2의 추정값과 95%의 신뢰구간을 구하라.

2) H0 : p1 = p2의 검정
i) p1 = p2 = p의 추정량 (합동표본비율) :

ii) p1 = p2 = p일때

iii) 검정 통계량 :

귀무가설 H0하에서 근사적으로 N(0,1)의 분포를 가진다.
iv) 예
문제: 소아마비 백신이 효과가 있다고 할 수 있는가 유의성 검증을 하여라.

-- 예 :

문제 : 살인범의 유형에 따라 가석방의 성공률에 차이가 있는가를 유의수준 5%하에서 검정하여라.
답 :
충동적 살인범과 계획적 살인범에 대한 가석방의 성공률을 각각 p1 , p2라고 하자.
검정하려는 가설은 0 : p1 = p2 vs. H1 : p1 != p2


