검정

From Biocourse

Jump to: navigation, search


분포의 관한 추론

1. 모 평균에 관한 추론 ( 모 분산을 모를때 )

      자료 구조 : X1, X2, ..., Xn ~ N(mu, sigma^2)

image : stat6-1.jpg


 n = 64에서 mean(x) = 27.75, 표분편차(s) = 5.083일때 모평균의 99% 신뢰구간?

답 : mean(x) - t(0,005,63) * 표준편차(s) / 8 <=  모평균 <= mean(x) + t(0,005,63) * 표준편차(s) / 8

      27.750 - 2.66*5.083/8 <= 모평균 <= 27.750 + 2.66*5.083/8

       26.06 <= 모평균 <= 29.44





2. 가설 검정 ( t-검정)


Ho = mu = mu0 의 검정

image : stat6-2.jpg


* 일반적으로 n이 적을 경우 정규 모집단을 가정하거나 비모수적인 방법을 사용한다.

n이 충분히 클 때 T = sqrt(n) * (표본평균 - 모평균) / 표본표준편차  =. N(0,1)임을 이용한다.






3. 대응 비교(쌍체 비교)에 대한 모 평균의 비교


  두 모집단의 평균을 비교할 때 실험 단위를 동질적인 쌍으로 묶은 다음, 각 쌍에 두 처리를 임의로 적용하고, 
각 쌍에서 모은 관측값의 차로 mu1 - mu2에 관한 추론을 하는 방법을 
  대응 비교 또는 쌍체 비교 (paired comparison)라고 한다.

(1) 용어 정리

실험단위(experimental units) : 실험이 행해지는 개체

처리(treatment) : 각각의 실험 단위에 특정한 실험환경, 실험 조건을 가하는 것

처리군(treatment group), 치료군 : 처리를 받는 집단

대조군(control group) : 처리를 받지 않는 집단

 이중눈가림실험(double blind experiments)

   :  실험자와 피실험자 모두가 처리 여부를 모르는 실험

위약(placebo)효과 : 어떤 종류의 처방에도 긍정적이거나 부정적으로 반응


(2) 대응 비교를 하는 경우의 예

  (a) 두 종류의 운동화의 밑창의 마모정도 비교

      : 피 실험자의 왼발, 오른발의 각기 다른 운동화 착용


 (b) 약의 효능 검사

   환자의 초기 증상의 정도에 따라 차이가 나는 것을 통제하기 위해 복용적과 복용후의 효과 측정 


 (c)  눈의 좌, 우 시력 비교


(3) 자료 구조

 image : stat6-3.jpg


(4) 추정및 검정

 image : stat6-4.jpg


 image : stat6-5.jpg


 image : stat6-6.jpg





4. 이표본에 의한 모평균의 비교

- 각각의 모집단에서 표본을 랜덤추출하여 얻게되는 서로 독립인 두 표본을 이용하여 각각의 

모집단에 대한 추론을 통하여 도 모집단을 비교한다.

(1) 자료 구조

 image : stat6-7.jpg


(2) 조건 및 가정

i) 각 그룹에서 관측값은 각 모집단에서의 랜덤 표본이다.

ii) 서로 다른 그룸에서의 관측값들은 독립적으로 관측된 것이다.

 image : stat6-8.jpg

(3) 자료의 요약

 image : stat6-9.jpg


(4) 집단1의 모분산과 집단2의 모분산을 알때

 image : stat6-10.jpg


(5) 집단1의 모분산 = 집단2의 모분산이나 미지일때


 image : stat6-11.jpg


 image : stat6-12.jpg



(6) 집단1의 모분산 != 집단2의 모분산

n1, n2가 작을 경우에, 근사적으로

 image : stat6-13.jpg

 image : stat6-14.jpg




5. 모분산에 관한 추론

1) 모 분산에 관한 추론

점추정 :

 image : stat6-15.jpg

표본분포 : 

 image : stat6-16.jpg

2) 모 분산의 신뢰구간

 image : stat6-17.jpg

3) H0 :  집단1의 모분산 = 집단2의 모분산 검정

 image : stat6-18.jpg


4) 카이제곱분포를 이용하여 모분산을 추론할 때 모평균에 관한 t 검정 또는 t 신뢰구간과 달리 
    정규모집단이라는 가정에 추론의 타당선이 깊게 의존하고 있으므로 이러한 가정 검토 후에 
    적정한 추론을 하여야한다.


5) H0 :  집단1의 모분산 / 집단2의 모분산 검정


 image : stat6-19.jpg


 image : stat6-20.jpg




6-1. 모비율에 관한 추론

1) 모비율의 추정과 검정

X ~ B(n,p) 일때,   E(X) = np, Var(X) = np(1-p)


    i) 추정량과 표준오차

   image : stat6-21.jpg

   ii) 모 비율 p에 대한 추정

   ( 표본의 크기가 클때 즉, np >= 5이고, n(1-p) >= 5 일때)

   image : stat6-22.jpg

   - 신뢰구간

   image : stat6-23.jpg

  - : 단순랜덤추출한 500가구 중에서 79가구가 귀향을 하려고 한다.  귀향률 p의 95%신뢰구간을 구하라.

 image : stat6-24.jpg

    - 표본크기의 결정

 image : stat6-25.jpg

   - 문제 : p의 추정에서 95% 오차한계를 3%이내로 하기 위한 표본 크기를 구하라.

답 :  image : stat6-26.jpg

iii) 검정

    H0 : p = p0 의 검정

- X ~ B(n,p0)임을 이용 (표본크기가 작을 경우)

기각역 :

 image : stat6-27.jpg

- :   n = 20, x =3, alpha = 0.05, X ~ B(20,0.05)
           H0 : p = 0.05, H1 : p > 0.05

답 :  image : stat6-28.jpg

- 정규근사 ( 표본크기가 큰 경우 )

검정 통계량 :  image : stat6-29.jpg

기각역 : 

 image : stat6-30.jpg



6-2. 두 모비율의 비교

두 모집단에서 n1, n2개의 랜덤 표본을 서로 독립적으로 추출하여 두 모비율 p1, p2을 비교하는 방법
X1 ~ B(n1,p1), X2 ~ B(n2, p2), p1 = X1/n1, p2 = X2/n2


1) p1 - p2의 추정

 image : stat6-31.jpg



 image : stat6-32.jpg


p1 : 대조 집단 어린이들이 마비증세를 보이는 비율

p2 :  대조 집단 어린이들이 마비증세를 보이는 비율

문제 : p1 - p2의 추정값과 95%의 신뢰구간을 구하라.


 image : stat6-33.jpg


2) H0 : p1 = p2의 검정

i) p1 = p2 = p의 추정량 (합동표본비율) :  image : stat6-34.jpg

ii) p1 = p2 = p일때

 image : stat6-35.jpg

iii) 검정 통계량 :  image : stat6-36.jpg

      귀무가설 H0하에서 근사적으로 N(0,1)의 분포를 가진다.

iv)

문제: 소아마비 백신이 효과가 있다고 할 수 있는가 유의성 검증을 하여라.

 image : stat6-37.jpg


-- :

 image : stat6-38.jpg

문제 : 살인범의 유형에 따라 가석방의 성공률에 차이가 있는가를 유의수준 5%하에서 검정하여라.

답 :

충동적 살인범과 계획적 살인범에 대한 가석방의 성공률을 각각 p1 , p2라고 하자.

검정하려는 가설은   0 : p1 = p2 vs.  H1 : p1 != p2

 image : stat6-39.jpg


 image : stat6-40.jpg