두 집단을 비교
우리가 통계 분석을 수행하는 가장 실용적인 이유 중 하나는,
서로 다른 두 집단 간에 어떤 특성이 차이를 보이는가를 검증하는 데 있습니다.
예를 들어 다음과 같은 질문들을 떠올려 봅시다.
- “남성과 여성의 시간당 임금은 차이가 있는가?”
- “노동조합에 가입한 노동자들과 이민자들의 취업률은 다른가?”
- “대학교 졸업 여부에 따라 정치 성향에 차이가 있는가?”
이러한 질문들은 모두 두 집단 간의 특성 평균값이 유의미하게 다른가를 묻는 것이며, 이는 통계학의 가장 기본적인 가설 검정 문제 중 하나입니다.
1 가설 설정: ’차이가 없다’는 가정을 먼저 둡니다
통계적 가설 검정은 늘 귀무가설(null hypothesis)에서 시작합니다.
귀무가설은 기본적으로 “차이가 없다”는 전제를 의미하며, 이 가설이 참이라는 가정 하에서
관측된 데이터가 얼마나 우연히 나올 수 있었는지를 살펴보는 것이 검정의 본질입니다.
두 집단 A와 B에 대해 비교하고자 할 때, 보통 다음과 같은 가설이 설정됩니다:
- 귀무가설 \(H_0\): \(\mu_A = \mu_B\) (두 집단의 평균 차이는 없다)
- 대립가설 \(H_1\): \(\mu_A \neq \mu_B\) (두 집단의 평균 차이가 있다)
귀무가설이 참이라면, 두 집단 간의 관측된 평균 차이는 단순한 표본 오차일 수 있습니다. 그러나 그 차이가 표준오차(standard error)에 비해 충분히 클 경우, 우연으로 보기 어려운 판단이 가능해집니다.
2 표준편차와 표준오차의 구분
여기서 중요한 개념이 바로 표준편차(standard deviation)와 표준오차(standard error)의 차이입니다.
- 표준편차는 한 집단의 데이터가 평균으로부터 얼마나 퍼져 있는지를 나타내는 지표입니다.
- 표준오차는 여러 번의 표본추출을 했을 때, 표본평균의 변동성을 측정하는 값입니다.
즉, 집단의 평균을 추정할 때 발생하는 불확실성입니다.
표준오차는 다음과 같은 공식으로 계산됩니다:
\[\text{Standard Error} = \frac{\text{Standard Deviation}}{\sqrt{n}}\]
따라서 표본의 크기 \(n\)이 커질수록 표준오차는 작아지고, 평균 추정은 더 정밀해집니다.
3 검정통계량과 신뢰 구간
두 집단 간 평균 차이를 검정할 때는 다음과 같은 검정통계량(test statistic)을 사용합니다:
\[t = \frac{\bar{X}_A - \bar{X}_B}{\text{SE}(\bar{X}_A - \bar{X}_B)}\]
여기서 \(\text{SE}(\bar{X}_A - \bar{X}_B)\)는 두 표본 평균 차이의 표준오차이며, 두 집단의 분산과 표본크기를 함께 고려하여 계산됩니다.
검정통계량 \(t\)가 클수록, 두 평균 차이가 우연히 발생했을 가능성은 작아집니다. 이때 계산된 p-value가 유의수준 \(\alpha\) (예: 0.05)보다 작으면, 우리는 귀무가설을 기각할 수 있습니다.
또한 신뢰구간(confidence interval)을 이용하면, 두 집단 평균 차이에 대한 추정값이 실제로 유의미한지를 직관적으로 확인할 수도 있습니다. 만약 95% 신뢰구간이 0을 포함하지 않는다면, 이는 통계적으로 유의한 차이로 해석됩니다.
4 분산의 비교: F-test
평균뿐 아니라 두 집단 간 분산의 차이를 비교하고 싶을 때는 F-test를 사용합니다.
예를 들어, 두 집단의 수입 변동성이 얼마나 다른지를 평가할 수 있으며, 이는 다음과 같은 형태를 가집니다:
\[F = \frac{s_A^2}{s_B^2}\]
\(F\)-분포는 비대칭이며, 정규성을 가정하는 한편 두 표본이 독립적이어야 한다는 전제가 필요합니다.
분산의 비교는 가끔 사소해 보이지만, 실제론 중요한 함의를 갖습니다. 예를 들어, 두 집단이 평균적으로는 비슷하더라도, 불평등이나 불안정성이라는 관점에서는 분산이 더 중요한 분석 대상일 수 있습니다.