인과관계 (Granger causality) vs. 공적분관계 (co-integration)
Causality and Long-Term Economic Relationships
통계적으로 유의미한 상관관계가 발견되었다고 해서, 그 관계가 인과적(causal)이라고 말할 수는 없습니다. 특히 경제·사회 데이터에서는 변수 간 상호작용이 복잡하며, 외부 요인(confounders), 시간 지연, 피드백 루프 등으로 인해 단순한 인과 추론은 오히려 왜곡을 초래할 수 있습니다.
이 절에서는 시계열 분석에서 자주 사용되는 Granger causality를 출발점으로 삼고, 이를 넘어서는 구조적 접근(예: Pearl의 구조 모형, Rubin의 잠재적 결과 프레임워크), 그리고 장기적 상호작용을 설명하는 공적분관계(cointegration)로까지 확장합니다.
1 Granger Causality: 예측 가능성이 인과인가?
Granger causality는 시계열 변수 \(X_t\)가 다른 변수 \(Y_t\)의 미래 값을 예측하는 데 유의미한 기여를 하는지를 검정합니다.
정의: 과거의 \(X\) 값이 \(Y\)의 미래값에 통계적으로 유의미한 설명력을 가진다면, \(X\)는 \(Y\)에 대해 Granger 원인(granger cause)이라고 합니다.
형식적 표현: \[Y_t = \sum_{i=1}^{p} \alpha_i Y_{t-i} + \sum_{j=1}^{q} \beta_j X_{t-j} + \varepsilon_t\]
여기서 \(\beta_j \neq 0\)이면, \(X\)가 \(Y\)를 Granger-cause 한다고 판단합니다.
해석 주의점: Granger causality는 예측 가능성(prediction)에 기반할 뿐, 진정한 인과 구조(mechanistic causality)를 보장하지 않습니다.
2 구조적 인과 모형: Pearl과 Rubin
Granger 접근은 “과거 정보 → 미래 예측”이라는 시계열적 인과성을 평가하지만, 더 근본적인 인과 해석을 위해서는 구조적 모형이 필요합니다.
2.1 (1) Pearl의 SCM (Structural Causal Model)
변수 간 관계를 Directed Acyclic Graph (DAG)로 표현하고,
개입(do-calculus)이라는 연산을 통해 인과 효과를 정량화합니다.
예: 흡연 → 폐암 관계에서, 관찰된 상관관계뿐 아니라 “흡연을 강제로 제거했을 때 폐암 발생률이 어떻게 바뀌는가?”라는 질문을 모형화합니다.
2.2 (2) Rubin의 Potential Outcomes Framework
개별 단위(i)의 잠재적 결과를 두 개로 상정:
\(Y_i(1)\) = 처치받았을 때 결과, \(Y_i(0)\) = 처치받지 않았을 때 결과실제로는 하나의 결과만 관측 가능 → counterfactual inference가 핵심
무작위 대조 실험(RCT)이 가장 신뢰 가능한 방법
3 혼란 변수와 결과론적 해석의 오류
모든 인과 추론은 통계적으로 유의미한 설명력을 단일 원인으로 환원하는 오류를 경계해야 합니다.
특히 결과 중심적 해석(post hoc reasoning)은 다음의 오류를 범하기 쉽습니다:
Confounders: \(Z\)가 \(X\)와 \(Y\) 모두에 영향을 미친다면, \(X \to Y\)의 인과 관계는 왜곡됩니다.
생존자 편향: 성공한 사례만 분석하면, 실패한 경우의 데이터는 누락됩니다.
과도한 단순화: 복잡한 사회·경제적 조건을 단일 변수로 설명하려 함
예: 부자가 된 사람이 과거 높은 투자 수익률을 보였다고 해서, 그 수익률이 부의 “원인”이었다고 단정짓는 것은 위험합니다. 초기 자본, 시장 상승장, 정보 접근성 등 다양한 구조적 요인이 작용했을 수 있습니다.
4 비선형성, 문턱 효과, 조건부 인과
현실 세계의 인과 관계는 종종 다음과 같은 비선형적 또는 조건적 특성을 가집니다:
Nonlinearity: \(X\)가 \(Y\)에 미치는 효과가 수준에 따라 달라짐 (e.g., 금리가 5%에서 4%로 내려갈 때는 효과가 크지만, 1%에서 0%로는 작음)
Interaction: 변수 \(X\)의 효과가 다른 변수 \(Z\)의 수준에 따라 달라짐 (e.g., 교육이 소득에 미치는 효과가 지역 또는 성별에 따라 다름)
Threshold effect: 특정 구간에서는 영향력이 없다가, 일정 수준을 넘으면 강한 효과
5 Cointegration: 단기적 분산, 장기적 균형
서로 비정상(non-stationary)인 시계열 변수 \(X_t, Y_t\)가 각각 따로 보면 평균이 존재하지 않고, 분산이 무한대로 커지지만,
어떤 선형 조합 \(\beta_1 X_t + \beta_2 Y_t\)는 stationary하다면, 이 두 변수는 공적분(cointegrated) 관계에 있다고 말합니다.
경제적 의미: \(X\)와 \(Y\)는 단기적으로는 따로 움직이지만, 장기적으로는 균형관계를 유지합니다.
예시: 소비와 소득, 환율과 물가, 부동산 가격과 임대료 등은 공적분 관계를 가질 수 있습니다.
Cointegration은 인과관계와는 구분되지만, 장기적 관계라는 점에서 실질적인 경제 메커니즘의 존재를 시사합니다.
분석 방식 | 초점 | 수단 | 한계 |
---|---|---|---|
Granger Causality | 예측 가능성 | 과거 정보의 통계적 설명력 | 인과성 아님, 제3요인 영향 가능 |
Pearl SCM | 구조적 인과 | DAG, 개입(do-operator) | 모델 구조의 정확성 필요 |
Rubin Framework | 처치 효과 | 반사실적 비교 | 관찰되지 않는 결과 추정 필요 |
Cointegration | 장기 균형 관계 | 비정상 시계열의 선형 조합 | 인과 아님, 단기 예측력 없음 |