인과관계 (Granger causality) vs. 공적분관계 (co-integration)

Causality and Long-Term Economic Relationships

통계적으로 유의미한 상관관계가 발견되었다고 해서, 그 관계가 인과적(causal)이라고 말할 수는 없습니다. 특히 경제·사회 데이터에서는 변수 간 상호작용이 복잡하며, 외부 요인(confounders), 시간 지연, 피드백 루프 등으로 인해 단순한 인과 추론은 오히려 왜곡을 초래할 수 있습니다.

이 절에서는 시계열 분석에서 자주 사용되는 Granger causality를 출발점으로 삼고, 이를 넘어서는 구조적 접근(예: Pearl의 구조 모형, Rubin의 잠재적 결과 프레임워크), 그리고 장기적 상호작용을 설명하는 공적분관계(cointegration)로까지 확장합니다.

1 Granger Causality: 예측 가능성이 인과인가?

Granger causality는 시계열 변수 \(X_t\)가 다른 변수 \(Y_t\)의 미래 값을 예측하는 데 유의미한 기여를 하는지를 검정합니다.

  • 정의: 과거의 \(X\) 값이 \(Y\)의 미래값에 통계적으로 유의미한 설명력을 가진다면, \(X\)\(Y\)에 대해 Granger 원인(granger cause)이라고 합니다.

  • 형식적 표현: \[Y_t = \sum_{i=1}^{p} \alpha_i Y_{t-i} + \sum_{j=1}^{q} \beta_j X_{t-j} + \varepsilon_t\]

    여기서 \(\beta_j \neq 0\)이면, \(X\)\(Y\)를 Granger-cause 한다고 판단합니다.

  • 해석 주의점: Granger causality는 예측 가능성(prediction)에 기반할 뿐, 진정한 인과 구조(mechanistic causality)를 보장하지 않습니다.

2 구조적 인과 모형: Pearl과 Rubin

Granger 접근은 “과거 정보 → 미래 예측”이라는 시계열적 인과성을 평가하지만, 더 근본적인 인과 해석을 위해서는 구조적 모형이 필요합니다.

2.1 (1) Pearl의 SCM (Structural Causal Model)

  • 변수 간 관계를 Directed Acyclic Graph (DAG)로 표현하고,

  • 개입(do-calculus)이라는 연산을 통해 인과 효과를 정량화합니다.

예: 흡연 → 폐암 관계에서, 관찰된 상관관계뿐 아니라 “흡연을 강제로 제거했을 때 폐암 발생률이 어떻게 바뀌는가?”라는 질문을 모형화합니다.

2.2 (2) Rubin의 Potential Outcomes Framework

  • 개별 단위(i)의 잠재적 결과를 두 개로 상정:
    \(Y_i(1)\) = 처치받았을 때 결과, \(Y_i(0)\) = 처치받지 않았을 때 결과

  • 실제로는 하나의 결과만 관측 가능 → counterfactual inference가 핵심

  • 무작위 대조 실험(RCT)이 가장 신뢰 가능한 방법

3 혼란 변수와 결과론적 해석의 오류

모든 인과 추론은 통계적으로 유의미한 설명력을 단일 원인으로 환원하는 오류를 경계해야 합니다.
특히 결과 중심적 해석(post hoc reasoning)은 다음의 오류를 범하기 쉽습니다:

  • Confounders: \(Z\)\(X\)\(Y\) 모두에 영향을 미친다면, \(X \to Y\)의 인과 관계는 왜곡됩니다.

  • 생존자 편향: 성공한 사례만 분석하면, 실패한 경우의 데이터는 누락됩니다.

  • 과도한 단순화: 복잡한 사회·경제적 조건을 단일 변수로 설명하려 함

예: 부자가 된 사람이 과거 높은 투자 수익률을 보였다고 해서, 그 수익률이 부의 “원인”이었다고 단정짓는 것은 위험합니다. 초기 자본, 시장 상승장, 정보 접근성 등 다양한 구조적 요인이 작용했을 수 있습니다.

4 비선형성, 문턱 효과, 조건부 인과

현실 세계의 인과 관계는 종종 다음과 같은 비선형적 또는 조건적 특성을 가집니다:

  • Nonlinearity: \(X\)\(Y\)에 미치는 효과가 수준에 따라 달라짐 (e.g., 금리가 5%에서 4%로 내려갈 때는 효과가 크지만, 1%에서 0%로는 작음)

  • Interaction: 변수 \(X\)의 효과가 다른 변수 \(Z\)의 수준에 따라 달라짐 (e.g., 교육이 소득에 미치는 효과가 지역 또는 성별에 따라 다름)

  • Threshold effect: 특정 구간에서는 영향력이 없다가, 일정 수준을 넘으면 강한 효과

5 Cointegration: 단기적 분산, 장기적 균형

서로 비정상(non-stationary)인 시계열 변수 \(X_t, Y_t\)가 각각 따로 보면 평균이 존재하지 않고, 분산이 무한대로 커지지만,
어떤 선형 조합 \(\beta_1 X_t + \beta_2 Y_t\)는 stationary하다면, 이 두 변수는 공적분(cointegrated) 관계에 있다고 말합니다.

  • 경제적 의미: \(X\)\(Y\)는 단기적으로는 따로 움직이지만, 장기적으로는 균형관계를 유지합니다.

  • 예시: 소비와 소득, 환율과 물가, 부동산 가격과 임대료 등은 공적분 관계를 가질 수 있습니다.

Cointegration은 인과관계와는 구분되지만, 장기적 관계라는 점에서 실질적인 경제 메커니즘의 존재를 시사합니다.

분석 방식 초점 수단 한계
Granger Causality 예측 가능성 과거 정보의 통계적 설명력 인과성 아님, 제3요인 영향 가능
Pearl SCM 구조적 인과 DAG, 개입(do-operator) 모델 구조의 정확성 필요
Rubin Framework 처치 효과 반사실적 비교 관찰되지 않는 결과 추정 필요
Cointegration 장기 균형 관계 비정상 시계열의 선형 조합 인과 아님, 단기 예측력 없음