메커니즘 없는 통계적 추론

영가설 검정은 많은 분야에서 명제의 참거짓을 판단하는 가장 널리 쓰이는 도구입니다. 흔히 P-value나 신뢰구간으로 대표되는 방식 말입니다. 주로 어떤 모수가 0이라는 시험가설 하에서 관찰된 혹은 그보다 더 극단적인 데이터가 발생할 확률을 계산하여 이 확률이 어떤 기준치보다 작으면 시험 가설을 기각하고 대안 가설을 채택하는 형태입니다. 여기에 두 가지 임의적인 기준이 있습니다. 하나는 데이터를 극단적이라고 판단하는 확률이0.05 같은 숫자로 정해져 있다는 것이고 다른 하나는 기준이 되는 시험가설의 모수를 0으로 가정하는 것입니다. 이렇게 시험가설의 모수가 0일 때 우리는 시험가설을 영가설이라고 부릅니다. 오늘은 두 번째 문제를 중점적으로 왜 통계적 검정에서 메커니즘이 중요한지 다루겠습니다. 왜냐하면 시험가설이 영가설일 이유는 통계학적으로 존재하지 않기 때문입니다. 모수가 0인 가설도, 10인 가설도, 혹은 1억인 가설도 모두 시험가설이 될 수 있습니다.

Card and Krueger (1994)

데이비드 카드와 앨런 크루거는 1994년최저임금에 대한 기념비적인 연구를 발표합니다. 안타깝게도 일찍이 고인이 된 크루거와 달리 카드는 이 업적으로 2021년 노벨경제학상을 수상합니다. 그들은 펜실베니아와 뉴저지가 비슷한 시기에 다른 최저임금 정책을 편 것을 이용해 최저임금이 고용에 미치는 영향을 이중차분법으로 측정하였습니다. 그 결과, 기존의 통념과 다르게 최저임금 인상이 고용에 영향이 없는 것으로 나타났습니다. 이 연구는 최저임금에 대한 경험적 연구를 본격적으로 촉발했을 뿐만 아니라 이중차분법이라는 인과추론 기법을 대중화했다는 점에서도 큰 의의가 있습니다. 하지만 제가 주목할 것은 잘 수행된 미시경제학 연구가 다른 분야와 갖는 중요한 차별점에 대한 것입니다.

겉보기에 이 연구는 여느 다른 논문과 마찬가지로 고용에 미치는 최저임금의 효과가 없는 것을 시험가설로 놓고 회귀분석을 이용하여 최저임금의 고용효과를 측정합니다. 효과가 없는 것을 시험가설로, 효과가 있는 것을 대안 가설로 정하는 것은 얼핏 보기에 다른 연구와 다를 것이 없죠. 그러나 아주 기본적인 경제학을 상기하면 이러한 선택은 경제학적 통념에 완전히 배치되는 것입니다.

경제학적 논의는 대체로 완전경쟁시장에서 출발합니다. 이러한 시장에서는 시장참가자의 효용이 최대화되는 지점에서 평형점이 발생한다는 것을 수학적으로 증명할 수 있습니다. 그래서 대학 교과서에서 가장 먼저 배우는 내용이기도 하고, 동시에 최저임금이나 관세와 같은 외부적인 작용을 반대하는 논거로 널리 쓰입니다. 이러한 시장이 가장 수학적으로 단순하고 직관적이라는 사실은 완전경쟁시장이 경제학에서의 영가설에 해당함을 알려줍니다. 즉, 어떤 미시경제학적 모형이든 그 쓸모를 증명하기 위해서는 완전경쟁시장보다 데이터를 월등히 잘 설명할 수 있어야 합니다.

이 관점에서 보면 카드와 크루거의 영가설 설정은 너무나도 이상합니다. 왜냐하면 완전경쟁시장에서는 최저임금이 평형점에 견주었을 때 고용을 줄이기 때문입니다. 이 상황에서 완전경쟁시장이라는 영가설을 고려하면 회귀분석은 최저임금의 효과가 0인 것을 기각하는 것이 아니라 음의 값을 갖는 것을 기각해야하죠. 반면, 최저임금의 고용효과가 0이기 위해서 우리는 완전경쟁시장이 아닌 다른 시장 메커니즘을 필요로 합니다. 그것이 바로 독점적경쟁시장 (Monopolistic competition) 입니다. 독점적 경쟁시장에서는 동일하지 않은 시장 지배력 (Market power)으로 인해서 최저임금 같은 규제가 오히려 시장의 비효율성을 줄일 수 있습니다. 그 결과, 최저임금이 완전경쟁시장과 다르게 고용에 효과를 미치지 않거나 심지어는 고용을 증가시키는 결과를 가져올 수도 있습니다. 따라서 이론적인 관점에서 보면 완전경쟁시장에서 도출되는 음의 효과가 영가설이 되어야 하고 독점적경쟁시장에서 도출되는 0의 효과가 시험가설이 되어야 합니다. 그런데 여러분은 효과가 0인 것을 기각하는 것이 아닌 효과가 0이 아닌것을 기각하는 연구를 보신 적이 있나요?

카드와 크루거의 연구가 영가설을 기각하지 못했음에도 불구하고 오히려 더 주목을 받은 것은 통계학적으로 유의하지 않은 결과 (영가설을 기각하지 못하였음)에도 불구하고 경제학적으로 기존 이론에 배치되는 결과를 얻었기 때문입니다. 이는 현상의 원리와 메커니즘이 견고한 미시경제학이라는 분야에서 통계적 검정이 진리판단에 미치는 부수적인 역할을 보여줍니다. 현상과 메커니즘에 대한 이해가 없기 때문에 통계적 유의성이라는 외부적인 기준에 의존할 수 밖에 없는 다른 분야와의 큰 차이가 여기 있습니다.

통계학은 통계학일 뿐이며 무엇이 진리인지 판단하는데 보조적인 역할을 할 뿐, 각 분야의 참거짓 여부는 궁극적으로 그 분야의 이론과 메커니즘에 근거한 것이어야 합니다. 그러나 이러한 메커니즘이 부재한 많은 분야의 현실 때문에 통계학적 유의성은 마치 성경 말씀처럼 이해되어 남용되고 있습니다. 제가 병원에 있을 때 논문을 쓰다가 막힌 사람들이 통계고수를 찾는 것을 많이 보았습니다. 다들 그 고수는 뭔가 답을 알고 있을 거라고, 좀 더 적나라하게는 같은 데이터로 통계학적으로 유의한 결과를 낼 방법을 알 거라고 기대하는 것이죠. 하지만 그 전에 통계학적으로 유의한 결과와 그렇지 않은 결과 중 무엇이 더 의학적으로 흥미로운 것인지 스스로 답하는 것이 더 중요하다는 점을 강조하고 싶습니다.

Comments