Robust standard error in parametric models

최근 공공데이터를 활용한 연구를 진행하고 있습니다. 이 데이터의 경우 이상한 보고 규칙 때문에 일부 데이터가 누락된 상태로 공개되었는데 널리 쓰이는 패키지로 적절하게 처리할 수 없어서 직접 코드를 짜서 처리 중입니다. 해당 모델의 경우 Maximum Likelihood Estimation (MLE)로 점추정 (point estimate)을 구하고 있는데 분산추정을 위해서는 데이터의 구조를 적절하게 고려해야만 했습니다. 경제학에서는 지리적으로 인접한 위치에서 추출한 데이터 사이에 공간적 상관관계 (spatial autocorrelation)을 고려하기 위해 추정량의 표준오차 (standard error)을 보정하는 여러 방법을 씁니다. 그 중에서 가장 유명한 것은 Conley (1999)입니다. 동시에 여러 데이터가 한 위치에서 추출됐을 경우 마찬가지의 자기상관 (autocorrelation) 구조가 발생하는데 이를 고려한 표준오차를 주로 cluster robust 분산으로 부릅니다. 가장 유명한 것이 이른바 heteroskedascity and clustering (HAC) robust 추정량입니다. 이 글에서는 이번 프로젝트를 진행하면서 공부한 것을 간략하게 설명할 것입니다. 바로 일반적인 MLE 추정량의 robust 표준오차에 대한 것입니다. 참고로 이 글은 엄밀한 증명을 추구하지 않습니다. 때가 되면 업데이트가 될 수도…?

More …