개요
선형회귀모형
을 보자. 여기서
이다. 즉 오차항은 ① 모든 표본에 대해 분산이 같고, ② 자기상관이 없다. 이에 더해 가설검정을 하기 위해서, 소표본일 때에는 ③ 추가적으로 정규분포의 가정을 더하여 통상적인
그러나 이분산이 존재할 경우,
이고
또한 자기상관이 존재할 경우에는
Gauss-Markov 정리에 따르면, 내생성이 존재하지 않는 선형회귀모형에서 오차항이 동분산이고 자기상관을 갖지 않는 경우, OLS 추정량은 선형 불편 추정량 중에서 분산이 가장 작다(BLUE). 또한 오차항이 정규분포를 따른다는 추가적인 가정이 더해지는 경우, Rao-Blackwell 정리와 Lehmann-Scheffe 정리에 의해 OLS 추정량은 유일한, 분산이 가장 작은 불편추정량이 된다(UMVUE).
그러나 이분산이나 자기상관이 존재하는 경우에는, OLS 추정량은 여전히 불편추정량이고 일치추정량이지만, 분산이 최소임을 보장할 수 없다(단
분산이 최소임을 보장할 수 없기 때문에 이를 근거로 하는 가설검정 역시 신뢰할 수 없게 된다.
검정법
이분산
동분산이라면
Breusch–Pagan Test
브로이슈-파간 검정은, LM검정의 일종이며, 다음과 같이 가설을 설정한다.
여기서
를 추정한 다음 결정계수
White Test
화이트 검정은 1단계로 원 모형을 추정하여 얻은 잔차의 제곱을, 2단계로 원래 회귀모형의 모든 설명변수, 각 설명변수의 제곱, 그리고 각 설명변수들의 교호작용항으로 적합하여 얻은
자기상관
Dubin-Watson Test
아래 선형회귀 모형
에서 오차항이 AR(1)구조
를 따르는지 여부를 확인하고 싶다. 이 경우 잔차
에 대해서, 이 값이 0인지 여부를 확인하면 된다. 그러나
을 사용한다. 왜냐하면
과 같은 이차형식(quadratic-form)의 비율로 표현되어 분포가
때문에
이고, 유의수준
라면 오차항이 양의 자기상관관계를 가지고 있다고 판단한다. 라면 오차항이 양의 자기상관관계를 가지고 있다고 볼만한 근거가 없다고 판단한다. 라면 불확정이라고 판단한다. 이 불확정의 영역은 AR(1)의 가정이 위배되거나 독립변수 내에 ‘종속변수의 시차(lagged variable)‘가 포함되는 경우 넓어져 검정력(power)을 떨어뜨린다.
한편 유의수준
라면 오차항이 음의 자기상관관계를 가지고 있다고 판단한다. 라면 오차항이 음의 자기상관관계를 가지고 있다고 볼만한 근거가 없다고 판단한다. 라면 불확정이라고 판단한다.
Durbin Test
더빈-왓슨 통계량은 독립변수 내에 종속변수의 시차변수가 포함되는 경우(ex. 자기회귀 이동평균 모형) 편향을 갖게 되어, 자기상관이 과소평가된다. 이를 교정하기 위해 다음과 같은 더빈
단, 여기서
Breusch–Godfrey Test
만일 오차항이 AR(1)이 아니라, 자기상관의 차수가 1이 아니라 더 크다고 예상된다면 LM검정 방식의
브로이쉬-갓프레이 검정을 사용한다. 이 검정은 잔차가 자기 자신의 시차에 대해 설명력을 갖는지 여부를 직접 검증해보는 것으로, 잔차
의 보조회귀(auxiliary regression)를 적합한 후, 결정계수
은 귀무가설
Ljung–Box Q Test
잔차가 여러 시차의 자기상관이 동시에 0인지 여부를 검정하기 위해서는 융-박스 Q 검정을 한다. 즉 브로이쉬-갓프레이 검정과는 달리,
여기서
해결법
만일 이분산이나 자기상관이 유의하게 검출되는 경우, 두 가지의 해결방안이 존재한다. 첫 번째로는 GLS를 적합시켜 오차공분산 구조를 명시적으로 모형화하는 것이다. 예를 들어 오차항이 AR(1)을 따른다면 Cochrane–Orcutt 방식의 추정을 통해, 즉
를 재추정하여 효율적인 추정량을 얻을 수 있다.
두 번째로는 모형은 그대로 둔 채로 분산-공분산 행렬을 Newey-West HAC 방식으로 바꾸는 것이다. 즉,
로 추정한다. 여기서