본문 바로가기
통계 , 수학

패널분석에 대해 알아보자! (작성중)

2017. 5. 6.

먼저 pooled cross section이 있다.

이것은 주로 n을 늘리기 위함이다.

단, 연도에 따라 독립변수와 종속변수의 관계가 변하지 않는다는 가정 하에서다.

이 때 연도별 특성에 상수항이 달라질 수 있는데 이를 위해 연도 더미를 넣는다. 

예를 들면 이런식이다. 

기준년 72년을 빼고 각 연도에 해당하는 더미가 들어갔다.

기준년에 비하면 시간이 지날수록 점점 연도더미 변수의 계수값이 낮아진다. 연도가 갈수록 출산아이의 숫자가 줄어든다는 것이다.

84년의 경우 72년( base year)에 비해서 평균적으로 .0545명의 아이를 덜 낳았다(나이 교육 등 다른 조건이 동일하다는 가정에서).


이 모델에서 시간의 더미변수들이 의미하는 것은 교육나이 등 다른 조건들이 동일하다는 조건에서 순수하게 시간에 따른 차이다.

이 모델에서 시간 이외의 변수들이 의미하는 것은 시간을 고정한 채 교육 나이 등이 출산에 미치는 영향이다.

그러므로 이 모델의 가정은 시간에(연도에) 상관없이 교육이나 나이가 출산에 미치는 영향은 동일하다고 가정하는 것이다.





 다음은 2개년도 패널 분석이고. 고정효과 모형이다. (unobserved effects model or a fixed effects model)

(고정효과 모형은 말그대로 시간에 따라 변하지 않는 개별 관측치의 관측되지 않은 고정된 효과를 모델에 포함하여 분석한다는 것이다 => unobserved effects model)

2개년도로 t=1,2

위의 모델의 d2t는 시간 더미변수다. 그러므로 t1의 절편은 베타0, t2의 절편은 베타0+델타0이 된다.

작은 t와 작은 i 는 각각 시간과 개인을 나타낸다.

ai항의 경우 t 가 없으므로 시간에 따라 변하지 않는다는 것이고 이 항은 시간에 따라 변하지 않는(fixed) 특성이다.

ai는 '관측되지 않은', '시간에 따라 변하지 않는' , '개인 또는 관측치마다 다른'  특성이다.

아래는 위와 똑같은 식의 예제다.

두 년도에 도시마다 실업률이 범죄율에 미치는 영향을 보고자 하는 식이다.

d87은 87년도 더미변수, ai는 관측되지 않은 도시 효과 또는 도시고정효과라고 할 수 있다. (unobserved city effect or a city fixed effect)

이것이 의미하는 것은 시간에 따라 변하지 않는 도시 고유의 특성(관측되지 않은)이다.

그러므로 이 변수를 추가한다는 것은 도시마다의 고유특성을 통제한다는 것이다. 도시마다 고유의 특성이 동일하다는 가정에서의 실업률이 범죄율에 미치는 영향을 본다는 것이다.



pooled cross section이 아닌 매년 동일한 샘플에게서 조사하는 패널자료를 이용한 패널분석을 알아보자.

이러한 데이터의 장점은 시간에 따라 변하지 않는 사람(또는 회사, 도시 등 관측단위)의 고유의 특성을 통제할 수 있다는 것이다.

Panel data sets are most useful when controlling for time-constant unobserved features—of people, firms, cities, and so on





















source : https://sites.google.com/site/econometricsacademy/




댓글