본문 바로가기
Stata

[Stata] 분위수 만들기 (소득 10분위, 100분위 등), 분위 경계값 - xtile, pctile, centile

2017. 11. 14.

xtile newvar=oldvar, nquantiles(분위수)


예제

오른쪽과 같이 "100 quantiles of 가구소득"라는 변수설명이 붙은은 변수가 만들어졌다.

아래와 같은 값을 갖는 변수다. 해당 가구소득이 100분위 중 몇분위에 속하는지를 알려준다. 물론 10분위등 몇분위로 할지는 선택.

물론 가중치도 설정 가능.

만들어진 분위수 변수를 가지고 tabstat 등의 명령어로 분위별 평균소득 등을 구해볼 수 있음.



xtile과 pctile의 차이점

pctile 가구소득10_pctile=가구소득, n(10)
xtile 가구소득10_xtile=가구소득, n(10)

아래와 같이 xtile은 해당 응답자가 몇분위에 속하는지를 값으로 갖는 변수를 만드는 것이다.

pctile은 응답자(관측치)와 상관없이 그냥 분위경계값을 변수로 생성한다.

pctile로 만든 값을 아래와 같이 쓸 수 있다.

출처: stata 15 매뉴얼


또는 아래와 같이 데이터셋 브라우저에서 긁어서 복사해 엑셀어 넣어서 표로 편집해서 쓸 수도 있겠다.


이것을 centile과 비교해보자.

centile 명령어와 비교

* centile은 pctile과 달리 변수를 만드는게 아니라 바로 분위경계값을 화면에 보여주지만 가중치 적용이 안된다는 치명적 한계.

* 0분위 경계값은 최소값이다. 100분위 경계값은 최대값이다.



댓글