xtile newvar=oldvar, nquantiles(분위수)
예제
오른쪽과 같이 "100 quantiles of 가구소득"라는 변수설명이 붙은은 변수가 만들어졌다.
아래와 같은 값을 갖는 변수다. 해당 가구소득이 100분위 중 몇분위에 속하는지를 알려준다. 물론 10분위등 몇분위로 할지는 선택.
물론 가중치도 설정 가능.
만들어진 분위수 변수를 가지고 tabstat 등의 명령어로 분위별 평균소득 등을 구해볼 수 있음.
xtile과 pctile의 차이점
pctile 가구소득10_pctile=가구소득, n(10)
xtile 가구소득10_xtile=가구소득, n(10)
아래와 같이 xtile은 해당 응답자가 몇분위에 속하는지를 값으로 갖는 변수를 만드는 것이다.
pctile은 응답자(관측치)와 상관없이 그냥 분위경계값을 변수로 생성한다.
pctile로 만든 값을 아래와 같이 쓸 수 있다.
출처: stata 15 매뉴얼
또는 아래와 같이 데이터셋 브라우저에서 긁어서 복사해 엑셀어 넣어서 표로 편집해서 쓸 수도 있겠다.
이것을 centile과 비교해보자.
centile 명령어와 비교
* centile은 pctile과 달리 변수를 만드는게 아니라 바로 분위경계값을 화면에 보여주지만 가중치 적용이 안된다는 치명적 한계.
* 0분위 경계값은 최소값이다. 100분위 경계값은 최대값이다.
'Stata' 카테고리의 다른 글
stata do file (loop 등) 진행중 에러나도 계속 진행시키는 방법 - capture noisily (0) | 2017.12.29 |
---|---|
stata 14 버전 이상의 유니코드 파일을 13버전 이하의 아스키 코드로 저장하기 (하위버전 저장) (0) | 2017.11.20 |
패널분석에서 한번이라도 경험한 가구, 경험한 횟수 알기 (변수 만들기) (0) | 2017.11.09 |
stata의 dta 파일을 spss의 sav로 변환하기 - 변수설명 한글 깨짐 없이 // conver stata (*.dta) file to spss (*.sav) (0) | 2017.11.07 |
stata 에서 01 02 등 0이 들어가는 숫자 반복하기 (loop) (0) | 2017.10.28 |
댓글