본문 바로가기

Stata 50

SPSS(sav)파일 STATA(dta)로 변환하기 (R 사용) 한글 안깨지게 요구조건 : 변수 레이블과 value label까지 한글을 잘 살릴 것 환경 : stata 15, 대우패널 sav(spss) 데이터 최초로 시도했던 방법은 아래인데 한글이 깨진다.install.packages("rio") library(rio) convert("kor_data_19930009.sav", "kor_data_19930009.dta") stata의 usespss명령어도 잘 듣지 않았다. stata가 16버전 이상이면 바로 불러오는 기능이 있다. 물론 spss최신버전이 있으면 불러온 다음에 stata 14버전으로 export 해도 된다. r에서 아래 방법으로 하니 된다.(rstudio 메뉴에서 import하면 인코딩 옵션이 안주어져서 깨짐)library(haven)setwd("C:\\작업폴더").. 2020. 9. 15.
stata 에서 cdf 그리기 (누적확률분포) 1. 누적분포변수만들기 cumul 변수명 [가중치], gen(누적분포변수) 2. 정렬 sort 누적분포변수 3. 그리기 line 누적분포변수 변수명 사용례 cumul p_inc_bb1 [aweight = pcwt] if p_inc_bb1>0 & paa006==1 & year==2018 , generate(근로소득cumul) sort 근로소득cumul line 근로소득cumul p_inc_bb1 if inrange(p_inc_bb1,1,10000) & paa006==1 & year==2018 , ylab(#10, grid) xlab(#20, grid) xsize(9) * DASP 패키지 안의 cdf 명령어가 간편하긴 한데 가중치 기능이 없음. 2020. 5. 10.
stata 분위별 평균값(평균소득) 구하기 - 백분위 천분위 등 1. 먼적 xtile명령어를 통해 분위수 변수를 만들어 준다. xtile 만들변수명 = 소득변수명 , nquantiles(괄호 안에 몇분위로 나눌 것인지 숫자 입력) * 가중치 옵션 가능 아래는 천분위로 만들어본 것 2. 다음으로 tabstat을 통해 분위수별 평균소득을 산출한다. tabstat 소득변수명 , by(분위수변수명) 2020. 4. 3.
Stata - 변수끼리 더하기 빼기 할때 결측치(missing value)도 포함시켜서 하기 0이라고 코딩이 안되어 있고 결측치( . ) 로 코딩이 되어 있으면 gen A=a+b 이런 식으로 변수 만들때 결측치 있는 것들은 다 빠져버린다. 여러 번수를 더하는 거라면 egen A=rowtotal (a b c d ...) 이런 식으로 하는 방법이 있는데 더하기 빼기가 섞여있다면, 다음 두가지 방법이 있다. 1. cond 사용 2. 결측값을 0으로 변환 후 사용 1. "cond"라는 조건명령어를 넣어주는 방법이 있다. cond의 문법은 아래와 같다. condition;조건의 약자. cond ( x, a, b [,c] ) x 가 참이면 a 반환 ( 여기서 x 는 변수명이 올수도 있고 x>30 이런 식으로 조건을 넣을 수도 있다) x 가 거짓(또는 0)이면 b 반환 x 가 missing 이면 c 반환 (.. 2019. 10. 2.
Stata 줄바꾸기 (do file editor에서 명령어 여러 줄로 쓰기) do file editor에서 줄바꿔서 여러줄로 명령어 쓰는 두가지 방법 1. /// 예 list hid year wave /// if hid==1 -> 매줄마다 /// 를 써줘야. 위 전체를 한줄로 인식한다. 2. #delimit ; / #delimit cr (여러줄일 경우) 예 #delimit ; (-> 이제부턴 별다른 표시 없이 한줄로 인식하고 명령어를 끝낼 때에는 ; 를 써줘야 한다. ;가 엔터와 같은 역할.) list hid year wave if hid==1 ; --> 요대로 끝내도 되고 다시 원상태로 한줄입력상태로 바꾸려면 아래 명령어를 입력 #delimit cr 단축어로 #d ; 그리고 #d cr 이런식으로 쓸 수 있다. 2018. 5. 18.
[패널데이터] 고유 관측치(예를 들면 개인 및 가구 id)별 개수 보기 예를 들어 개인아이디별로 데이터셋에 몇번의 관측치가 있는가를 알고 싶을 때 contract 명령어 사용 preserve (데이터셋 저장) contract 변수명 (데이터셋이 대체됨) (데이터 살펴보고) restore 데이터셋 복구 단순히 고유값이 몇개인지 보려면 codebook 변수명 2018. 1. 24.
gini decomposition with weight in stata 지니계수 분해에 가중치 적용하기 "diginis" command in DASP packageYou can use it by menu(GUI) also. install : http://dasp.ecn.ulaval.ca/ * "diginis" is not fast because it calculates standard error. you should be patient. * "descogini" is fast but does not support weights 2018. 1. 16.
<stata 단축키 모음> stata 단축키 모음 (stata shorcuts) 아래는 실제 많이 쓰는 유용한 단축키 Ctrl+R 이전 명령문 다시 불러오기 - 반복 페이지 업다운 - 위와 동일한 기능이면서 더 이전것까지 불러올 수 있음. tab - 변수리스트 드롭다운 창 띄우기 두번클릭 : 단어(변수) 선택 (윈도우 공통)세번클릭 : 한줄 선택 (Ctrl+L과 같음) Q - 중지하기 Ctrl + 1~9 각종 창 띄우기 아래 문서 참조 http://www.stata.com/manuals13/u10.pdf 2017. 12. 30.
stata do file (loop 등) 진행중 에러나도 계속 진행시키는 방법 - capture noisily do file 여러 명령이나 foreach forvalue 등 loop 돌아가다가 에러가 뜨면 중간에 멈춘다. 이런 식으로. no observations r(2000) 이런 경우 명령어 앞에다 이걸 써주면 된다. capture noisily : 그럼 이런 식으로 no observations이 나와도 계속 진행한다. 2017. 12. 29.