본문 바로가기

Stata 50

stata 14 버전 이상의 유니코드 파일을 13버전 이하의 아스키 코드로 저장하기 (하위버전 저장) stata 13버전 이하에선 영어 이외의 문자에 아스키 코드를 사용한다. stata 14 버전 이상에선 유니코드를 사용한다. 그러므로 데이터 파일을 이상의 두 버전에서 쓰기위해 변환 과정이 필요하다. - 영어는 상관없다. 영어 이외의 언어가.. 상위버전으로 올리는 작업은 14버전 이상에서 unicode 명령어로 사용 가능 하위버전으로 내리는 작업은 14버전 이상에서 user written 명령어인 unicode2ascii를 설치하여 사용 가능 예시 unicode2ascii 파일명 (파일명에 확장자까지 입력해야 함 , 또는 와일드카드로 여러 파일 처리 가능) * stata 기본적인 다운세이브 기능인 saveold는 하위버전에서 열리게만 해주지 한글 인코딩을 변환해주지 못하므로 열리긴 해도 한글이 깨져서 열.. 2017. 11. 20.
[Stata] 분위수 만들기 (소득 10분위, 100분위 등), 분위 경계값 - xtile, pctile, centile xtile newvar=oldvar, nquantiles(분위수) 예제 오른쪽과 같이 "100 quantiles of 가구소득"라는 변수설명이 붙은은 변수가 만들어졌다. 아래와 같은 값을 갖는 변수다. 해당 가구소득이 100분위 중 몇분위에 속하는지를 알려준다. 물론 10분위등 몇분위로 할지는 선택. 물론 가중치도 설정 가능. 만들어진 분위수 변수를 가지고 tabstat 등의 명령어로 분위별 평균소득 등을 구해볼 수 있음. xtile과 pctile의 차이점 pctile 가구소득10_pctile=가구소득, n(10) xtile 가구소득10_xtile=가구소득, n(10) 아래와 같이 xtile은 해당 응답자가 몇분위에 속하는지를 값으로 갖는 변수를 만드는 것이다. pctile은 응답자(관측치)와 상관없이 .. 2017. 11. 14.
패널분석에서 한번이라도 경험한 가구, 경험한 횟수 알기 (변수 만들기) by 와 egen total 또는 egen max를 쓰면 된다. by라는 기능은 여러모로 활용된다. 참조 : https://www.ssc.wisc.edu/sscc/pubs/stata_panel.htm#how_many 패널 데이터는 long으로 구성되어 있다고 가정한다. 가구별(hhid)로 해당기간동안 임대소득(rent)이 있었던 년수의 변수(rent_times) 생성 by hhid: egen rent_times=total(rent!=0 & rent!=.)- 자 여기서 egen total 을 사용하였는데 이는 total 뒤에 괄호 안의 조건을 만족시키는 관측치의 개수를 변수의 값으로 만들라는 것이다. 여기선 0이 아니면서 또 .도 아닌 그러니까 뭔가 숫자(소득)가 있었던 년도의 개수를 변수의 값으로 생성하.. 2017. 11. 9.
stata의 dta 파일을 spss의 sav로 변환하기 - 변수설명 한글 깨짐 없이 // conver stata (*.dta) file to spss (*.sav) * 사용 버전 : stata 15, spss 24 , R 3.4 R을 사용하는 방법이다. STATA 에서 작성된 한글로 된 변수 레이블, value label을 SPSS에서도 그대로 살리기 위한 방법이다. 기존에 dta를 sav로 변환하는 방법은 여러가지가 있었다. 만약 문서의 변수 레이블 등이 모두 영문으로 작성된 경우라면 stata의 "savespss"명령어를 쓰는 것이 가장 간편하다(추가 패키지 설치 필요). 그러나 내가 쓰는 버전에선 한글이 깨진다! R의 "rio"라는 패키지에서 제공하는 "convert"명령어를 이용하면 된다. > install.packages("rio") > library(rio) > convert("NaSTaB09H#.dta", "NaSTaB09H#.sav") 이렇게 세줄이면.. 2017. 11. 7.
stata 에서 01 02 등 0이 들어가는 숫자 반복하기 (loop) https://www.stata.com/statalist/archive/2002-11/msg00229.html아래의 방법 이외의 방법은 위 링크 참조 방법1 foreach y in 01 02 03 04 05 06 07 08 09 10 11 12 { ... } 방법2forvalue x= 1/18 { if length("`x'") == 1 local x 0`x' 2017. 10. 28.
residual plots - 그래프로 잔차분석하기 (작성중) 잔차분석을 포함하여 회귀분석후 모형을 진단하기 위한 그래프로는 다음과 같은 것들이 있다. 먼저 두 변수간 scatter plot을 그려보자. 가처분 소득(Dinc)과 임대소득(rent_miss)간 산점도이다. . scatter rent_miss Dinc, mcol(%10) msize(vsmall) || lfit rent_miss Dinc빨간선은 선형 추정선이다. 1. Residual vs Fitted Value plot (1) 수동으로 그리기 * 자동으로도 할 수 있는데 수동으로 먼저 해보는 이유는 이것이 무엇인가를 이해하기 위해서이다. 1) fitted value (y hat) 변수를 만들어주고 2) residual (u hat) 변수를 만들고두개의 산점도를 그린다. 1) 회귀분석 후 . predict.. 2017. 9. 13.
가변 히스토그램 그리기 http://www.stata-journal.com/sjpdf.html?articlenum=gr0003 2017. 9. 9.
Making Stata shortcut (custom) : Stata 명령어 단축키 만들기 원하는 단축명령어.ado 파일을 만들어서 ado 폴더에 넣어주면 된다. (do-file editor에서 작성 후 *.ado 로 save) 내용음 다음과 같이 하면 된다. example : codebook => c program c codebook `0' end ado 폴더는 두개다. 하나는 유저가 추가하는 용도로 주로 c:\ado 에 위치하며 해당 알파벳 폴더에 넣어주면 된다. 나의 경우는 C:\ado\plus\c\에 넣어주었다. stata 기본 ado 파일 폴더에 넣어주어도 될것이다. C:\Program Files (x86)\Stata15\ado\base\c\ 다음과 같이 codebook 명령어를 c로 사용할 수 있다. 참고로 stata의 codebook은 9개가 넘어가는 건 다 안보여준다. 다 보려면.. 2017. 9. 8.
stata 그래프 합치기 (여러 그래프 한 그림에 그리기) step 1 그래프 명령어, name(이름1)그래프 명령어, name(이름2)* 그래프 이름은 문자로 시작해야 함(숫자x) step 2 gr combine 이름1 이름2 ,ycom *ycom은 y축을 같은 단위로 만드는 것 2017. 9. 7.