본문 바로가기

통계 , 수학45

통계를 위한 수학의 기초 쌓기 - 고등학교 수학교과서 활용 http://www.sungjipub.com/School/middlefile_down_pop09.html성지출판사 번창하세요 단원명 다운로드 I.적분법 한글 파일 PDF파일 II.확률 한글 파일 PDF파일 III.통계 한글 파일 PDF파일 단원전체 한글 파일 PDF파일 모범 답안 PDF파일 2017. 9. 13.
How to visualize data http://geocenter.github.io/StataTraining/part4/ 2017. 9. 6.
자동 모형 구성 | Data-based variable selection techniques http://fmwww.bc.edu/repec/bocode/g/GlobalSearchRegression.pdf 이미 60년대에 인기 At the end of the 1960s, both exhaustive (also known as exact) and heuristic approaches were very popular. 그런데 시간이 엄청 걸린다는 단점... 2017. 8. 23.
[회귀분석] 종속변수가 이진형 변수인 경우 - 로짓 / 프로빗 (작성중) 아래 강의안 참조 http://www.columbia.edu/~so33/SusDev/Lecture_9.pdf (이거 만드신 Sharyn O’Halloran 교수님 진짜 쉽게 설명하려고 고민 엄청 한듯) CDF(확률밀도함수)는 0에서 1사이에 값이 온다는 특징이 있다. 이 특성을 이용해 우리는 0과 1사이에 값이 있는 이진형 종속변수의 모델을 구성할 수 있다. 프로빗은 정규분포의 CDF를 이용한 것이고로짓은 로지스틱분포의 CDF를 이용한 것이다. 로짓분석 결과로 얻어지는 승산비(odds ratio)는 x가 한단위 증가할 때 y가 몇배 증가하는가 하는 "비율"에 대한 정보를 준다. 일반적 회귀분석에서 종속변수나 독립변수에 로그를 씌워서 비율로 해석할때와 같이 로그(로지스틱)는 비율 관계를 나타낼 수 있는 특.. 2017. 8. 17.
[회귀분석] - 추정량의 표준오차 (Standard error) 회귀분석에 있어서 두가지 주요한 절차는 1) 선형관계의 기울기를 구하는 것 2) 그 기울기의 정확도(신뢰도; 유의미성)를 구하는 것이다. 2번이 확실하지 않으면 1번이 의미가 없게 된다. 어찌보면 상관계수가 2번과 관련이 있다. 상식적으로(직관적으로) 생각해보면 두 변수간 산점도를 그렸을때 점이 선형으로 분명하게 나타나면 상관계수도 높고 회귀계수의 유미성도 높게(회귀계수의 표준오차가 작게) 나타날 것이다. 산점도의 점들이 분명한 선형관계를 보인다는 것은 추세선(회귀선)을 그었을때 각 점들이 그 점에 비교적 가깝게 몰려있다는 뜻이 된다. 각 점들이 추세선(회귀선)에 근접하여 있다는 것은 각 오차(개별 점이 회귀선에서 떨어진 거리 또는 추정값과 실제값의 차이)들의 값이 작다는 것이다. 그러므로 오차(추정값과.. 2017. 8. 16.
로짓, 프로빗 결과의 해석 (1) (odds ratio) 출처 : 효율적 경제분석을 위한 계량분석 기법 연구 (김창진 외) 출처 : https://www.youtube.com/watch?v=1cFYlMjEz-c 2017. 8. 9.
[통계, stata 학습 자료 / 사이트] 강의안 ppt 인데 상당히 직관적 이해가 되도록 설명이 잘 되어있음 (중급) http://www.columbia.edu/~so33/SusDev/SusDev.htm https://online.stat.psu.edu/stat462/ 관련된 행렬 기초설명도 해줌. 쉬움. Ani Katchova https://sites.google.com/site/econometricsacademy : 비디오, pdf, 예제파일. 쉽게 설명 stata 공식 사이트의 링크들 http://www.stata.com/links/ http://www.stata.com/support/faqs/ FAQ에도 유용한 정보가 많다. UCLA 예제형 학습 . 추천. https://stats.idre.ucla.edu/other/dae/ https:.. 2017. 8. 9.
avplot (Partial Regression Plot) Compute the residuals of regressing the response variable against the indpendent variables but omitting Xi Compute the residuals from regressing Xi against the remaining indpendent variables. Plot the residuals from (1) against the residuals from (2). Velleman and Welsch (see References below) express this mathematically as: Y.[i] versus Xi.[i] where Y.[i] = residuals from regressing Y (the resp.. 2017. 8. 8.
회귀분석 진단하기 (with STATA) - 잔차의 정규분포성(normality of risiduals), 이분산성(heteroscadasticity of variance of risiduals), 다중공선성(multicolinearity in dependant variables), 선형성(linearity) https://stats.idre.ucla.edu/stata/webbooks/reg/chapter2/stata-webbooksregressionwith-statachapter-2-regression-diagnostics/ 잔차의 정규분포 가정은 F-test와 T-test의 신뢰도를 보장하는 것이지 추정된 회귀계수와는 상관이 없다. 즉 오차항의 정규분포가 아니라도 unbiased 추정치를 산출한다. * 주의 : 독립변수나 종속변수가 정규분포일 필요는 없다!! 잔차의 정규성이 중요하다. After we run a regression analysis, we can use the predict command to create residuals and then use commands such as kdensity.. 2017. 8. 8.