본문 바로가기

통계 , 수학45

2차 방정식 (quadratic) 회귀분석에서 감소(최대값) 또는 증가하는(최소값) 시점 알기 회귀분석은 직선형 관계의 분석이지만 제곱항을 넣어주면 곡선관계도 분석할수 있다. 예를 들면 평균임금은 나이와 함께 증가하다 어느 연령대에서는 감소하는 concave한(위로 볼록한) 2차방정식 곡선의 형태를 취한다. 그러므로 임금 = a나이제곱 + b나이 의 형태로 회귀식을 세우면 곡선형태의 관계를 파악할 수 있다.그러면 임금이 감소하기 시작하는 이 곡선의 최대값은 몇살때인가?아래와 같이 계산해주면 된다. x=−b2a when f(x)=ax2+bx+c 그래서 아래의 경우엔 - 0.532/2(-0.0058) 을 계산해주면 46살이 나온다. 참조 : https://www.quora.com/How-I-find-the-turning-point-of-a-quadratic-equation 2017. 5. 3.
Rstudio 말고 R을 GUI(메뉴) 형식으로 쓸수 있는 프로그램 : RKWard 그저 메뉴만 클릭해서 무료 통계프로그램을 돌리고 싶으신 분들을 위해 RKWard 라는 프로그램을 추천합니다. https://rkward.kde.org/R studio라는 널리 쓰는 프로그램이 있지만 메뉴기능은 없습니다. R을 기반으로 돌아가는데 변수 보기도 좋고 stata 의 데이터도 잘 불러와지고 변수 label이나 value lable도 잘 가져와서 보여줍니다.SPSS와 STATA import 기능이 있는데 spss는 한글이 깨져서 나오고 stata는 잘나오네요. 명령어가 어렵다 하는 분들은 이걸 쓰시면 되겠습니다. 물론 편의성에서는 stata를 못따라오지만 무료니까.. 2017. 4. 25.
[stata] 회귀분석 결과에서 SST, SSE, SSR, R-squared의 의미 (울드리지 책 기준) * 주의 : 설명하는 사람에 따라 SSE(Explained sum of squares)를 SSR(Regression Sum of Squares)로 표현하거나 SSR(Residual sum of squares)를 SSE(Error Sum of Squares)로 뜻은 같으나 약자만 보면 반대인 것처럼 표현하는 경우가 있습니다. 본 글에서 모든 약자는 울드리지 계량경제학 책을 기준으로 설명된 것입니다(용어 혼돈과 관련하여 본 글의 댓글들 및 타 블로그 글 참조). 총 변동 Total SS : total sum of squares (SST) : : 개별 y의 편차제곱의 합 설명된 변동 Model SS :explained sum of squares (SSE) : : 회귀식 추정 y의 편차제곱의 합 * 경우에 따라.. 2017. 4. 4.
미분의 기초이해 - 미분이란 무엇인가 - 도함수, 프라임 출처: http://zekesnote.tistory.com/411 []위의 함수 를 의 "도함수"라고 부릅니다."미분한다"라는 말은 "도함수를 구한다"라는 말과 같게 되죠.도함수를 수식으로 표시할 때에는 , 혹은 로 쓰게 되고,전자의 경우 "에프 프라임 엑스"라고 읽습니다.이런 표기법은 라그랑주라는 학자에 의해 고안되었습니다.하지만, 이 방법은 표기가 편하다는 장점을 갖는 대신에,"무엇으로 미분하는가?"에 대해 명확하지 못하다는 단점이 있습니다.변수가 항상 x 하나일 수는 없는 노릇이거든요.그래서 새로 나온 방법이 라이프니츠가 고안한 표기법입니다. ,, 이 세가지 경우인데요,"y를 x로 미분한다"라는 뜻이죠. 2017. 3. 13.
OECD 각국 조세 구성비율 비교표 http://www.oecd-ilibrary.org/taxation/revenue-statistics_19963726 2017. 3. 8.
분산, 표본분산, 표준편차, SST 분산, 표준편차, SST, 표본분산 Measures of Variability: Variance and Standard Deviation 분산 또는 표준편차와 같은 것은 얼마나 값들이 퍼져있는가 분포를 한가지 숫자로 요약해서 보여주는 것이다. variance, which tells us the expected distance from X to its mean: 아래는 분산의 중요한 속성이다. 저 괄호 안에 있는 상수는 무의미하다. 그리고 분산이란 편차를 제곱한 값이기 때문에 안에 곱하기로 붙어있는 a가 나오려면 제곱으로 나와야 한다. x의 표준편차 standard deviation은 아래와 같이 표기. 무작위 변수일때는 시그마(σ)로도 표기 표준편차는 분산에 루트를 씌워준 것 분산의 속성과 마찬가지로 아.. 2016. 9. 30.
로그란 무엇인가, 왜 통계에서 로그를 사용하는가? (회귀분석시 자연로그 해석) 이와 관련하여 최근에 작성한 아래 글을 참조하여 주십시요.왜 자연로그는 비율(%)변화를 나타낼 수 있는가 =================================================================== (출처: 울드리지 계량경제학) 위의 표에서 보면 독립변수(x)에만 로그를 취해준 경우(Level-Log)에 해석은 %델타x : x가 1% 변화할 때계수값 / 100만큼 y가 변화한다는 것이다. 즉 회귀분석 결과 베타1이 +0.5가 나왔다고 하자. 그러면 x가 1% 증가할 때 y는 0.5/100 = 0.005증가한다는 것이다. (10% 이상의 해석은 어려움) 계수값에서 100을 나눠주는 것을 주의해야 한다. 한편 종속변수에만 로그를 취해준 경우를 보자 (Log-Level)이 경우에도.. 2016. 7. 1.
매개효과 (회귀분석) www.esop.kr/pdf/회귀분석매개효과.pdf 2016. 6. 22.
회귀분석에서 t값의 의미 / t-test (작성중입니다) t값은 시그널의 강도라고 할 수 있다.. (노이즈 대비 시그널) 당연히 시그널의 강도가 셀수록 좋은 것이다. 노이즈가 너무 많으면 시그널이 잘 안잡히거나 의미가 없다. 회귀분석에서의 t값(t검정에 대한 통계량)은 독립변수와 종속변수간에 선형관계(관련성)가 존재하는 정도를 나타낸다. t값을 구하는 식은 아래와 같다. (자료 : 이성원, 감정평가를 위한 회귀분석의 이해와 활용) 위에서 귀무가설(영가설;null hypothesis)은 두개의 상관관계(선형관계)가 없다는 것이다. 그러므로 기울기인 회귀계수가 0이라는 가정이다. 그러므로 (베타1)은 0이다. (아래 슬라이드) spss 돌리면 아래와 같이 나온다. 결국 t 값은 회귀계수 나누기 표준오차(표준편차)가 된다. The t statistic is the .. 2016. 6. 13.