본문 바로가기

분류 전체보기712

다중회귀분석의 가정들 여기서 3번 가정 관련해서 어느정도의 상관관계는 있을 수 있다. 4번과 관련된 것이 중요한데, 중요한 변수가 빠지면 이게 문제된다. 넣고 싶은데 관측이 불가능하거나 측정이 불가능하거나 해서 넣을수가 없는 변수가 있을 수 있다. 이것은 도구변수나 다른 방법들을 통해서... 이러한 문제를 가진 독립변수를 내생성(endogeneity)를 가진 변수라고 한다. 위의 1~4번까지의 가정들이 만족될 경우 추정치는 편향이 없는 추정치라고 할 수 있다. 2017. 8. 7.
통계에서의 효율성 (efficiency) 효율적이라는 말은 분산이 적다는 것이다. 2017. 8. 6.
Gini's mean differance (GMD)와 지니계수 참조 : Yitzhaki, Shlomo. 2003. "Gini’s mean difference: A superior measure of variability for non-normal distributions." Metron 61(2):285-316. 이것이 Gini's mean differance (GMD)다. 두 관측치간의 평균적인 차이다. 아래에 잘 설명되어 있다. 즉 랜덤으로 두 관측치를 뽑았을때의 차이(절대값)의 기댓값이다. 참조 : Yitzhaki, Shlomo. 1998. "More than a dozen alternative ways of spelling Gini." in Research in economic inequality: Citeseer. 한편 다음은 "분산"을 GMD 방식으로 표.. 2017. 8. 4.
설문 응답 편의 참고 : http://ezstat.snu.ac.kr/textbook_sources/chapter_14.pdf 무응답편의(non-response bias) : 설문지는 받았으나... --> 무응답 비율이 얼마나 되면??? - 보통 낮을 수록 가능성이 높다. 그러면 전화로 물어봐서 하거나 follow up을 하는 것이 좋다. 2017. 8. 4.
변이계수란: 표준화된 표준편차 변이계수는 변동계수라고도 함 (coefficient of variation, C.V.) 표준편차( σ {\displaystyle \sigma } )를 평균( x ¯ {\displaystyle {\overline {x}}} )으로 나눈 것이다. 2017. 7. 28.
stata에서 suits index 등 구하기 (누진성) -progres ssc install progres 2017. 7. 26.
부동산 가격에서 토지의 비율은 몇퍼센트? http://www.kreri.re.kr/sas/g50.asp 토지건물배분비율토지 비율은 대략 20~90% 정도 건물이 오래될수록 당연히 땅값 비율이 올라간다 (건축물 가치가 떨어지므로)당연히 서울 땅값이 비싸므로 수도권이 토지 비율이 높다. 고층건물일수록 건축물 비율이 높다. 2017. 7. 24.
[책] Value Capture and Land Policies (2012), 링컨토지정책연구소 http://www.lincolninst.edu/publications/books/value-capture-land-policiesPublications/BooksValue Capture and Land PoliciesEdited by Gregory K. Ingram and Yu-Hung HongMay 2012EnglishLincoln Institute of Land Policy 토지세의 여러 주제를 전반적으로 다루고 있다. 2017. 7. 24.
머신 러닝이란 무엇인가 (deep learning, machine learning, ai) 컴퓨터가 학습할 수 있도록 하는 알고리즘과 기술을 개발하는 분야 (위키)1959년, 아서 사무엘은 기계 학습을 "기계가 일일이 코드로 명시하지 않은 동작을 데이터로부터 학습하여 실행할 수 있도록 하는 알고리즘을 개발하는 연구 분야"라고 정의하였다. 기계 학습의 핵심은 표현(representation)과 일반화(generalization)에 있다.표현이란 데이터의 평가이며, 일반화란 아직 알 수 없는 데이터에 대한 처리이다.일반화는 훈련 이후 새롭게 들어온 데이터를 정확히 처리할 수 있는 능력을 말한다. 기계 학습과 데이터 마이닝은 종종 같은 방법을 사용하며 상당히 중첩된다. 기계 학습은 훈련 데이터(Training Data)를 통해 학습된 알려진 속성을 기반으로 예측에 초점을 두고 있다.데이터 마이닝은 .. 2017. 7. 11.