본문 바로가기

통계5

신용카드 빅데이터 / 매출 데이터 - 데이터포털 | 한국신용데이터 https://forum.cashnote.kr/data_portal 2020. 10. 1.
stata 분위별 평균값(평균소득) 구하기 - 백분위 천분위 등 1. 먼적 xtile명령어를 통해 분위수 변수를 만들어 준다. xtile 만들변수명 = 소득변수명 , nquantiles(괄호 안에 몇분위로 나눌 것인지 숫자 입력) * 가중치 옵션 가능 아래는 천분위로 만들어본 것 2. 다음으로 tabstat을 통해 분위수별 평균소득을 산출한다. tabstat 소득변수명 , by(분위수변수명) 2020. 4. 3.
지역별(시군구) 개신교 비율 (2015) | 지도 지역별(기초자치단체/시군구) 개신교 비율을 지도에 표시해보았습니다. ㅇ 가장 높은 곳 : 강화군 32.4%ㅇ 가장 낮은 곳 : 창녕군 7.4%ㅇ 전국 기준 19.7%ㅇ 자료 : 인구총조사 2015 ㅇ 아래 링크를 클릭하시면 대화형 지도로 확대하여 보실 수 있습니다. https://sgis.kostat.go.kr/view/map/interactiveMap/sharedata?id=FnxwnGKpL920190215154954148uHxxIwEoJr(통계청에서 지역별 종교 다운로드 후 가공하여 SGIS 사이트에 업로드함) 2019. 2. 15.
회귀분석에서 t값의 의미 / t-test (작성중입니다) t값은 시그널의 강도라고 할 수 있다.. (노이즈 대비 시그널) 당연히 시그널의 강도가 셀수록 좋은 것이다. 노이즈가 너무 많으면 시그널이 잘 안잡히거나 의미가 없다. 회귀분석에서의 t값(t검정에 대한 통계량)은 독립변수와 종속변수간에 선형관계(관련성)가 존재하는 정도를 나타낸다. t값을 구하는 식은 아래와 같다. (자료 : 이성원, 감정평가를 위한 회귀분석의 이해와 활용) 위에서 귀무가설(영가설;null hypothesis)은 두개의 상관관계(선형관계)가 없다는 것이다. 그러므로 기울기인 회귀계수가 0이라는 가정이다. 그러므로 (베타1)은 0이다. (아래 슬라이드) spss 돌리면 아래와 같이 나온다. 결국 t 값은 회귀계수 나누기 표준오차(표준편차)가 된다. The t statistic is the .. 2016. 6. 13.
게임 이용하는 사람 비율 - 얼마나 많은 사람들이 게임을 할까 국민의 75%가 게임한다 (최근 1년간 한번이라도 해본 사람이기 때문에 어쩌다 한번 하는 사람까지 포함된 숫자임) 중고딩이 제일 많이 한다 50대도 절반이상이 한다! 휴대폰 게임을 제일 많이 한다. 모바일 게임 하는 사람 중, 하루 평균 이용시간은 무려 1.5시간 모바일 게임은 퍼즐게임을 제일 많이 함 출처 : 한국 콘텐츠 진흥원 2015 게임이용자 실태조사 보고서 http://www.kocca.kr/cop/bbs/view/B0000147/1825604.do?searchCnd=&searchWrd=&cateTp1=&cateTp2=&useAt=&menuNo=201825&categorys=0&subcate=0&cateCode=&type=&instNo=0&questionTp=&uf_Setting=&recover.. 2016. 4. 22.