분산, 표준편차, SST, 표본분산
Measures of Variability: Variance and Standard Deviation
분산 또는 표준편차와 같은 것은 얼마나 값들이 퍼져있는가 분포를 한가지 숫자로 요약해서 보여주는 것이다.
variance, which tells us the expected distance from X to its mean:
아래는 분산의 중요한 속성이다.
저 괄호 안에 있는 상수는 무의미하다. 그리고 분산이란 편차를 제곱한 값이기 때문에 안에 곱하기로 붙어있는 a가 나오려면 제곱으로 나와야 한다.
x의 표준편차 standard deviation은 아래와 같이 표기. 무작위 변수일때는 시그마(σ)로도 표기
표준편차는 분산에 루트를 씌워준 것
분산의 속성과 마찬가지로 아래의 속성을 갖는다.
[표본, 회귀분석 관련]
SST is a measure of the total sample variation in the yi
* total sum of squares (SST)
If we divide SST by n–1, we obtain the sample variance(분산) of yi.
* 분산은 σ²[시그마 제곱]으로 표기, 여기에 루트를 씌운 σ[시그마]는 표준편차
* 여기서 대문자 S 는 Standard deviation (표준편차)의 약자인 듯. 여기서 S²은 모집단의 분산이 아닌 표본의 분산을 의미한다. 시그마 제곱은 모집단의 분산을 의미한다. (그리스어는 모집단, 영어는 표본) 즉 아래를 의미.
[추정량의 표본분산] the Sampling Variance of estimators
The variance of an estimator is often called its sampling variance because it
is the variance associated with a sampling distribution.
추정량(estimator)의 분산을 보통 표본분산이라고 한다.
Remember, the sampling variance is not a random variable
표분분산은 무작위 변수가 아니라는 것이 중요하다.
; it is a constant, but it might be unknown.
상수이나 알려져 있지 않다.
결국 모집단의 분산을 표본크기(n)으로 나누어준게 된다.
이것은 곧 샘플사이즈, 즉 표본의 크기를 크게할수록 분산은 작아진다는 것을 의미한다.
추정량의 편차는 작을수록 좋다.
Efficency
추정량이 분산이 작을수록 효율적이라고 한다.
참고 : Jeffrey_M._Wooldridge_Introductory_Econometrics_A_Modern_Approach__2012
'통계 , 수학' 카테고리의 다른 글
미분의 기초이해 - 미분이란 무엇인가 - 도함수, 프라임 (0) | 2017.03.13 |
---|---|
OECD 각국 조세 구성비율 비교표 (0) | 2017.03.08 |
로그란 무엇인가, 왜 통계에서 로그를 사용하는가? (회귀분석시 자연로그 해석) (6) | 2016.07.01 |
매개효과 (회귀분석) (0) | 2016.06.22 |
회귀분석에서 t값의 의미 / t-test (작성중입니다) (2) | 2016.06.13 |
댓글