본문 바로가기
통계 , 수학

분산, 표본분산, 표준편차, SST

2016. 9. 30.

분산, 표준편차, SST, 표본분산




Measures of Variability: Variance and Standard Deviation


분산 또는 표준편차와 같은 것은 얼마나 값들이 퍼져있는가 분포를 한가지 숫자로 요약해서 보여주는 것이다.


variance, which tells us the expected distance from X to its mean:


아래는 분산의 중요한 속성이다.

저 괄호 안에 있는 상수는 무의미하다. 그리고 분산이란 편차를 제곱한 값이기 때문에 안에 곱하기로 붙어있는 a가 나오려면 제곱으로 나와야 한다.


x의 표준편차 standard deviation은 아래와 같이 표기. 무작위 변수일때는 시그마(σ)로도 표기


표준편차는 분산에 루트를 씌워준 것



분산의 속성과 마찬가지로 아래의 속성을 갖는다.




[표본, 회귀분석 관련]



SST is a measure of the total sample variation in the yi

 * total sum of squares (SST)





If we divide SST by n–1, we obtain the sample variance(분산) of yi.

 * 분산σ²[시그마 제곱]으로 표기, 여기에 루트를 씌운 σ[시그마]는 표준편차

  

* 여기서 대문자 S 는 Standard deviation (표준편차)의 약자인 듯. 여기서 S²은 모집단의 분산이 아닌 표본의 분산을 의미한다. 시그마 제곱은 모집단의 분산을 의미한다. (그리스어는 모집단, 영어는 표본) 즉 아래를 의미.




[추정량의 표본분산] the Sampling Variance of estimators


The variance of an estimator is often called its sampling variance because it

is the variance associated with a sampling distribution.

추정량(estimator)의 분산을 보통 표본분산이라고 한다.


Remember, the sampling variance is not a random variable

표분분산은 무작위 변수가 아니라는 것이 중요하다.

; it is a constant, but it might be unknown.

상수이나 알려져 있지 않다.




결국 모집단의 분산을 표본크기(n)으로 나누어준게 된다.

이것은 곧 샘플사이즈, 즉 표본의 크기를 크게할수록 분산은 작아진다는 것을 의미한다.

추정량의 편차는 작을수록 좋다.


Efficency

추정량이 분산이 작을수록 효율적이라고 한다.





참고 : Jeffrey_M._Wooldridge_Introductory_Econometrics_A_Modern_Approach__2012

댓글