표준편자가 주어졌을 때, 이 표준편차를 갖도록 수열을 만들 수 있을까?

아주 쉽다.

표준편차가 2라고 하자. 간단히, 2개의 수만 생각해 보자. -2과 +2. 알다시피 평균은 0이다. 각각 -2, +2만큼의 편차를 갖고 있으며, 분산은 4이고 표준편차가 2가 된다.

그럼, 표준편차가 2가 되는 여러개의 수를 생성하려면?
n개의 수가 필요하다고 할 때, -2를 n/2개, +2를 n/2개 넣어보자. 그럼 각각 -2, +2만큼의 편차를 갖게 되고, 따라서 분산은 여전히 4, 표준편차는 2가 된다. n이 홀수라서 남는거 1개는 잘 모르겠다. 이것은 인류의 미해결 숙제로 남겨두겠다.

다 다른 수를 만들려면? 조금 어려운 문제가 되지만, 여전히 어려운 문제는 아니다. 그냥 임의의 수를 원하는 만큼를 생성한다. 아무 숫자나 상관없다. 그리고 그 수의 표준편차를 구한다. 주어진 표준편차가 되도록 하는 수 a를 찾아내서, 원래 생성한 임의의 수에 다 곱한다.

예를 들어, 앞의 -2와 +2를 보자. 표준편차는 2라고 했다. 우리가 목표로 하는 표준편차가 10이라고 해 보자. 그럼 이미 계산된 표준편차에 5를 곱하면 된다. 따라서, -2에도 5를 곱하고, +2에도 5를 곱하자. 그럼 -10, +10이 되어 표준편차가 10이 된다. 거짓말?

1과 5를 보자. 이것도 표준편차는 2이다. 5를 곱해보자. 5와 25가 된다. 평균은 15이고, 각 편차는 -10, +10이다. 편차의 제곱은 100, 100이고, 편차 제곱의 평균(분산)은 100이다. 따라서 표준편차는 10이다.

엑셀에서도 한번 검증해 볼 수 있다.
4            16           
3            12           
5            20           
2            8           
7            28           
5            20           
5            20           
6            24           
9            36           
3            12           
4            16           
5            20           
7            28           
3            12           
4            16           
5            20           
1.79        7.18           (표준편차)
왼쪽의 수보다 오른쪽의 수는 4배 크다. 표준편차도 4배 크다.

이 얘기의 수학적 증명은 생략한다. 표준편차의 정의에서 그대로 유도되기 때문에 너무 쉽다.
(표준편차가 통계에서는 자유도를 1개 줄여서 생각하지만, 논의에 별 문제는 없어서 그냥 넘어간다.)
by snowall 2011. 6. 25. 01:46