본문 바로가기
  • (개인)정보보호/최신ICT 정보 공유 블로그
통계학의 이해

05. 산포의 척도

by 노벰버맨 2021. 7. 13.

1. 산포도의 개요

가. 산포도의 정의

  • 개개의 관측값이 중심위치로부터 얼마만큼 떨어져 있는가를 나타내 주는 측도

 

나. 산포도의 필요성

  • (동일 대푯값) 두 집단의 평균점수, 중위수, 최빈수를 각각 구해 보았더니 똑같이 60점
  • (자료 퍼짐 정도) 자료의 퍼짐 정도는 다르기 때문에, 분포의 특성을 좀 더 명확하게 표현해주기 위해서는 대푯값뿐만 아니라 자료의 퍼짐성 고려 필요
  • (중심 기준) 자료의 산포도는 개개의 관측값이 중심위치로부터 얼마만큼 흩어져 있는가에 따라 좌우되며 그 값이 클 수 록 변동이 크고 광범위하게 퍼져 있다는 의미
  • (대표 산포도) 범위, 사분위 범위, 분산과 표준편차, 변동 계수 등

 

2. 산포도의 유형

구분 개념도 설명
범위
-주어진 데이터 분포에서 최대값 - 최소값
-범위값이 크면 데이터들이 넓게 퍼져 있음을 의미
-계산이 쉽고, 특이점에 영향을 크게 받음
평균 편차
-자료값(x)과 평균(x바)의 합은 0
-부호에 상관없이 모두 더한 값의 평균
사분위수
-데이터 값들의 50%에 포함되는 산포도
-Q3- Q1
분산
-확률변수가 기댓값으로부터 얼마나 떨어진 곳에 분포하는지 측정한 값
-편차 = xi - x평균(x바)
-분산 = 편차 제곱의 평균
모 분산
-x1~xn이 모집단 전체의 자료일 때 모집단 전체의 분산을 모분산
표본 분산
-x1~xn이 모집단의 일부인 n개 표본 자료일 떄 표본의 분산을 표본분산
-모집단의 퍼짐 정보를 나타내는 모분산의 추정량
표준 편차
-표준편차 = 분산의 양의 제곱근
-모표준편차, 표본표준편차
변동 계수
-평균이 크게 다른 두개 이상의 집단이 있을 때 각 집단의 상대적 동질성을 감안한 산포도 측도

 

3. 경험적 규칙

  • 일상에서 얻을 수 있는 자료의 대부분이 위의 그림과 같이 평균을 중심으로 좌우 대칭적이고, 종모양에 근접
  • (68-95-99.7), 표준편차(σ, s)의 위치와 자료의 밀집 정도
  • 이러한 특성은 표본 뿐만 아니라 모집단에서도 성립

 

3. 체비쇼프 정리 개요

-확률분포에서 데이터 샘플 또는 확률 분포가 거의 모든 값이 평균에 근접한다는 규칙

  • 값 들 중 평균값으로부터 2 표준편차 이상 떨어진 것들은 1/4 이상을 차지하지 않는다.
  • 3 표준편차 이상 떨어진 것들은 1/9 이상 차지하지 않는다.
  • 5 표준편차 이상 떨어진 것들은 1/25 이상 차지하지 않는다.

 

'통계학의 이해' 카테고리의 다른 글

07. 곱셈법칙과 순열, 조합  (0) 2021.07.13
06. 확률의 개요  (0) 2021.07.13
04. 중심위치의 척도  (0) 2021.07.13
03. 자료의 종류 및 시각화 (표, 그래프)  (0) 2021.07.13
02. 표본조사  (0) 2021.07.12

댓글