본문 바로가기
  • (개인)정보보호/최신ICT 정보 공유 블로그
통계학의 이해

표본이론 기초

by 노벰버맨 2022. 8. 29.

1. 표본조사의 개요

가. 표본조사의 정의

-모집단을 잘 대표할 수 있는 조사단위의 일부만을 조사하는 것

-전수조사가 불가능하거나 전수조사가 가능하지만 비용, 시간 등의 면에서 표본조사가 선호되는 경우에 사용

 

-전수조사란 모집단(통계 집단)을 구성하는 조사단위를 전부 조사하는 것

 

나. 표본조사의 장점

- (경제성), 조사비용이 전수조사에 비해 적게 듦

-(신속성), 신속한 정보를 적시에 얻을 수 있음

-(정확성), 표본조사를 하게 되면 표본오차가 발생하나 전수조사보다 비표본오차가 작게 발생

-(심도 있는 조사), 인구주택총조사는 20개 항목은 전수 조사하고 나머지 50개 항목(전수조사항목 20개, 추가 항목 30개)은 표본조사로 심도 있는 조사 가능

-(파괴검사), 자동차 안전도 검사나 전구 수명 등 측정 시 표본조사만 가능

-표본조사가 합리적, 과학적으로 이뤄지면 전수조사보다 오차를 줄여 정확한 조사 결과를 얻을 수 있음

 

2. 표본조사에서 쓰이는 개념(용어 정의)

구분 설명
기본단위 -조사의 대상이 되는 가장 최소의 단위

(예)
-가계소비조사 : 가구
모집단 -조사대상이 되는 기본다위들의 집합
-표본조사를 실시하고자 할 때 우선 모집단을 명확히 규정
(유한모집단/무한모집단)

(예) 서울시 가구당 월평균소득 조사
-기본단위 : 서울시 각 가구
-모집단 : 서울시 모든 가구

o 목표모집단
-통계조사에서 관심 대상이 되는 모든 기본단위들의 집합
o 조사모집단
-현실적으로 조사가 가능하고 추출틀을 작성할 수 있는 추출단위들로 구성된 모집단
o 추출틀의 정확성
-목표모집단 Ut와 조사모집단 Us간의 차이로부터 측정 가능
-Ut = Us이면 추출틀은 목표모집단에 대해 완전하다고 함
-불완전 추출틀: 기본단위의 과소포함, 과대포함, 중복된 목록
1) 과소 포함 추출틀:
-목표모집단의 기본단위 > 조사모집단 (목표모집단의 일부가 조사모집단에 존재하지 않는 경우)
2) 과대 포함 추출틀:
-목표모집단의 기본단위 < 조사모집단 (목표모집단에 존재하지 않는 단위가 조사모집단에 존재)
3) 중복된 목록
-목표모집단의 기본단위가 추출틀에 한번 이상 나타날 때
추출단위 -모집단에서 표본을 추출하기 위해 설정한 기본단위들의 집합
-기본단위와 추출단위가 서로 상이할 수 있음
-추출단위를 기본단위와 동일하게 할 것인지에 따라 추출틀 작성이 달라질 수 있음

o 추출단위와 기본단위가 같은 경우
-여론조사에서 개인을 표본으로 선택할 경우, 기본단위와 추출단위가 모두 개인으로 동일
o 추출단위와 기본단위가 다른 경우
-여론조사에서 가구를 표본으로 선택할 경우, 기본단위는 개인, 추출단위는 가구 

*추출단위의 조건
-기본단위는 모두 어느 한 추출단위에 포함
-기본단위는 두개이상의 추출단위에 동시 포함 불가
-추눌단위는 조사현장에서 확인 가능, 추출작업이 용이
추출틀 or 추출대장  -표본추출단위들로 구성된 목록
-표본조사에서 표본은 실제적으로 추출틀로부터 뽑히기 때문에 추출틀 작성이 필수, 추출단위를 결정할 때부터 미리 추출틀을 작성할 수 있는 추출단위들로 고려

*추출틀의 요건
-정의된 모집단 내의 모든 추출단위들을 포함
-어느 추출단위도 중복 불가



*추출틀의 종류
-명부틀: 가구나 개인을 추출단위로 하여 목록이나 명부 작성 가능한 경우
-지역추출틀: 시, 면과 같이 일정한 지역을 추출단위로 정의하는 경우

표본 -추출틀로부터 뽑은 추출단위의 집합
표본추출 -확률추출법
모집단을 구성하고 있는 모든 추출단위가 표본으로 추출될 확률을 사전에 알고 있는 표본추출법
-비확률추출법
각 추출단위들이 표본으로 추출될 확률을 객관적으로 나타낼 수 없는 추출법
표본오차 -모수와 표본추정치의 차이
-모집단으로부터 선정된 표본이 어느 정도가지 정확하게 모집단의 특성을 반영하는가를 측정

-표본오차를 구하기 위해서는 세타값을 알아야 하지만 이는 모수로써 실제는 알 수 없음 (표본오차 계산 불가, 표본통계량의 표본분포의 성질을 이용하여 평균적인 표본오차를 구함)
평균제곱오차(MSE) -Mean Square Error
-모수와 추정량의 편차의 제곱의 기대값
-표본조사에서 추정량의 정확도를 측정하는데 사용
-비편향추정량의 정확도(accuracy)라 함

-MSE와 분산과의 관계
표준오차 -비편향추정량의 표준오차(standard error)
-분산의 양의 제곱근인
정도 -비편향추정량의 정도(pression)
-신뢰계수를 z로 표시하면 추정치와 모수의 관계를 다음과 같이 표현 가능
추정 -표본조사에서 추정량의 요구사항은 비편향성과 유효성임
변동계수 -CV(Coefficient of Variation)
-추정량의 표준오차가 추정량의 형태에 따라 달라짐으로 이를 해결하기 위한 방법으로 변동계수를 이용함

****통계교육원(통계패키지 학습을 위한 필수 통계지식) 참조

'통계학의 이해' 카테고리의 다른 글

기댓값의 개요  (0) 2022.09.08
확률의 개요  (2) 2022.09.08
가설검정 이해  (0) 2022.08.26
가설검정  (0) 2022.08.26
표본추출분포의 이해  (0) 2022.08.26

댓글