본문 바로가기
  • (개인)정보보호/최신ICT 정보 공유 블로그
통계학의 이해

통계 용어 정리

by 노벰버맨 2022. 8. 26.

1. 모집단과 표본

- 모집단 : 관심을 가지고 있는 전체 집단 (만 19세 남자 키의 평균)

- 표본 : 모집단(확률현상)의 일부분으로서 모집단에 대한 정보를 얻기 위해서 모집단으로부터 추출한 집단 (모집단에서 추출된 만 19세 남자 키의 평균) 

 

- 모수 : 모집단의 특성을 나타내는 수치(요약값) (모평균, 모표준편차, 모비율 등)

- 모수치 : 모집단의 특성을 나타내는 결과치

 

- 통계량 : 추출된 표본에서 관찰될 값으로부터 구해질 특성치(요약값) (표본평균, 표본표준편차, 표본 최대값/최소값표본비율 등)

- 통계치 : 추출된 표본에서 관찰된 값으로부터 계산되어진 결과치(표본평균, 표본표준 편차, 표본비율 등)

 

- 추정 : 표본으로부터 모집단의 모수를 추정한 것 (모수값 예측)

- 추정량 : 모수를 추정하기 위하여 표본에서 얻게 될 값

- 추정치 : 모수를 추정하기 위하여 표본에서 얻은 값 

모집단, 표본 기호 정리

 

2. 자료의 특징 이해

- 통계 분석을 위해서는 통계적 계산 이해, 통계적 결과 해석, 자료의 특성 이해 필요

모수를 추정하기 위하여 표본에서 얻게 될 값

구분 설명
질적 자료 (qualitative data) 관찰값이 수적 의미가 없이 범주만을 나타낸 값 (성별)
명목형 자료(nominal data) :
질적 자료 중 거주지, 종교, 지지하는 정당은 순수하게 범주로서의 의미만 갖는 질적 자료
순위형 자료(ordinal data) :
10대, 20대, 30대 등으로 수집된 연령은 절대적으로 비교할 수 있는 수로서의 의미는 없지만 범주 간에 크고 작음(또는 높고 낮음)이 존재하는 질적 자료
양적 자료 (quantitative data) 관찰값이 수적 의미를 갖고 있는 값, 나이
연속형 자료 (continuous data) :
어떤 범위 안에서 무수히 많은 값을 가질 수 있는 자료
이산형 자료 (discrete data) :
가족수와 같은 자료는 정수의 값만 가능한 자료

 

3. 기초 통계량

1) 대푯값

- 평균, 중앙값(중위수), 최빈수 등 

 

2) 산포도

- 대푯값을 중심으로 자료들이 흩어져 있는 정도

- 범위, 분산, 표준편차, 변동계수(두개 이상 집단의 산포 정도) 등

- 차이(=편이)가 발생

표본의 분산을 구하려면, 편차제곱에 합을 개체 수인 N이 아닌, n-1로 나누어야 함 (‘n-1’ = 자유도)

 

4. 왜도와 첨도

1) 왜도

- 분포의 비대칭성과 편중방향을 나타내는 척도(0일 때 자료가 대칭적)

- 분포의 비대칭성을 나타내는 자료

- 가운데(평균)을 중심으로 좌우대칭인 형태와 비교했을 때 그 대칭성이 어그러진 상태를 의미

- 왜도가 0보다 크면 오른쪽으로 꼬리가 길어진 상태가 되고, 0보다 작으면 왼쪽으로 꼬리가 길어진 상태

2) 첨도

- 분포의 뾰족한 정도

- 가운데가 뾰족해지거나 두툼해지는 값들을 비교하는 것

 

 

****통계교육원(통계패키지 학습을 위한 필수 통계지식) 참조

'통계학의 이해' 카테고리의 다른 글

표본추출분포의 이해  (0) 2022.08.26
정규분포와 표준정규분포  (0) 2022.08.26
23. 이항분포와 (표준)정규분포  (0) 2021.08.16
22. 확률분포와 확률질량(밀도)함수  (0) 2021.08.16
21. 확률의 성질  (0) 2021.07.31

댓글