1. 모집단과 표본
- 모집단 : 관심을 가지고 있는 전체 집단 (만 19세 남자 키의 평균)
- 표본 : 모집단(확률현상)의 일부분으로서 모집단에 대한 정보를 얻기 위해서 모집단으로부터 추출한 집단 (모집단에서 추출된 만 19세 남자 키의 평균)
- 모수 : 모집단의 특성을 나타내는 수치(요약값) (모평균, 모표준편차, 모비율 등)
- 모수치 : 모집단의 특성을 나타내는 결과치
- 통계량 : 추출된 표본에서 관찰될 값으로부터 구해질 특성치(요약값) (표본평균, 표본표준편차, 표본 최대값/최소값표본비율 등)
- 통계치 : 추출된 표본에서 관찰된 값으로부터 계산되어진 결과치(표본평균, 표본표준 편차, 표본비율 등)
- 추정 : 표본으로부터 모집단의 모수를 추정한 것 (모수값 예측)
- 추정량 : 모수를 추정하기 위하여 표본에서 얻게 될 값
- 추정치 : 모수를 추정하기 위하여 표본에서 얻은 값
2. 자료의 특징 이해
- 통계 분석을 위해서는 통계적 계산 이해, 통계적 결과 해석, 자료의 특성 이해 필요
모수를 추정하기 위하여 표본에서 얻게 될 값
구분 | 설명 |
질적 자료 (qualitative data) | 관찰값이 수적 의미가 없이 범주만을 나타낸 값 (성별) |
명목형 자료(nominal data) : 질적 자료 중 거주지, 종교, 지지하는 정당은 순수하게 범주로서의 의미만 갖는 질적 자료 |
|
순위형 자료(ordinal data) : 10대, 20대, 30대 등으로 수집된 연령은 절대적으로 비교할 수 있는 수로서의 의미는 없지만 범주 간에 크고 작음(또는 높고 낮음)이 존재하는 질적 자료 |
|
양적 자료 (quantitative data) | 관찰값이 수적 의미를 갖고 있는 값, 나이 |
연속형 자료 (continuous data) : 어떤 범위 안에서 무수히 많은 값을 가질 수 있는 자료 |
|
이산형 자료 (discrete data) : 가족수와 같은 자료는 정수의 값만 가능한 자료 |
3. 기초 통계량
1) 대푯값
- 평균, 중앙값(중위수), 최빈수 등
2) 산포도
- 대푯값을 중심으로 자료들이 흩어져 있는 정도
- 범위, 분산, 표준편차, 변동계수(두개 이상 집단의 산포 정도) 등
- 차이(=편이)가 발생
표본의 분산을 구하려면, 편차제곱에 합을 개체 수인 N이 아닌, n-1로 나누어야 함 (‘n-1’ = 자유도)
4. 왜도와 첨도
1) 왜도
- 분포의 비대칭성과 편중방향을 나타내는 척도(0일 때 자료가 대칭적)
- 분포의 비대칭성을 나타내는 자료
- 가운데(평균)을 중심으로 좌우대칭인 형태와 비교했을 때 그 대칭성이 어그러진 상태를 의미
- 왜도가 0보다 크면 오른쪽으로 꼬리가 길어진 상태가 되고, 0보다 작으면 왼쪽으로 꼬리가 길어진 상태
2) 첨도
- 분포의 뾰족한 정도
- 가운데가 뾰족해지거나 두툼해지는 값들을 비교하는 것
****통계교육원(통계패키지 학습을 위한 필수 통계지식) 참조
'통계학의 이해' 카테고리의 다른 글
표본추출분포의 이해 (0) | 2022.08.26 |
---|---|
정규분포와 표준정규분포 (0) | 2022.08.26 |
23. 이항분포와 (표준)정규분포 (0) | 2021.08.16 |
22. 확률분포와 확률질량(밀도)함수 (0) | 2021.08.16 |
21. 확률의 성질 (0) | 2021.07.31 |
댓글