통계학의 이해31 13. 모평균 및 모비율의 신뢰구간 구하기 1) 모평균 -모집단이 정규분포, 분산이 알려진 경우 -모집단이 정규분포, 분산을 모르는 경우 -모집단이 임의분포, 표본크기가 n으로 충분히 큰 경우 2) 모비율 -Z1, ...Zn은베르누이 분포에서 확률표본 3) 표본 크기 결정 -이전 연구에서 사용한 p*가 존재하는 경우 -소표본으로 p를 추정한 추정치 p^을 이용하여 n을 계산한 후 필요한 표본을 더 추출하는 경우 -표준오차의 최대값을 사용 4) 모평균 및 모비율의 신뢰구간 구하기 2021. 7. 18. 12. 통계적 추론 (추정) 1. 통계적 추론의 개요 가. 통계적 추론 -표본으로부터 얻은 정보를 이용하여 모집단에 관한 추측이나 결론을 이끌어내는 과정 나. 통계적 추론의 종류 2. 점추정 가. 점추정의 정의 -(추정) 모집단의 특성치에 대한 추측값을 제공하고 그 오차한계를 제시하는 과정 -(점추정) 모수를 하나의 값으로 추정하는 과정 -점추정은 불확실한 정도를 표현하지 못하는 단점을 가지고 있어 구간추정과 같이 고려해야 함 나. 점추정 관련 용어 구분 설명 예시 모수 관심의 대상인 모집단의 특성 모평균, 모비율 추정량 모수를 추정하기 위해 사용되는 통계량 표본평균, 표본비율 추정치 어느 특정한 표본으로부터 구한 추정량의 계산된 값 계산된 표본평균값 추정 모집단의 특성인 모수를 추정하는 일련의 과정 -표준편차인 표준오차는 신뢰도를.. 2021. 7. 18. 11. 표본분포 1. 표본분포(Sampling Distribution) 가. 표본분포의 정의 -표본의 특성을 나타내는 통계량의 확률분포 -모집단에서 크기 n인 표본을 반복하여 선정할 때 얻어지는 통계량의 확률분포 -표본평균, 표본분산과 같이 표본으로부터 계산 가능한 확률변수의 분포 -모집단의 모든 자료값을 알고 있는 경우는 드물기 때문에 표본을 선정하여 모집단의 특성을 추론 (추론 통계학) 나. 용어 정의 - (통계량) 표본평균, 표본분산과 같이 표본의 특성을 나타내는 표본으로부터 계산 가능한 확률변수 - (표본평균, 표본분산) - (모비율, 표본비율) 모비율, p = x / N 표본비율, p(바) = x / n (예시) 어느 연구자가 어느 대학교의 학생의 주당 TV 시청 평균 시간에 관심이 있다고 한다. 이를 위해 연.. 2021. 7. 17. 10. 베르누이 실험과 분포 가. 베르누이 실험의 정의 -동전의 앞/뒤, 스위치 On/Off, 양품/불량품 등과 같이 두가지 결과로 구성된 확률 실험 나. 베르누이 분포의 정의 -성공할 확률이 p라면 실패할 확률이 1-p일 때 성공과 실패를 '1'과 '0'으로 대체하면 확률변수가 되고 이 확률변수의 확률분포를 베르누이 분포라 함 (합격/불합격, 양성/음성, 동전 앞/뒤) -베르누이 분포의 기댓값과 분산 2021. 7. 17. 09. 확률변수 1. 확률변수의 개요 가. 확률변수의 정의 -확률 실험결과(표본 공간의 각 표본점)에서 원소에 숫자를 부여하는 규칙이나 함수 -확률 실험결과를 수로 나타내는 것 -모집단에서 관심 있는 변수 나. 확률변수의 특징 -(불확실성) 확률 실험의 불확실성을 효과적으로 표현 및 분석하기 위해 사용 -(모형화) 표본 공간의 원소를 숫자로 바꾸어 불확실한 현상을 수리적으로 모형화 가능 -(상태 공간) 확률변수 X가 취할 수 있는 모든 수의 집합 Sx로 표시 *아이를 둘 낳는 경우(확률적 실험)를 생각하자. 여기에서 표본 공간은 S = {BB, BG, GB, GG}, B : 아들, G : 딸 관심 1: 아들의 수를 확률변수 X라 하면, X(BB) = 2, X(BG) = X(GB) = 1, X(GG) = 0으로 표본 공간.. 2021. 7. 13. 08. 조건부 확률 1. 조건부 확률의 개요. 가. 조건부 확률의 정의 -P(A|B) -사상 B가 주어진 조건 하에서 사상 A가 발생할 확률 (사건 B 중에서 사건 A의 비율) -'|'는 given에 해당하는 기호 나. 조건부 확률의 특징 구분 관련 공식 설명 곱셈 법칙 -조건부 확률 공식의 양변에 P(B)를 곱하여 곱셈 법칙 유도 가능 독립 사상 -다른 사건의 발생 확률에 영향을 주지 않는 경우 -두 사상 A와 B가 독립이라는 것은 사상 B가 일어났다는 조건 아래 사상 A가 일어날 조건부 확률이 사상 A가 일어날 확율과 같다. -주사위 두번 던지기 종속 사상 -다른 사건의 발생 확률에 영향을 주는 경우 -위 독립사상 등식이 성립하지 않는 경우 종속사상 -비가 오는지 여부와 우산가게 매출 다. 독립사건과 배반사건 관계 배반.. 2021. 7. 13. 07. 곱셈법칙과 순열, 조합 1. 곱셈 법칙의 개요 가. 곱셈 법칙의 정의 -어떤 실험을 r가지 방법으로 실시하고, 또한 각 방법마다 또 다른 실험을 n가지 방법으로 실시하였다면, 이 두 개의 실험을 결합하여 실시하는 방법의 수는 r × n 가지가 존재하는 것 나. 곱셈 법칙의 개념도 2. 순열과 조합 가. 순열 (Permuation) -n개의 대상에서 r개를 비복원추출하여 순서대로 배열하는 것 (nPr : n Permutation r이라 읽음) 나. 조합 (Combination) -n개의 대상에서 r개를 비복원추출로 순서를 무시하고 뽑은 결과 (nCr : n Combination r이라 읽음) 2021. 7. 13. 06. 확률의 개요 1. 확률의 개요 가. 확률의 정의 -일정한 조건 아래에서 어떤 사건이나 사상이 일어날 가능성의 정도 또는 수치 나. 확률의 특징 -(불확실성) 알려진 불확실성을 다룰 수 있음 -(특정 사건) 모든 경우의 수에 대한 특정 사건이 발생할 비율 -(0~1) 1을 넘을 수 없고 음이 될 수도 없음 2. 확률 관련 용어 및 유형 가. 확률 관련 용어 구분 특징 설명 실험 -제어 실험 -자연 실험 -현장 실험 -가설이나 이론이 실제로 맞는지를 확인하기 위해 다양한 조건 아래에서 측정하는 기법 통계적 실험 -기온 기록 -동전 던지기 -통계적 목적 아래서 관찰이나 측정을 얻어내는 일련의 과정 시행 -실험을 반복하는 행위 확률 실험 -동전 던지기 -주사위 던지기 -실험을 해보기 전에는 어떤 결과가 발생할지 불확실한 경.. 2021. 7. 13. 05. 산포의 척도 1. 산포도의 개요 가. 산포도의 정의 개개의 관측값이 중심위치로부터 얼마만큼 떨어져 있는가를 나타내 주는 측도 나. 산포도의 필요성 (동일 대푯값) 두 집단의 평균점수, 중위수, 최빈수를 각각 구해 보았더니 똑같이 60점 (자료 퍼짐 정도) 자료의 퍼짐 정도는 다르기 때문에, 분포의 특성을 좀 더 명확하게 표현해주기 위해서는 대푯값뿐만 아니라 자료의 퍼짐성 고려 필요 (중심 기준) 자료의 산포도는 개개의 관측값이 중심위치로부터 얼마만큼 흩어져 있는가에 따라 좌우되며 그 값이 클 수 록 변동이 크고 광범위하게 퍼져 있다는 의미 (대표 산포도) 범위, 사분위 범위, 분산과 표준편차, 변동 계수 등 2. 산포도의 유형 구분 개념도 설명 범위 -주어진 데이터 분포에서 최대값 - 최소값 -범위값이 크면 데이터들.. 2021. 7. 13. 04. 중심위치의 척도 1. 중심위치 척도의 개요 가. 대푯값의 정의 -주어진 자료를 대표하는 특정한 값 -자료의 중심적인 경향이나 자료 분포의 중심위치를 나타내는 값 나. 중심위치 적도의 특징 -(객관적 해석), 표나 그래프를 이용할 경우 관점에 따라 주관적 해석 가능 -(산술적 계산), 관찰된 자료로부터 산술적인 계산으로 자료 요약 -(대표적인 척도 예), 평균, 중위수, 최빈값 2. 중심위치 척도의 유형 구분 산술식 설명 모 평균 -모집단을 이루는 자료 전체의 평균 표본 평균 -n개로 구성된 표본의 각 자룟값을 모두 더한 후 자료 갯수로 나눈 값 -산술 평규과 유사 가중 평균 -각항의 수치에 그 중요도에 비례한 계수를 곱하여 각항의 무게를 이용하여 구하는 평균 산술 평균 -자료 전체의 관측값을 전부 더한 다음 자료집단에 .. 2021. 7. 13. 03. 자료의 종류 및 시각화 (표, 그래프) 1. 자료의 종류 2. 자료의 시각화 (표, 그래프) 가. 질적 자료의 시각화 구분 개념도 설명 도수 분포표 여러 개의 범주 안에 측정된 각 범주의 도수와 상대 도수 또는 범주 백분율을 나타낸 표 막대 그래프 각 범주를 수평축에 나타내고 각 범주에 대응하는 도수, 상대 도수, 백분율 등을 같은 폭의 수직 막대로 나타낸 그래프 파래토 그래프 범주의 도수 또는 백분율이 감소하도록 나타낸 막대 그래프 선 그래프 막대 그래프에서 수직 막대의 상단 중심을 선분으로 연결한 그래프 원 그래프 원을 자료의 범주 갯수만큼 파이 모양의 저각으로 나누어 작성한 그래프 나. 양적 자료의 시각화 구분 개념도 설명 점도표 각 관측값의 위치에 점을 표시하고 같은 관측값이 있는 경우 위로 누적하는 그래프 도수 분포표 관측값들을 몇개.. 2021. 7. 13. 02. 표본조사 1. 표본조사의 개요 가. 표본조사의 정의 -모집단으로부터 표본을 뽑는 일련의 행위 또는 과정 나. 표본조사의 목적 및 필요성 (대표성) 표본으로부터 얻은 결과를 토대로 모집단의 특성 파악 (적절성) 시간과 금전적 비용 절감 -표본 추출의 핵심은 대표성과 적절성의 조화 2. 오차의 종류 및 표본 추출 방법 가. 오차의 종류(표본오차와 비표본오차) 구분 설명 특징 표본오차 -모집단에서 표본을 추출하여 전체를 추론하는 과정에서 발생하는 오차 -예측 가능 -적절한 표본 추출방법 및 표본 크기에 따라 조절 가능 비표본오차 -표본오차 이외에 무응답이나 조사원의 미숙 등으로 발생하는 오차 -무응답오차, 설문 결함, 조사원 미숙, 수집 및 분석 과정의 오류 -예측 불가능 -표본조사 계획과 자료 수집 및 분석에서 오류.. 2021. 7. 12. 01. 통계 1. 통계학의 개요 가. 통계학의 정의 -주어진 문제에 대하여 합리적인 답을 이끌어내기 위해 숫자로 표시되는 정보를 수집, 정리하고 분석하여 이를 해석하고 신뢰성 있는 결론을 이끌어내는 일련의 과정을 연구하는 학문 나. 통계학의 필요성 -생활 또는 업무 속의 정보와 숫자 이해 -의사결정을 위한 올바른 통계 기법과 도구 -통계자료에 대한 이해 다. 통계학의 주된 과제 -자료를 수집하는 방법 -자료를 분석하는 방법 -자료로부터 얻은 결론에 대한 객관성을 보장하는 방법 2. 통계학의 용어 및 분류 가. 통계학의 용어 구분 설명 예시 모집단 -주어진 문제에서 관심의 대상이 되는 전체 집단 -유한모집단 : 추출단위가 유한한 경우 -무한모집단 : 추출단위가 무한인 경우 -대통령 선거의 유권자 전체 모집단 분포 -모.. 2021. 7. 12. 이전 1 2 다음