Confidence Interval (신뢰 구간)
: 모수가 실제로 포함될 것이라고 예측되는 범위. 집단 전체를 연구하는 것은 현실적으로 불가능하기 때문에 모집단에서 샘플링 데이터를 기반으로 모수의 범위를 추정한다. 즉 샘플링된 표본이 모집단을 얼마나 잘 대표하는가를 측정한다. 일반적으로 95%의 신뢰수준이 사용된다.
*모수(Population parameter) : 모집단 전체를 설명하는 측도
Central Limit Theorem (중심 극한 정리)
: 중심 극한 정리는 표본의 크기가 증가함에 따라 평균의 표본 분포가 정규 분포에 근사해진다는 이론. 정규분포는 종 모양의 분포를 보이며, 표본의 크기가 클수록 모수 예측이 정확해진다. (모집단으로부터 추출한 표본의 평균) 이때, 표본의 크기는 최소 30이상이 되어야 한다.
중심 극한 정리가 강력한 이유는 모집단의 형태가 어떻든지 간에 상관없이 표본 평균의 분포는 정규분포를 따르게 된다는 점에 있다.
큰 수의 법칙
: 큰 수의 법칙은 시행 횟수를 늘려갈 수록 일정한 값에 가까워지는 법칙으로 어떤 모집단에서 표본들을 추출할 때, 시행 횟수가 늘어나면 표본의 평균이 모집단의 평균과 같아진다는 의미이다.
reference
'AI > Data Analysis, Statistics' 카테고리의 다른 글
Sprint3_선형대수(백터, 스칼라) (2) | 2021.01.12 |
---|---|
Section2_Sprint challenge (0) | 2021.01.12 |
Sprint2_Hypothesis test (0) | 2021.01.06 |
Sprint2_t-test (0) | 2021.01.05 |
Sprint1_Sprint challenge (0) | 2021.01.05 |