[확률과 통계] 통계학 기본개념
Written by
metterian
on
on
통게학 기본 개념
개념정의
모집단 (popluation)
어떤 질문이나 실험을 위해 관심이 대사이 되는 개체나 사선의 집합
ex) 전교 남학생의 키
모수 (parameter)
모딥단의 수치적인 특성
ex) 키의 평균
표본 (sample)
모집단에서 선택된 개체나 사건의 집합
도수 (Frequency)
어떤 사건이 실험이나 관찰로 부터 발생한 횟수
표현 방법
- 도수분포표
- 막대그래프
- 히스토그램
평균
모평균 $\mu$
- 모집단 전체 자료일 경우
표본 평균 $\bar{x}$
- 모집단에서 추출한 표본일 경우
중앙값
- 평균의 경우 극단 값의 영향을 받는다.
Median
- 주어진 자료를 높은 쪽 절반과 낮은 쪽 절반으로 나누는 값을 의미
- 자료를 순서대로 나열 했을 때 가운데 있는 값
- 자료의 수: $n$
- $n$ 이 홀수: $\frac{(n+1)}{2}$ 번째 자료값
- $n$ 이 짝수: $\frac{n}{2}$ 번째와 $\frac{n}{2}+1$ 번째 자료값의 평균
분산 (Variance)
- 편차의 제곱의 합을 자료의 수로 나눈 값
- 편차: 값과 평균의 차이
자료가 모집단 일경우: 모분산
\[\sigma^{2}=\frac{1}{N} \sum_{i=1}^{N}\left(x_{i}-\mu\right)^{2}\]자료가 표본일 경우 : 표본 분산
\[s^{2}=\frac{1}{n-1} \sum_{i=1}^{n}\left(x_{i}-\bar{x}\right)^{2}\]표준 편차
- 분산의 양의 제곱근
모표준변차( population standard deviation )
\[\sigma=\sqrt{\frac{1}{N} \sum_{i=1}^{N}\left(x_{i}-\mu\right)^{2}}\]표본표본편차 (sample standar deviation)
\[s=\sqrt{\frac{1}{n-1} \sum_{i=1}^{n}\left(x_{i}-\bar{x}\right)^{2}}\]범위 (Range)
자료를 정렬 했을때 가장 큰 값과 가장 작은 값의 차이
사분위수 (Quartile)
전체 자료를 정렬 했을 때 1/4, 2/4, 3/4 위치에 있는 숫자
Z-score
어떤 값이 평균으로 부터 몇 표준편차 떨어져 있는지 의미 하는 값