기본 용어 정의
표본 공간 : 모든 가능한 결과의 집합 (sample space)
확률 변수 : 표본 공간의 각각의 값에 실수(확률)를 부여하는 함수
이산형 확률변수 : 확률변수가 취하는 값이 셀 수 있을 때 (확률질량함수)
모든 가능한 값 각각에 확률 대응 가능.
연속형 확률변수 : 확률변수가 취하는 값이 측정될 수 있을 때 (확률밀도함수)
이산형처럼 모든 가능한 값 각각에 확률 대응가능.
기댓값 : 여러 번 반복될 때 결과값의 평균값으로
E(x) 또는 μ로 표기한다.
분산 : var(x) 또는 σ제곱, 확률변수 x의 흐트러진 정도에 대한 측도
표준편차(standard deviation) sd(x) 또는 σ
이산형 확률분포
1)베르누이 분포 : 실험을 한번만, 경우의 수는 2가지 (성공 혹은 실패)
2)이항분포(biomial) :시행 n번 확률p
베르누이 시행을 n번 독립적으로 반복하는 시행에서 성공률은 p로 동일
성공횟수를 y라고 하면, 확률변수 y의 분포는 시행횟수가 n이고 성공률이 p인 이항분포가 되며, B(n,p)로 표기
연속형 확률분포
정규분포(normal distribution) : 이항분포의 근사분포
관측에 따른 오차가 정규분포를 따른다는 사실이 밝혀짐(가우스)
표기 : X~N (평균, 분산) : X가 (평균, 분산) 정규분포를 따른다.
표준정규분포 : 평균이 0이고, 표준편차가 1인 정규분포N(0, 1제곱)을 표준정규분포라 한다.
표준화 : Z = (X- μ) / σ
표분분포
모집단에서 표본의 크기가 n인 모든 표본이 뽑혔다고 가정했을 때,
각 표본에서 계산된 통계량이 가지는 값들의 분포
중심극한정리 : 평균과 분산이
각각 μ와 σ제곱 < ∞ 인 모분포로부터 랜덤표본을 얻은 경우
표본의 크기 n 무한대에 접근함에 따라 표준정규분포 N(0,1)로 수렴한다.
(n의 확률표본을 반복적으로 무한히 추출할 때)
'통계, 계량 경제학' 카테고리의 다른 글
이분산 (1) | 2023.10.25 |
---|---|
추정 (모집단 특성 추정) (0) | 2023.06.26 |
자료의 정리 (0) | 2023.06.15 |
다중회귀분석 (0) | 2023.05.12 |
단순회귀분석 (2) (1) | 2023.04.18 |