통계, 계량 경제학12 확률변수 기본 용어 정의 표본 공간 : 모든 가능한 결과의 집합 (sample space) 확률 변수 : 표본 공간의 각각의 값에 실수(확률)를 부여하는 함수 이산형 확률변수 : 확률변수가 취하는 값이 셀 수 있을 때 (확률질량함수) 모든 가능한 값 각각에 확률 대응 가능. 연속형 확률변수 : 확률변수가 취하는 값이 측정될 수 있을 때 (확률밀도함수) 이산형처럼 모든 가능한 값 각각에 확률 대응가능. 기댓값 : 여러 번 반복될 때 결과값의 평균값으로 E(x) 또는 μ로 표기한다. 분산 : var(x) 또는 σ제곱, 확률변수 x의 흐트러진 정도에 대한 측도 표준편차(standard deviation) sd(x) 또는 σ 이산형 확률분포 1)베르누이 분포 : 실험을 한번만, 경우의 수는 2가지 (성공 혹은 실패) 2.. 2023. 6. 19. 자료의 정리 자료의 종류 범주형자료(질적자료) 숫자가 의미 없음 이분형:남녀 다분형:혈액형 수량자료(양적자료) 숫자가 의미 있음 이산형:물건 개수 연속형(계량형):온도, 키 구간척도:원점개념x, 많다적다개념x 비율척도:원점개념0, 양적 자료의 요약 평균 (mean):극단값의 영향이 심함 중위수 (median):극단값의 영향이 적음 최빈값(mode):극단값의 영향이 적음 표준편차(standard deviation) 범위(range) max - min 표준점수(standard score) (관측값-평균) / 표준편차 변동계수 = 표본편차 왜도: 비대칭 정도 첨도: 뾰족한 정도 hat = ∧ check = ∨ 1)hat, check 등 문자위에 머 붙은 건 대부분 추정량이다. 2023. 6. 15. 다중회귀분석 다중회귀분석의 필요성 1)주어진 종속변수에 대한 설명력을 가지는 변수는 보통 여러 가지. 2)같은 변수라고 해도 선형이 아닐 수도 있다. (임금은 나이에 따라 올라가다가 떨어진다.) 3)ZCM 등 단순회귀분석의 주요 가정들이 만족되지 않을 가능성이 높다. 단순회귀분석 문제의 예 score i =B0+B1expen i + B2avginc i + B3children i + Ui 라는 다중함수가 있다고 생각하자 이를 단순회귀로 처리하면 score i =B0+B1expen i + Ui가 되고 오차항 Ui안에 자녀수, 수입 등등이 다 들어간다. 그리고 ZCM이 성립해야해야 하기 때문에 지출과 수입, 지출과 양육수 간에는 영향이 없어야 한다. 다중회귀분석의 특징 1)k개의 독립변수 : X1 ~ Xk 까지 2)모형 .. 2023. 5. 12. 단순회귀분석 (2) 로그함수 로그함수를 사용 할 때 다른 요소는 고정을 전제 1) 규모를 줄이기 위해 2) 탄력성으로 표현하기 위해 3) 비율(%)로 표시하기 위해 log함수의 기본적 형태 및 의미는 위와 같다. log함수의 변형이다. 1) y의 %변화량 / x의 %변화량 이다. (즉, 탄력성) 2)x가 한단위 변할 떄 y가(100xB1)%만큼 변한다. 3)x가 %변할 떄 y가(100xB1)만큼 변한다. -참고- 100을 곱하는 이유는 %로 변화하기 위해서다. 최소자승추정량의 성질 단순선형최귀분석을 위한 가정 1)모집단 회귀식은 표본집단 회귀식과 동일하다. 즉, Y=B0+B1X+U 2)임의 추출되어야 한다.(random sampling) 상호독립적(영향x), 분포도 최대한 동일 3)표본에서 관측된 Xi값은 최소한 2개 이상.. 2023. 4. 18. 이전 1 2 3 다음