분석방법 기초 (패널 체크 및 보는 법)
정성변수 설정
정성변수에 대해 다 따로 만들어야 한다.
차 있고 없고, 흑인 이거나 아니거나 등
(다 가변수로 즉 1 or 0)
보통 처음에 만들 때 0으로 설정하고
다음에 1을 만든다.
(gen 과 replace 사용)
<예시>
gen elem = 0
replace elem = 1 if educ ==6
gen middle = 0
replace middle = 1 if educ ==9
gen middle = 0
replace high = 1 if educ ==12
OLS 패널 보는 방법
regress(reg) 종속변수 = 선형회귀분석 (최소자승추정량OLS)
위 화면에서
number of obs(df+1) = 총 관측치의 개수
Coef = 결정계수 (모형 적합도)
독립변수 x가 1단위 증가할 때
종속변수 y가 몇 단위 변화하는 지이다.
std. err. 은 계수 추정치의 표준오차.
값이 클수록 불확실성이 높아진다.
t= Coef. / Std.Err. 으로
t-ratio를 의미한다. (기각역 설정에서 사용)
p>[t]를 통해 (p value)
p값이 [t]보다 커지면 기각한다. (reject)
95% Conf. Interval 은
앞이 B1의 95%신뢰구간,
뒤가 B0의 95%신뢰구간
확인하고 싶은 변수들의 추정
회귀분석 단축키 reg 사용.
<예시>
labinc elen middle high를 확인하고 싶은 경우
reg labinc elen middle high
결과로 위의 값이 주어졌고
위의 식이 존재하면
B1 B3 B0의 추정치는
(coef = 모형적합도, ols 추정치, x증가 시 y 변화)
위의 값과 같다.
B0(cons로 표기)의 값은
절편으로 모든 값이 0일 때다.
Coef는 각 값이 1 올라갈 때 labinc 변화치다.
결과로 위의 값이 주어졌고
위의 식이 존재하면
B4의 추정치 및
B4의 계수추정치 표준편차 (클수록 불확실)는
위의 값과 같다.
동의 와 기각
P value : 주어진 귀무가설(H:0)을 기각하기 위한 최소한의 유의 수준
(P 벨류를 넘는 수준이면 기각)
즉, P value가 0이라는 이야기는
유의수준을 몇 프로로 잡아도
다 기각해야 한다는 의미이다.
(즉, 대립가설(H:1)을 택해야 함)