STATA

분석방법 기초 (패널 체크 및 보는 법)

경제노리 2023. 4. 24. 19:41
정성변수 설정

정성변수에 대해 다 따로 만들어야 한다. 

차 있고 없고, 흑인 이거나 아니거나 등

(다 가변수로 즉 1 or 0)

보통 처음에 만들 때 0으로 설정하고

다음에 1을 만든다.

(gen 과 replace 사용)

 

<예시>

 

gen elem = 0

replace elem = 1 if educ ==6

gen middle = 0 

replace middle = 1 if educ ==9

gen middle = 0 

replace high = 1 if educ ==12

 

 

OLS 패널 보는 방법

regress(reg) 종속변수 =  선형회귀분석 (최소자승추정량OLS)

 

 

위 화면에서

 

number of obs(df+1) = 총 관측치의 개수

 

Coef = 결정계수 (모형 적합도)
독립변수 x가 1단위 증가할 때

종속변수 y가 몇 단위 변화하는 지이다.

 

std. err. 은 계수 추정치의 표준오차.

값이 클수록 불확실성이 높아진다.

 

t= Coef. / Std.Err. 으로

t-ratio를 의미한다. (기각역 설정에서 사용)

 

p>[t]를 통해 (p value)

p값이 [t]보다 커지면  기각한다. (reject)

 

95% Conf. Interval 은

앞이 B1의 95%신뢰구간,

뒤가 B0의 95%신뢰구간

 

 

확인하고 싶은 변수들의 추정

회귀분석 단축키 reg 사용.

 

<예시>

labinc elen middle high를 확인하고 싶은 경우

reg labinc elen middle high

 

결과로 위의 값이 주어졌고

 

위의 식이 존재하면

B1 B3 B0의 추정치는

(coef = 모형적합도, ols 추정치, x증가 시 y 변화)

위의 값과 같다.

 

B0(cons로 표기)의 값은

절편으로 모든 값이 0일 때다.

Coef는 각 값이 1 올라갈 때  labinc 변화치다.

 

결과로 위의 값이 주어졌고

 

 

위의 식이 존재하면

B4의 추정치 및 

B4의 계수추정치 표준편차 (클수록 불확실)는

위의 값과 같다.

 

 

 

동의 와 기각

P value : 주어진 귀무가설(H:0)을 기각하기 위한 최소한의 유의 수준

(P 벨류를 넘는 수준이면 기각)

즉, P value가 0이라는 이야기는

유의수준을 몇 프로로 잡아도 

다 기각해야 한다는 의미이다. 

(즉, 대립가설(H:1)을 택해야 함)