경제학 질문과 답변계량 분석을 하려고 데이터를 다룰 때에 자료 검증 방법
SNB Plus 스탭 asked 5 개월 ago

raw 데이터를 불러오고 stata를 이용하여 코딩하는 것을 연습하고 있습니다.
이 과정에서 사소한 것들이 궁금한데,
1. 자료를 제대로 불러왔는지, 불러온 자료 코딩이 제대로 되었는지 어떻게 검증할 수 있을 까요?
raw 데이터를 불러왔고 라벨도 잘 달려있긴합니다만, 기초통계량 등이 맞게 된건지 실수가 없는지 불안합니다.
혹시 기초통계량을 검증하기 위한 팁이 있으시면 알려주시면 좋겠습니다.

2. bk컨퍼런스 때 살짝 소개되었는데, stata do파일을 다루는데 괜찮은 에디터 소개해주시면 좋겠습니다.

 

2 Answers
SNB Plus 스탭 answered 5 개월 ago

1번과 2번은 질문의 성격이 다르므로 2번은 별도의 질문으로 해 주는 것이 좋겠네요.

SNB Plus 스탭 answered 5 개월 ago

원래 데이터가 엑셀 포맷이라고 한다면, 1번에 대해서 제가 자주 사용하는 방법은 (i) Stata에서 import하는 코드에 오류가 없는지 눈으로 확인, (ii) 엑셀과 Stata를 둘 다 열어 놓고 전체적으로 눈으로 비교하는 방법(missing 부분을 주의깊게 보아야 함), (iii) 변수별로 표본크기와 표본평균을 계산해서 엑셀과 스타타 양쪽이 일치하는지 확인, (iv) Stata와 R 두 가지로 import를 한 다음 Stata와 R의 결과가 동일한지 확인인데, 보통은 네 가지 모두를 하거나 (i)과 (iv)를 합니다(엑셀을 잘 사용하지 않기 때문에).

SNB Plus 스탭 replied 5 개월 ago

명쾌한 해설 감사드립니다.
missing 부분을 주의깊게 봐야 한다는 점, 기초 통계량을 통해 비교한다는 점 등 정확한 답변 감사드립니다.

SNB Plus 스탭 replied 5 개월 ago

고맙다는 이야기는 안 해도 됩니다. ^^ 그리고 답이 되었으면 답으로 채택하든지 아니면 upvote를 해 주면 좋습니다. 🙂