- 將RII2000選擇工作及工作內容皆未改變的樣本,其行職業等工作資訊以2000年資料回補。
- 2002年回答工作沒有改變的樣本,其相關資訊以2001年資料回補。
- 2003年因問卷訪問生命史而未問相關工作資訊,其資料已2004年補問相關訊息回補。
- 2005年回答工作沒有改變的樣本,其相關資訊以2004年資料補回。
- 部分2005年回答工作沒有改變的樣本,因2004年未完訪,導致工作資訊無法回補;此情形利用2006年A8a題回答沒有換過工作的情形,將工作資訊往前回補,補完後仍有56筆缺漏。
- 第二點補回後,仍有部分樣本因2001年未完訪而缺漏;同第五點,若受訪者回答一直從事相同工作,且做了超過3年者,利用2006年工作資訊回補2002年工作資訊。回補後仍有65筆缺漏。
華人家庭動態資料庫從1999年迄今,在台灣每年進行追蹤調查,記錄了台灣五千多個家庭過去十多年來的變化。但隨著資料的不斷累積,龐大的數據資料及複雜的樣本、問卷結構使得研究者的進入障礙越來越高。為了方便使用者操作,因此有了建立合併資料的構想。這裡記錄了我的工作歷程及相關資料。也歡迎有興趣的人跟我一起討論。
2011年7月14日 星期四
歷年工作資訊回補
歷年工作資訊合併後,緊接著進行前篇文章的第四點,跳答資訊回補的工作。
2011年7月8日 星期五
歷年工作經歷合併
近日工作主要處理歷年受訪者工作資訊的合併。合併方式與歷年現住合併類似,不過由於不同問卷的工作相關問題及選項有所不同,因此處理起來較為複雜。
主要的處理程序為:
相關題目及選項的調整說明未來將記錄於codebook中。
主要的處理程序為:
- 整理各問卷受訪者相關問題。
- 整理同一年度不同問卷的相關問題,將題號重新編碼,相同題目以相同變項名稱命名。
- 比對選項,將同年度、同題目但選項不同者重新編碼。
- 補充資訊:部分工作資訊因受訪者工作不變而跳答,將相關資訊由先前訪問資料中補回。
- 補充數值:部分不同年度或同年度不同問卷因題目設計不同而產生部分題目無法對應的情形,若該提訊息可以尤其他題目中推出,則會以推估的方式補回資訊。
相關題目及選項的調整說明未來將記錄於codebook中。
訂閱:
文章 (Atom)