2016年8月14日 星期日

面訪調查走一遭-事前準備:問卷設計

一般而言,問卷設計是研究者的事情這關助理什麼事?
的確,問卷設計階段主要就是研究者決定要問什麼問題,助理就是輔助的角色,配合研究者的需求找資料、整理資料。但也不盡然完全處於被動的地位。研究計畫有固定的期限,而研究者致力於研究議題常處於忘我的境界,助理在此階段的最重要工作就是掌握進度,告訴主持人還有多少時間可以進行問卷卷設計、還有多少議題有待討論。另外,對於有經驗的助理來說,有時還要扮演踩煞車的角色,適時的點出執行上的困難。
華人家庭動態資料庫是一個追蹤調查,因此,有許多題目是固定的。即便如此,每次問卷設計,都還是必須將所有題目回顧一遍,看看是否需要做些微調。在回顧的過程中,研究者會需要瞭解過去填答的情形、題目出現的頻率等資訊;因此必須準備好過去的資料檔,在會議中可能需要隨時跑個次數分配或交叉分析。另外,了解整體資料庫的問卷卷結構也是重要的基本功。這些固定的核心題目,隨著時空的變換,題幹、選項可能都會出現不合時宜的問題,或者不同的研究者也會有不同的觀點,但這些題目的修訂要十分小心,如果覺得新問法可能改變題意,或者新的架構可能產生無法與就資料對應的問題,就要及時提醒。這部分其實不必考慮太多專業的問題,因為研究者已是專家,助理只要從自身經驗或直覺的角色出發提供建言即可。別忘了,受訪者也是一般人,如果設計出來的問題連助理都無法理解,訪問時出狀況的機率絕對很高。助理千萬別因為覺得自己沒有經驗或缺乏專業而羞於在問卷設計階段表達意見;別忘了,在田野階段,自己是必須站在研究者的前面,直接面對訪員及受訪者的,如果自己都對問卷有所疑問,執行上一定會面臨更多問題。
在問卷設計階段還可能遇到研究者欲罷不能的情形。搜集資料是件不容易的事,有此機會,研究者常常會盡可能的問所有想問的問題。但訪問時間太長除了會讓受訪者不悅外,訪問費用也可能讓計畫無法負荷。因此,掌握計畫的成本,適時提醒研究者可能超出預算是十分重要的。至於多少長度的問卷是受訪者可以接受的,則將視訪問的方式不同有別,應該可以找到相關的研究討論,在此就不熬述了。
最後,就是進度的掌控。必須嚴格執行計畫執行之初所訂定的進度,告訴研究者還有多少時間可以討論,如果真的欲罷不能,必要時必須逼著研究者增加討論的次數。千萬別壓縮了後續的準備時程。其實,在問卷主軸確立後,問卷設計後期若時間不足,最後少問了幾題,或是文字的潤飾不甚完美,對整體訪問的影響,都不若後續準備時間不足造成訪問品質下降來得嚴重。因此,切記一定不能壓縮訪問前的準備時間。

2016年7月9日 星期六

面訪調查走一遭-事前準備:預算

錢是一件很現實的問題。調查也是一樣,縱然理想上執行的程序是固定的,但實務上要如何執行、能執行多少,都必須向預算低頭。這篇文章並不會揭露實際的價格,畢竟這涉及了「商業機密」。我只談談在預算編列時的注意事項。
    面訪調查的大部分經費都會花在正式訪問上。訪員的薪資計算通常會以論件計酬的方式為主,因此要求訪員做的每一個動作都必須有一個合理的價格,才能夠鼓勵訪員去執行。這其中又以完訪費為最大宗。完訪費顧名思義,就是完成一份問卷訪員可以拿到的薪資。
    完訪費的訂定會因為問卷長度、難易度及調查工具而異。問卷長度直接關係到訪問的時間是定價最主要的因素。但若問卷設計中有許多的跳題,直接以總問卷長度定價對計畫是十分不利的;以推估實際的填答數計價會較為公平。對追蹤計畫而言,我們可以用過去的填答狀況較精準的估計實際的填答數。而對於大多數的橫斷面調查而言,利用總體資料進行估計是一個不錯的方式。例如,假設問卷中我們針對有工作者設計了一連串工作細節的題目,我們便可利用總體就業率估計實際會回答這組題目的機率,以此決定價格。問卷的難易程度主要須考量訪員是否需額外向受訪者說明或互動。若問題只是生活經驗或事實,只需簡單的一問一答,比較不需考量著一層問題;但若設計了情境問題,需要訪員額外說明,甚至視實際情況隨機應變,就必須考慮提高費用了。在調查工具部分,傳統紙筆訪問技術層次低,若無太複雜的跳題設定應不必考慮此因素;但若採用電腦訪問,訪員需具備某種程度的電腦知識,並學習系統操作,便應考慮提高完訪費。
    為控管訪員的訪問進度及問卷的品質,完訪費會訂定不同的等級。達成進度或錯誤較少者,可獲得較高的完訪費,反之則以較低的薪資水準計酬。至於訂定標準,可視實際的預算與行政流程進行規劃。訪問進度標準須以整體訪問期間的情況進行評估,除了不同的完訪費登記外,也可考慮以單筆獎金的方式設計。而問卷品質,則可以問卷或訪員為單位進行評估。由於每份文件卷的訪問狀況都不同,因此,我認為以問卷為單位進行品質的評估是比較公平的方式,但此舉將使訪員計酬的複雜度提升。比較簡便的方式,是以訪員為單位,以訪員的總錯誤率評定完訪費等級,但此舉可能造成某些訪員因為少數問卷品質不佳,而將整體薪資拉低的不公平現象。
    問卷等級設計的另一考量因素則是採行相對標準或絕對標準的問題。相對標準,是固定每個等級的比例,將訪員(或文件卷)排名已決定訪員(問卷)的等級。相對標準的優點是整體預算較容易掌控,不會因為整體訪員品質的好壞而影響總支出;但缺點則實在訪員錯誤率接近時容易造成不公平的狀況。此不公平的情形尤其在以「訪員」為單位評定等級是最容易發生。若訪員的錯誤率十分接近,名次的排定可能將以小數點第三位決勝負,將可能造成錯一題差一個等級,薪資差好幾千元的情形,易造成訪員反彈。因此,採絕對標準對訪員是比較公平的作法,但缺點則是預算較不易掌控,若訪員平均錯誤率很低,可能造成預算超支;相反則可能剩於過多預算。個人認為折衷的方式,以「問卷」為單位採相對標準計酬。如此單一問卷錯誤率較高僅影響一份文件卷的費用,可減少薪資落差造成訪員反彈;而整體薪資因採相對標準,也不會受整體錯誤率高低影響。

其他費用
    完訪禮物:送給完成訪問的受訪者一份小禮物,以感謝對方的協助,也是提高完成率的重要誘因。面防調查因為打擾受訪者較多,一般都會準備完訪禮物。而完訪禮物的價格,需視打擾受訪者的程度(訪問時間、須受訪者配合的事項)決定。當然,還有另一個最重要的決定因素,就是計畫到底有多少錢。
    失敗樣本津貼:以固定樣本訪問而言,我們不可能期待樣本名單中的每一位受訪者都能完訪。但由於我們仍會要求訪員盡可能地去接觸名單上的每一位受訪者,因此,對於訪員以規定達成接觸的次數,但沒有完成的情形,仍應考慮提供一點津貼。在執行上,為了降低薪資規則的複雜度,也可事先估計完成(失敗)率,據此將失敗探訪的費用合併至完訪費中;但必須將此做法適度向訪員說明,才不會讓訪員覺得在做白工,而不願去探訪主觀認定成功機會較低的樣本。而對於追蹤調查而言,即使無法完成的樣本,了解受訪者的情況或意願,作為之後是否持續追蹤的參考也是十分重要的。因此,我們對於失敗樣本,只要達成規定的探訪次數,並紀錄每次探訪的狀況,都會給予一定的津貼。
    遠距津貼:在樣本分配或訪員調度上,可能會遇到一位訪員負責很大區域,或需調派訪員至較遠地區支援的情形。若訪員移動範圍超過一定距離,可比照出差,交通費及住宿費實報實銷,或以定額的方式補助訪員交通成本。唯遠距津貼應為非必要支出,雖在預算編列時應框列適當額度,但執行上,應該盡可能避免發生遠距支援的情形。
    保險:面訪員在外奔波進行訪問,發生交通事故或意外的機率較高。長期而固定的調查單位,訪員可以正式員工聘用,依法將提供勞健保。訪員已有基本保障,若在預算不足的情形下,可以不必再提供額外的保險。但對一般短期調查而言,訪員大多以按件計酬的方式承攬調查工作。承攬契約由於並非勞雇關係,因此無法為訪員投保勞保,但為了為訪員發生意外時提供一層保障,也避免後續賠償爭議,建議以意外險的方式為訪員投保。
    訪員訓練支出:須提供訪員交通費、出席費。如果辦理多天訓練課程,還會有住宿費。訓練場地的場地費、便當費也須一併列入。
    key in或電腦維護費:如果採用紙本訪問便須估計後續key in的方式及費用。採電腦訪問雖然不會用key in的費用,但軟硬體租用或維護、資料傳輸等仍須估計一筆經費。
    複查費:複查其實可以視為另外一個附帶的小規模調查。因此,訪問費、通訊(交通)費等上述的費用項目都可能包含在內。唯複查的主要目的是確保訪問的品質,因此執行方式、規模都可視可用預算金額調整。
    通訊費:與訪員、受訪者往來寄件的郵資、電話費等。依執行程序評估編列。
    印刷費:訪問所需各項文件的印刷費用。
以上大概就是目前想到的項目。其實整個執行程序處處都燒錢,之後若發現有漏列再隨時補充。

2016年6月30日 星期四

面訪調查走一遭-事前準備:執行計畫

有多少時間做多少事。所以,開始一個調查前,最先要做的事情就是擬定執行計畫。

    準備期到底要多長,這將與問卷的長度、樣本的規模、調查的程序方法等因素息息相關。通常,研究計畫都有時間限制,因此調查期間大概可以最先訂下來,接著,就是開始往回倒推一件一件事情塞進去了。先決定要做哪些事情,然後估計每件事情所需的時間。將程序以列表的方式依序列出,最好也列上每件事的負責人,方便大家知道自己什麼時候該做什麼事。
    首先,便是要決定調查程序,這是整個調查的大綱。PSFD近年發展出一套大致固定的調查程序,依序是:問卷設計(含樣本規劃)、申請IRB認證、編輯預試文件、預試(認知訪談)、問卷修改、IRB計畫變更程序、編輯正式訪問文件、正式訪問、複查、資料修正、釋出。其中,這每一項又有非常多的細節需考慮。
    問卷設計階段,主要是研究者們把要問的問題設計出來,同時也需決定調查的對象、樣本數、如何抽樣等問題。這個階段究竟需要安排多少時間,會跟問卷的長度、內容及研究團隊的專注度有關係。PSFD大約安排半年的時間,以每兩星期開一次會、每次2-3小時的節奏進行討論。
    在程序中,我安排了兩次IRB審查的時間,主要是整個調查計畫初步定稿後,還會進行一些測試,測試完成後勢必會進行問卷修正。因此,在首次申請IRB通過後,在計畫執行前,我仍然安排了一次修正的行程。至於IRB審查需要花多少時間,則需看審查單位而定。一般而言,申請會預估大概一個月的時間;變更則比較快,只要不是大幅變更,大概一至二星期即可完成。
    在申請通過IRB的認證後,我們就可以開始進行預試。預試的形式、規模,甚至是否需要進行,都可視研究的需要而定。PSFD的預試歷經多個階段,各有不同的做法。最初,PSFD是以整份主問卷進行預試,以新抽樣的方式大約完成200個case。不過由於PSFD是追蹤調查,以新樣本訪問的方式將無法測試追蹤的題目是否有效。因此,後來也曾嘗試過建立小規模追蹤樣本的方式進行預試。當時的進行方式,是將完成的200案中分一半,一半為前一波訪問預試完成的case,另外一半則新抽。為了不過度打擾這些測試的受訪者,每位受訪者只問2次後及不再打擾。因此,每次預試都會有一半是前一次完訪的樣本,另一半新抽,而新抽的這一批將會在下次預試時再問一次。但這樣的成本是很高的,另外,也是因為PSFD是追蹤的關係,有大部分的題目每年都相同,似乎沒有重複不斷測試的必要。因此,後來又進一步改為僅針對當年修改或新增題目進行認知訪談的方式進行預試,這也是目前的執行方式。預試的執行,訪員與受訪者的感受是十分重要的。因此,無論以何種方式進行,都必須實際瞭解訪員及受訪者的心得,做為後續問卷修正的參考。
    而預試後的問卷修改,通常已經與正式執行非常接近了,必須快刀斬亂麻,通常安排1到2次會議就必須定稿。編輯訪問文件,則會視不同的訪問方式而需要不同的處理時間,這部分細節將於後面討論「調查文件、工具及訓練準備」再詳述。
    正式訪問所需的時間則會按照訪問的規模及範圍而有所不同。PSFD由於是追蹤調查,樣本較為分散,另外也希望能盡可能找到受訪者,因此安排的訪問期間較長(約8週),甚至還會因為少數個案而進一步延長。
    「複查」是為了確保訪問品質而再次向受訪者確認的工作。一般而言,複查的時程與訪問是重疊的。開始的時間將視資料回傳的速度及後端人力處理的速度而定。電腦訪問,由於資料回傳的速度較快,大約可在正式訪問開始後的第三週開始進行複查。紙本訪問由於多了問卷寄回及key in的時間,可能必須延至第五週展開。但複查不宜與正式訪問相隔太久時間,避免受訪者記憶模糊。
    最後,資料修正則可分為兩個部分。分別為調查期間的資料檢核及調查結束後的資料修正。PSFD近年的執行程序,會在問卷定稿後,同步進行訪問系統的問卷編輯與資料檢核程式的撰寫。訪問時,每批資料回傳便可立即進行檢核。而訪問完成後,則會進行資料的細部修正,這部分就比較沒有時效的壓力了。
 

2016年6月25日 星期六

面訪調查走一遭-緣起

這是一個寫作計畫。
    雖然內容與合併資料系統的開發無關,但這是我在這個計畫多年,執行多次面防調查的心得。也算是可以沾上一點邊吧!
    會想要寫這一系列的文章,主要是最近遇到幾位新進的同事,被主管交代執行面防調查計畫,但卻無從下手。我不得不說,主管可能太輕忽了執行層面了。做一個調查,除了設計問卷、抽樣、分析這些屬於研究者的工作外,執行層面的細節更是千頭萬緒,絕非一個沒有經驗的菜鳥可以勝任的。寫這一系列文章,除了記錄我這部分工作的心得外,也希望讓後進的菜鳥們一個心理準備,知道有多少事情在前方等著你;更希望告訴計畫主持人們,體恤下屬,別把事情想得太簡單。
    這是PSFD執行的程序,並不代表面訪調查的SOP。調查執行是很有彈性的,一切都會因為預算、執行目的、規模、時間、地點、調查工具而有所改變。即使像是PSFD這樣固定執行的調查計畫,每次執行都仍然會遇到不同的情況必須因時制宜的情形。
    接下來就先大致說明一下PSFD的基本概況吧!資料庫樣本數在八千人左右(實際完成約6~7千人),雖然沒有政府調查動輒幾萬樣本得轟轟烈烈,但在學術調查中應已屬於中大型規模。追蹤調查的設計,執行層面屬於較複雜的案例。而在時間、經費與許的情形下,大致的執行程序也算是符合教科書的典型標準,因此應該有某程度的參考價值。另外,值得一提的是,PSFD並非獨立完成整個調查計畫,而是與一個專責調查單位合作完成。 雙方的合作模式大致是:由計畫小組設計整個調查計畫,田野的部分交由調查單位執行,最後再將調查完成的資料交給計畫小組做後續整理。訪員的招募、基本訪問技巧訓練、訪問進度掌控皆由調查單位負責。這些部分,又是另一個專業了,我雖然因為雙方緊密合作而有所涉獵,但畢竟涉入不深;因此,後續的內容雖會提及,但也僅止於點到為止。這一系列的文章,將以計畫小組為主題,分享調查的點滴。
    綱要
壹、事前準備
    一、擬定預算及執行計畫
    二、問卷設計
    三、調查文件、工具及訓練準備
        1. 訪問通知函、訪問說明書(受訪者同意書)
        2. 提示卡、提示問卷
        3. 問卷說明手冊編製
        4. 紙本調查問卷準備
        5. 電腦訪問問卷準備
        6. 樣本規劃及分配
    四、申請IRB認證
貳、調查執行
    一、訪員訓練
    二、品質管控
        1. 訪員問題回覆
        2. 即時問卷品質管控
        3. 複查
    三、危機處理
參、資料處理與事後收尾
    一、數據資料鍵入整理(紙本訪問)
    二、資料檢誤
    三、受訪者名單維護與關係維持

2015年5月18日 星期一

近期開發方向

近期由於業務的調整,我終於有時間恢復這個合併資料系統的開發了。
去年,由於配合單位績效評估的需求,曾經嘗試進行子女資料合併的開發。此部分已略有雛形,簡單說明如下:
1. 併檔方式:可分為兩種。
    (1) 子女資料與主樣本配對:將子女資訊與主樣本資訊合併。此方式考量每個家戶受訪子女數量不依,為統一資料長度,因此現階段規劃無法將整個家戶合併為一筆資料,僅能對主樣本及子女一對一配對。例如,某一家戶的老大及老二皆為我們的子女樣本,合併資料中,該家戶便會有兩筆資料,一筆為主樣本與老大的配對資料,一筆則為主樣本與老二的合併資訊。
    (2) 歷年子女資料合併:不涉及主樣本,僅單純將子女資料由C子女問卷、RCI問卷到RR問卷完整的歷年資料合併。

2. 系統整合設計:與原先只有主問卷的系統統加以整合。加入子女題組後的系統,設計由系統主動判斷應啟動何種併檔模式。如果使用者選擇的變數中並未包含C問卷變數,則系統變主樣本併檔程序進行併檔。若選擇的變數中包含C問卷變數,系統則會啟動子女併檔模式,提供上述兩種併檔方式供使用者選擇。

3. 子女併檔的困境:
    (1) 效用不明:過去應用華人家庭動態資料庫的資料進行研究的文獻中,一直缺乏應用子女資料的相關論文。因此,在進行系統開發時,也很難掌握使用者的確實需求。(如果各位看官們腦海中有任何資料結構的想像,歡迎告訴我啊!)
    (2) 合併資料結構複雜:此問題尤其以「子女資料與主樣本配對」的結構最為困難。其中,部分子女資料涵蓋RCI及RR的變數,此部分變數名稱將與主樣本重複,該如何識別區分是一大難題。

4. 現況:目前子女資料合併功能開發已具雛形,系統已可運作並產生資料檔。已進行至資料併檔正確性驗證及除錯階段(於內部測試主機中,外部測試機並未包含此功能)。但由於上述問題,此部分開發擬暫時終止。

近期開發計畫,近期開發計畫將先回到主樣本資料庫的部分,先逐步將目前未含蓋的題組納入,目標希望納入2007(含)以前所有主問卷題目,以其提升主樣本資料庫的利用價值。後續再進行子女資料合併功能的開發。及後台管理系統的開發。
涵蓋資料部分,將暫時以2007資料為一切點,後續年度資料將暫緩納入,以此作為後台開發時的測試資料。

「家庭決策與支出」題組重整

「家庭決策與支出」算是華人家庭動態資料庫中相當重要的一個題組。此題組加入合併資料系統已有一段時日。但由於當時資料處理的疏失,沒有將跨波次資訊匯入資料庫中,導致資料檔雖包含1999-2007年的資料,但清單中無法正常顯示,當然,也就無法正確的合併資料了。近日,為了修正此錯誤,因此將整個題組進行重整。
由於此題組並不涉及與前波訪問時狀態的跳題關係,因此處理起來較為單純。因此,僅需比對各期問卷中相對的題目及變項加以整合即可。大致處理內容如下:
1. 部分首波調查題組未納入:
分析歷年「家庭決策與支出題組」發現首波問卷的題目設計與後續追蹤問卷差距較大,部分題目僅於首波問卷詢問,部分題目於後續問卷中移至其他題組中詢問。因此,此次處理將這些問題暫時排除,僅處理後續追蹤問卷常態詢問的題目部分。首波問卷中,排除的題目包括:
(1) 請問您,下面這些事在您家中是誰的意見最重要?
(2)過去一年(十年)來,您有沒有接受過下列對象的資助或貸款?
(3) 過去一年(十年)來,您有沒有給下列對象資助或貸款?
(4) 分產
(5) 常用的交通工具
這些題目將於後續資料處理時另行考慮應如何歸類於系統中。

另外,部分題目由於提型的改變,因此對資料進行了數值調整,包含:
(1) 在去年之中,您或您的家人是否有從經營或參與投資的事業中獲利或虧損?
     此題 「(6) 沒有」為RR2002獨有選項(原選項數值為3),「(4) 沒有獲利或虧損」為RR2004獨有選項,「(3) 有,去年剛好打平」及「(5)沒有經營或投資生意」為RR2005以後新增選項。配合選項整並,將「沒有」調整為6。

(2) 在去年之中,您是否曾經領取退休金?
     此題2002及2004僅分為有領跟沒領;2005年起,將沒有領退休金分為「3) 有辦過退休,但去年沒領退休金」及「4) 沒有辦過退休」。2007年起有領退休金的情形增加「先領一部份,然後再按月領取,去年共領 ___________ 元」的項目。配合選項整併,因此2005年起選項重新調整,不含「(2) 沒有」。

 (3) 在去年(1-12月份)之中,您是否曾經領取政府失業保險金?若有,請問是那幾個月?
     系統中逐月詢問的呈現方式為2004年的問法。2002首次詢問時,是以「自月份領到 月份」方式呈現,重新編碼統一調整為2004的格式。其他年則未詢問領取月份。

(4) 在過去一年裡,您家中每個月的平均支出情況大約是?標會支出
    此題於RI1999、RI2000及RI2003未分死會及活會,記錄於e10c03中。
以上說明。

2014年6月20日 星期五

合併資料1999-2007資料處理說明─D01a

題目/變數:
D01a01「請問您目前結婚了嗎?」
D01a02「是在哪一年開始或發生的?」

資料處理說明:
  1. D01a01選項變動:RI1999, RI2000, RI2003, RII2000, RR2006, RCI2004, RCI2005為「未婚、同居、已婚、分居、離婚、喪偶、其他」七類。RR2007起,將原有的「已婚」進一步拆為「已婚(第一次結婚)、離婚再婚、喪偶再婚」共9類。整合後,成為「未婚、同居、已婚、已婚(第一次結婚)、離婚再婚、喪偶再婚、分居、離婚喪偶、其他」共10類。其中「已婚」選項為1999-2006使用,包含2007年(含)以後的「已婚(第一次結婚)、離婚再婚、喪偶再婚」三種情形。
  2. 2001~2005並未詢問此題,此五年資訊為利用問卷中的d01b題「請問從我們去年一月訪問您以後,您個人的婚姻狀況有沒有改變?」資訊進行回補。各年處理方式說明如下:
    (1) 2001:「沒有變化,仍然已婚」、「沒有變化,仍然單身」d01a01及d01a02以前一年資訊為準。若為「有變化,最近一年結婚、分居、離婚、喪偶」等情形,d01a01分別記錄為「已婚、分居、離婚、喪偶」,d01a02年代記錄為「民國89年」。
     (2) 2002:「沒有變化,仍然已婚」、「沒有變化,仍然單身」d01a01及d01a02以前一年資訊為準。若為「有變化,最近一年結婚、分居、離婚、喪偶」等情形,d01a01分別記錄為「已婚、分居、離婚、喪偶」,d01a02年代記錄為「民國90年」。
    (3) 2003:分為兩種情形,其中該年度新抽樣本使用RI2003進行訪問,已包含d01a01及d01a02變數資訊;唯1999及2000年樣本使用RR2003訪問,該份問卷並未詢問婚姻狀況,而是於rr2004問卷中詢問「請問從民國91年1月以後,您個人的婚姻狀況有沒有改變?」替帶回補。「沒有變化,仍然已婚」、「沒有變化,仍然單身」d01a01及d01a02以2002年資訊為準。若為「有變化,最近一年結婚、分居、離婚、喪偶」等情形,d01a01分別記錄為「已婚、分居、離婚、喪偶」,d01a02年代部分,因該題目一次詢問「近兩年」的變化情形,無法更精確區分發生年代,所以記錄為記錄為「民國92年」。
    (4) 2004:同樣分為兩種情形:2003年新抽樣本以該份問卷「請問從民國92年1月以後,您個人的婚姻狀況有沒有改變?」資訊進行回補,「沒有變化,仍然已婚」、「沒有變化,仍然單身」d01a01及d01a02以2003年資訊為準。若為「有變化,最近一年結婚、分居、離婚、喪偶」等情形,d01a01分別記錄為「已婚、分居、離婚、喪偶」,d01a02年代記錄為「民國92年」。1999及2000年樣本以「請問從民國91年1月以後,您個人的婚姻狀況有沒有改變?」替帶回補。「沒有變化,仍然已婚」、「沒有變化,仍然單身」d01a01及d01a02以2002年資訊為準。若為「有變化,最近一年結婚、分居、離婚、喪偶」等情形,d01a01分別記錄為「已婚、分居、離婚、喪偶」,d01a02年代部分,因該題目一次詢問「近兩年」的變化情形,無法更精確區分發生年代,所以仍記錄為「民國92年」。
    (5) 2005:「沒有變化,仍然已婚」、「沒有變化,仍然單身」d01a01及d01a02以前一年資訊為準。若為「有變化,最近一年結婚、分居、離婚、喪偶」等情形,d01a01分別記錄為「已婚、分居、離婚、喪偶」,d01a02年代記錄為「民國93年」。

3. 2006及2007詢問D01a01題,但並未包含D01a02題,D01a02資訊透過比對前後兩年婚姻狀態補充。若兩年婚姻狀態相同,d01a02以前一年的資訊記錄。若兩年婚姻狀態不同,代表婚姻狀態有變動,則2006的d01a02記錄為「民國94年」,2007的d01a02記錄為「民國95年」。

目前問題說明: 以上述方式處理後,d01a01在2001-2005年之間,仍有603個樣本(1,204次)呈現missing。主要的原因有二:
1. 訪問曾經中斷,導致沒有足夠的資訊可以比對。
2. 子女主樣本,未曾訪問過rci問卷。