2013年6月6日 星期四

多對多串連測試

婚姻及配偶工作匯入之後,與受訪者工作題組便可進行多對多串連測試。結果不出我所料,因為原先的SQL語法未控制調查年,因此亂串一通。經過一個晚上的調整,目前已經修正。
最後,選擇資料的語法大致為

select 變數 from [table] left join [table] on id=id and 調查年=調查年 where (樣本群) and (選擇年度);
不管是串連,還是堆疊,大致上都採用相同的語法從資料庫中撈資料。堆疊較簡單,撈出來的資料直接寫入檔案即可。至於串連,就必需再利用陣列進行調整。

測試的過程中,發現原先的程式有缺陷,導致無法正確選擇樣本群,另外若沒有選擇具跨期資料的變數也會產生錯誤,目前也已修正。

今天略維修正堆疊的codebook及資料結構,將每個多其資料檔都會產生一次的「調查年」變數刪減為一筆只會產生一個。
串連部分的codebook,現在設計是與資料檔一致,每個變數都會產生一列說明,也就是說,跨期資料若每年都有,就會產生N次,但其實,內容除了「年」不一樣之外,其餘內容完全相同。這部分感覺有些累贅,考慮修改成一次,另以文字說明變數命名規則就好。

另外發現,若使用者不選擇受訪者編號,將使資料產生不出來。目前初步修改購物車設定,不讓使用者刪除受訪者編號,另外,題目說明頁面也配合修正。但比較嚴謹的作法,應該要再產生檔案前再做一次檢查,如果不小心被刪掉了,則強制加回。

沒有留言:

張貼留言