2012年8月17日 星期五

題目資料庫建構問題筆記

最末端的資料輸出有了初步成果後,我將焦點回到中段題目的部分。
題目的頁面預計提供完整的題目資訊,包含中英文題目、訪問波次及題目出處、特性等詳細描述。不過很多資訊仍有待後續慢慢充實,初期大概只有中文題目跟訪問波次而已。

題目資料庫應該可以算是串起這整個系統的核心架構。它提供使用者搜尋、瞭解、選擇題目,並觸發後續的資料串連。也關係到產生統計程式、codebook的格式,因此至關重要。
而題目與變數之間並不一定是一對一的關係,很多時候其實是一對多的連結。例如「請問您是在哪一年出生的?民國_____年_____月」,這便是一個一對二的關係。同時,一個題目可能在不同的波次(問卷)中重複詢問,因此題目與波次間同樣也是一對多的關係。
但一般而言,使用者在選擇變數時,同一題的所有變數應該會一併選擇,因此同一題的各個變數其實仍然可以視為一個整體。將題目與變數之間簡化為一對一的關係。

依此邏輯,當使用者選擇一題時,系統會自動帶入此題的所有變數。使用者另需選擇訪問波次,做為合併資料時的篩選條件。
在此,沒有想通的問題是,受訪者選擇訪問波次的時機該放在何時?選擇每個題目時都個別選擇所需的波次?或者,如果一般而言,整個資料檔的的時序範圍是一致的,也許可以將選擇波次的時間點放在選擇完所有變數之後。

第二個矛盾點在此處與codebook之間的矛盾。此部分搜尋、簡介以「題」為單位建置,但是codebook又回到以「變數」為單位呈現。似乎難以共用相同的題目及選項描述。若建構兩套文字,恐增加後續維護的難度,也容易產生不一致的出錯機率,目前還在尋求解決之道。

沒有留言:

張貼留言