2012年9月27日 星期四

PSID Data Center-資料下載

PSID Data Center的購物車也是利用樹狀結構呈現,如果選擇了多年的資料,樹狀圖的第一層是按照年代排列,第二層則顯示選擇了該年的變數清單。可以勾選變數刪除,亦可直接將整個購物車清除重來。或點選check out,產生資料表。
點選check out程序共有六個部分可進行設定:
Codebook type:可設定codebook的格式,共可選擇HTML, PDF, XML也可以選擇不要產生codebook。另外,還有一個相對的選項是「只產生codebook不輸出資料」不過我想應該不會有人勾選這個吧?!
 Data output type:可選擇輸出資料的格式包含ASCII Data with SAS/ SPSS/ Stata Statements, Excel檔, , SAS V9 Transport Data File共六種格式。不過這是單選提,所以一次只能選擇輸出一種格式。
Subsetting Criteria:可以提供你輸入一些條件語法,篩選變數,不過僅限購物車裡有選擇的變數。另外,語法採用SAS格式。這不禁讓我十分好奇背後的資料架構到底是什麼database?不過老實講,這樣的個開放格式讓使用者輸入語法篩選,背後勢必需要相當複雜而言僅的檢核程式,另外也增加了流程上出錯的機率,所以我目前開發的系統並不打算提供樣本篩選功能。
Subsetting of CDs and Family Members:可以選擇要輸出所有家庭成員的資料,或是指輸出小孩的部分。這應該是配合PSID樣本結構的特殊選項。
Compression Option:可以選擇是否要將相關檔案壓縮成一個zip檔。如果不選擇的話,下一步驟會將所有檔案個別的連結列出,可以一一下載。
Cart Options:可選擇是否讓目前選擇的這個資料檔公開。以及是否將下載資料的連結email到信箱一份。

全部選擇完畢後按submit就可以產生資料檔嚕!資料檔產生頁面處了下載檔案的連結外,也會顯示資料檔的基本訊息(這次選了幾個變數,包含多少樣本等等)。
另外就是兩點基本的注意事項嚕! 第一點告訴你資料檔會在七天後刪除。這句話也顯示了資料檔會在server上保留七天。另外就是,他還是強烈的建議你要下載完整的問卷檔或codebook,比較能夠看到全貌。

整個操作過程中,感覺網站的反應速度並不快,各項功能雖然不能說非常方便,但已經十分完整了。是一個非常值得觀摩學習的對象。

沒有留言:

張貼留言