題目及變數說明,除了透過文字說明題目的內容,變革,訪問波次等資訊外,data的基本統計資訊對使用者來說也是相當重要的資訊。在系統設計之初,老師們變建議需要有次數分配等描述性統計值。但如何呈現一直是一個相當頭大的問題。
希望比照nesstar,利用bar chart的方式呈現,既清楚,頁面也活潑。但我對動態繪圖一點idea都沒有。
很幸運的,我發現谷哥大神提供了一個很好用的現成工具google charts ,只要讓 php按照它的格式建立語法,便可動態產生統計圖表。實驗了兩天,效果出奇的好。目前所有的單選題都可以產生bar chart了,連多期資料都可以利用分組的方式讓各期的分配呈現在一個表內。目前只剩下一些細部調整,例如圖表的高度需設計動態調整,避免部分選項或波次過多的題組bar過細無法閱讀。
目前規劃單選題一定會以此方式呈現資料分配,至於複選題、填充題則還在思考要如何呈現。也許只提供有效值跟missing的次數就好了。
華人家庭動態資料庫從1999年迄今,在台灣每年進行追蹤調查,記錄了台灣五千多個家庭過去十多年來的變化。但隨著資料的不斷累積,龐大的數據資料及複雜的樣本、問卷結構使得研究者的進入障礙越來越高。為了方便使用者操作,因此有了建立合併資料的構想。這裡記錄了我的工作歷程及相關資料。也歡迎有興趣的人跟我一起討論。
2013年6月27日 星期四
2013年6月19日 星期三
下載清單進化,細節持續微調
前一陣子,一直不願意面對的問題就是使用者下載清單。理智上知道需要用jQuery來處理會比較漂亮,功能及效能上也會比較好。但無奈我對js實在不熟,一直搞不定。所以只好放著回頭去處理資料。
前兩天帶著一顆怕受傷害的心,不太情願的再回來接觸我一直搞不定的jqgrid,這次居然出奇的順利,我搞定了。目前已將使用者下載記錄改為jqgrid,按時間排序的功能也ok。
未來考慮進一步修改「購物車」將變數選擇清單也改程jqgrid。
另外,這幾天也將介面進行小調整,讓一些連結更清楚,也將一些表格加上顏色。 畫面還是慘白,有點單調,不過還沒想到要如何美化。
產生資料檔的程序如果能在同一個頁面呈現就更完美了,不過目前還沒想到完整的解決方案。
產生檔案後,會停留在等待下載檔案的畫面,其實比較理想的狀況,應該在檔案下載後,頁面轉到首頁或userinfo頁面,這部分還待解決。
資料部分,目前已發現問題包含婚姻題組,部分題目不會顯示「訪問波次/原始題號」可能在當初鍵入DB時有所遺漏,待補充。
另外,工作題組部分題目的選項有變動,但似乎未完全recode,待檢查。
說明的內容是需要全部重新檢視的,只要有動過手腳的部分,都應該要完整說明。
次數分配需思考該如何呈現,單次的題目比較沒有問題,但對於多次詢問的題目,要如何呈現便是一個問題,呈現歷年合併結果似乎沒有任何意義,單期個別呈現要如何兼顧版面也是一個問題。
前幾天進行了多人同時使用的測試,沒有仔細檢測內容,不過從表頭看起來是沒有問題的。
前兩天帶著一顆怕受傷害的心,不太情願的再回來接觸我一直搞不定的jqgrid,這次居然出奇的順利,我搞定了。目前已將使用者下載記錄改為jqgrid,按時間排序的功能也ok。
未來考慮進一步修改「購物車」將變數選擇清單也改程jqgrid。
另外,這幾天也將介面進行小調整,讓一些連結更清楚,也將一些表格加上顏色。 畫面還是慘白,有點單調,不過還沒想到要如何美化。
產生資料檔的程序如果能在同一個頁面呈現就更完美了,不過目前還沒想到完整的解決方案。
產生檔案後,會停留在等待下載檔案的畫面,其實比較理想的狀況,應該在檔案下載後,頁面轉到首頁或userinfo頁面,這部分還待解決。
資料部分,目前已發現問題包含婚姻題組,部分題目不會顯示「訪問波次/原始題號」可能在當初鍵入DB時有所遺漏,待補充。
另外,工作題組部分題目的選項有變動,但似乎未完全recode,待檢查。
說明的內容是需要全部重新檢視的,只要有動過手腳的部分,都應該要完整說明。
次數分配需思考該如何呈現,單次的題目比較沒有問題,但對於多次詢問的題目,要如何呈現便是一個問題,呈現歷年合併結果似乎沒有任何意義,單期個別呈現要如何兼顧版面也是一個問題。
前幾天進行了多人同時使用的測試,沒有仔細檢測內容,不過從表頭看起來是沒有問題的。
2013年6月6日 星期四
多對多串連測試
婚姻及配偶工作匯入之後,與受訪者工作題組便可進行多對多串連測試。結果不出我所料,因為原先的SQL語法未控制調查年,因此亂串一通。經過一個晚上的調整,目前已經修正。
最後,選擇資料的語法大致為
select 變數 from [table] left join [table] on id=id and 調查年=調查年 where (樣本群) and (選擇年度);
不管是串連,還是堆疊,大致上都採用相同的語法從資料庫中撈資料。堆疊較簡單,撈出來的資料直接寫入檔案即可。至於串連,就必需再利用陣列進行調整。
測試的過程中,發現原先的程式有缺陷,導致無法正確選擇樣本群,另外若沒有選擇具跨期資料的變數也會產生錯誤,目前也已修正。
今天略維修正堆疊的codebook及資料結構,將每個多其資料檔都會產生一次的「調查年」變數刪減為一筆只會產生一個。
串連部分的codebook,現在設計是與資料檔一致,每個變數都會產生一列說明,也就是說,跨期資料若每年都有,就會產生N次,但其實,內容除了「年」不一樣之外,其餘內容完全相同。這部分感覺有些累贅,考慮修改成一次,另以文字說明變數命名規則就好。
另外發現,若使用者不選擇受訪者編號,將使資料產生不出來。目前初步修改購物車設定,不讓使用者刪除受訪者編號,另外,題目說明頁面也配合修正。但比較嚴謹的作法,應該要再產生檔案前再做一次檢查,如果不小心被刪掉了,則強制加回。
最後,選擇資料的語法大致為
select 變數 from [table] left join [table] on id=id and 調查年=調查年 where (樣本群) and (選擇年度);
不管是串連,還是堆疊,大致上都採用相同的語法從資料庫中撈資料。堆疊較簡單,撈出來的資料直接寫入檔案即可。至於串連,就必需再利用陣列進行調整。
測試的過程中,發現原先的程式有缺陷,導致無法正確選擇樣本群,另外若沒有選擇具跨期資料的變數也會產生錯誤,目前也已修正。
今天略維修正堆疊的codebook及資料結構,將每個多其資料檔都會產生一次的「調查年」變數刪減為一筆只會產生一個。
串連部分的codebook,現在設計是與資料檔一致,每個變數都會產生一列說明,也就是說,跨期資料若每年都有,就會產生N次,但其實,內容除了「年」不一樣之外,其餘內容完全相同。這部分感覺有些累贅,考慮修改成一次,另以文字說明變數命名規則就好。
另外發現,若使用者不選擇受訪者編號,將使資料產生不出來。目前初步修改購物車設定,不讓使用者刪除受訪者編號,另外,題目說明頁面也配合修正。但比較嚴謹的作法,應該要再產生檔案前再做一次檢查,如果不小心被刪掉了,則強制加回。
訂閱:
文章 (Atom)