第一節 調查問卷的回收與編輯
數據資料的處理過程是從回收第一份問卷開始的。按照事先調查方案的計劃,盡量確保每份問卷都是有效問卷(所謂“有效”問卷,指的是在調查過程中按照正確的方式執行完成的問卷)。問卷回收以后,督導員必須按照調查的要求,仔細的檢查問卷。檢查問卷的目的在于將有錯誤填寫,或者是挑出不完整或不規范的問卷,保證數據的準確性。所謂錯誤填寫即出現了那些不合邏輯或根本不可能的結果,通過對調查員的復核,可以檢查出哪些調查員沒有按照調查的要求去訪問,那么,該調查員完成的問卷可能存在很多問題。還有可能出現漏答了某些必須回答的問題,比如被訪者的人口特征等基本情況,造成問卷回答不完整。
鑒于這些情況,不管是由于調查員造成的還是被訪者的原因,通常有兩種方式進行補救:對于出現漏答的問卷,通常要求調查員對受訪者進行重訪,以補充未答的問題;如果不便于重訪或重訪后的問卷還有問題,數目不是很多,可以當作缺失值計。如果數量非常大,這份問卷就只能當作廢卷處理,并且按照被訪對象的抽樣條件,補作相關的樣本。
問卷檢查
問卷的檢查一般是指對回收問卷的完整性和訪問質量的檢查,目的是要確定哪些問卷可以接受,哪些問卷要作廢。檢查的要點包括:
(1) 規定詳細的檢查規則,一份問卷哪些問題是必須填寫完整的,哪些問題出現缺失時可以容忍等,使督導員明確檢查問卷的每一項流程。
(2) 對于每份調查員交回來的問卷必須徹底地檢查,以確認調查員或者被訪者是否按照相關的要求完成了訪問,并且完整的記錄在問卷恰當的位置。
(3) 應該將問卷分成三種類型,一種是完成的問卷,一種是作廢的問卷,第三種是有問題的問卷,但是通過追訪還可以利用的問卷。
(4) 如果抽樣中有配額的要求,那么應將完成的問卷中的配額指標進行統計分析,確定問卷是否完成配額的要求,以便及時的補充不足的樣本。
(5) 通常有下面的情況的問卷是不能接受的:所回收的問卷明顯不完整,缺了一頁或者多頁;問卷中有很多內容沒有填答;問卷的模式說明調查員(被訪者)沒有理解或者遵循訪問指南回答等;問卷的答案幾乎沒有什么變化,如在態度的選項上全部選擇第x項的情況;問卷的被訪者不符合抽樣要求;問卷的回收日期超過了的訪問的時限等。
問卷的校訂
為了加強問卷的準確性,對那些初步接受的問卷還要進行進一步的檢查和校訂,在校訂的過程中,通常會發現問卷中存在有字跡模糊、問題漏選的、前后回答不一致的、答案模棱兩可的和跳答錯誤的問題。
問卷的某些問題答案可能出現字跡模糊的情況,特別是碰上無結構的開放式的問題時,因為調查員記錄的不好,答案不容易識別。如果發現這樣的問題,必須對受訪者進行追訪,將積極不清楚的地方填寫清楚。
對于漏選的問題處理方法也是一樣,出現漏選的題目因為各種原因,無法進行補充訪問事后,普通的問題,而且數目不大的情況,通常作為缺失值處理;如果涉及到是受訪對象的個人特征的問題,通常只能作為廢卷處理。
問卷中有些問題的答案會出現不容易理解的模棱兩可的情況,或者是使用了不是通用的縮寫方式或詞語,或者在該單選一項的問題中,圈選了兩項等,都必須通過追訪進行補救。另外就是回答時可能出現跳答錯誤的情況,這可能是因為被訪對象沒有很好的理解問題。如果出現這種情況,首先要核實被訪對象是否符合抽樣調查的條件(跳答題目往往是篩選條件),如果符合,進行追問補充,如果不符合條件,問卷只能作廢,重新補充樣本。
問卷的回收、檢查與校訂可能是非常繁瑣、且工作時間很長的工作,但是卻是保證數據處理過程中較少誤差的重要的步驟。
問卷的編碼
編碼是指對一個問題的不同答案進行分組和確定數字代碼的過程。大多數問卷的大多數問題都是封閉式的,在調查之前就已經完成了編碼的過程,即每一組問題的不同答案的數字編碼已經確定。
而開放式問題,因為不知道會得到什么答案,或者是希望得到比列出的封閉式的選項更詳盡的答案,所以在調查結束后,必須對這些開放式的問題進行事后編碼。開放題的事后編碼的工作量很大,無法預知會出現多少個新的代碼和答案,而且有些答案是非常類似的,必須決定是否合并成一類呢,還是分成不同的代碼。具體地說明編碼需要以下幾個步驟:
(1) 每個需要編碼的項目都必須有一份編碼表,將問題和項目的代碼詳細的標注在編碼表的頂端位置,由于事先不知道會有多少新的代碼或答案出現,所以一定要預備足夠的空間。
(2) 如果編碼的工作由一個編碼員完成,出現錯誤的可能性相對較小。但實際上,因為需要編碼的問題可能很多,一個認識沒有辦法按時完成的,這就需要多個編碼員。在這樣的情況下,一定要注意多個編碼員工作的協調。應該安排編碼員在不同的時間,或者相同的時間相同的地點,使用同一個編碼表。這樣可以避免編碼重復的情況。
(3) 研究人員應詳細制定編碼的守則,指導編碼員如何識別答案,并且將其歸類,以及如何分配編碼等等,并同時對編碼的過程進行監督和檢查。編碼員在編碼的過程中可能有兩種傾向:一種是事無巨細將出現的每一種答案夠給與新的代碼,結果代碼的數量比預料的要多出很多;另一種情況是對答案的歸類過于粗糙,可能丟棄了數據中有意義的差異。對于這兩種情況都必須通過守則的規定,盡量避免。碰到無法確認的分類的時候,通常的做法是付與一個新的代碼,如果需要合并,可以在將來的數據處理過程中完成。
(4) 可以對“不知道”、“無所謂”、“不清楚”、“缺失”事先規定,但是一定要注意規定的編碼與實現對該問題的最大編碼的預計的數量一致。
(5) 編碼的字跡必須清楚,如果可能的話,及時的進行計算機的錄入管理。