(一)整理資料
整理資料的過程一般包括:①對原始資料進行審核,訂正。審核所有被調(diào)查單位的資料是否齊全,有無差錯,并對差錯進行審核訂正。②編碼。將問卷的信息(包括調(diào)查問題和答案)轉(zhuǎn)化為同一設計的計算機可識別的代碼。③數(shù)據(jù)的錄人。對于計算機輔助電話調(diào)查,計算機輔助面訪以及網(wǎng)絡調(diào)查,數(shù)據(jù)的收集與錄人可以同時進行,無須再進行數(shù)據(jù)的錄人。對于面訪,郵寄調(diào)查等,還需要對數(shù)據(jù)進行錄人。④數(shù)據(jù)的清潔和預處理。在調(diào)查的清潔和預處理階段,主要的工作是進行一致性檢查和邏輯檢查,以及缺失數(shù)據(jù)的處理,而對于缺失數(shù)據(jù)的處理方法主要有刪除個案,刪除缺失值,插補法以及加權(quán)組調(diào)整法等。
對原始資料進行了上述整理之后,便可以開始進行資料統(tǒng)計分析了。統(tǒng)計分析是運用統(tǒng)計學的方法對調(diào)查所得的數(shù)據(jù)資料進行定量分析,以揭示事物內(nèi)在的數(shù)量關系、規(guī)律和發(fā)展趨勢的一種資料分析方法。常用的統(tǒng)計方法有很多,主要有描述分析、推理分析、多元統(tǒng)計等。
(二)描述分析
描述分析主要著重于對數(shù)量水平或其他特征的描述,通過具體指標反映某一方面的特征。
1。單變量集中趨勢分析
集中趨勢就是一組數(shù)據(jù)的代表值,它能說明一組數(shù)據(jù)的一部分全貌,即它們的典型情況。它用一個典型值來代表變量所擁有的所有數(shù)據(jù)。這樣一個典型值就叫做集中趨勢統(tǒng)計量。常用的指標有:平均數(shù)、中位數(shù)和眾數(shù)。
平均數(shù)適用于定距或定比變量,其優(yōu)點是資料利用率比較高。受每個觀察值影響比較穩(wěn)定,而缺點是容易受極端數(shù)值的影響,如果觀測值中有明顯的極端值,則平均數(shù)的代表性較差。
中位數(shù)適用于定序、定距、定比變量。特別是分布不規(guī)則的數(shù)據(jù),其優(yōu)點是不受極端數(shù)值的影響,而缺點是沒有充分利用資料的全部信息,穩(wěn)定性差于平均數(shù),優(yōu)于眾數(shù)。
眾數(shù)主要適用于定類、定序變量,其優(yōu)點是不受極端值的影響,尤其是分布明顯呈偏態(tài)時,眾數(shù)的代表性更好,而缺點是沒有充分利用資料的全部信息,缺乏敏感性和穩(wěn)定性。
2。離散趨勢分析
集中趨勢反映了一組數(shù)據(jù)的典型情況。但是各個數(shù)據(jù)之間仍然存在著差異,還不足以反映這組數(shù)據(jù)的全貌。因此,要全面反映數(shù)據(jù)的規(guī)律性,除了反映數(shù)據(jù)的一般水平之外,還要反映數(shù)據(jù)的離散水平。所謂的離散水平是指數(shù)據(jù)對集中趨勢的偏離程度,如果數(shù)據(jù)的離散程度越大,則集中趨勢對該組數(shù)據(jù)的代表性越差。如果離散程度越小,則集中趨勢的代表性越好。常用的反映離散程度的指標主要有異眾比率、四分位差、標準差等。
3。多變量相關分析
相關就是指變量與變量之間的相互關系。有的關系是確定性的,也就是說當一個變量確定之后,另一個變量也就完全確定了,比如圓的面積與半徑的關系,當半徑知道了,圓的面積也就知道了。這種關系稱之為函數(shù)關系。
而有的關系卻不那么明確。一個變量確定了,但另一個變量卻不確定。比如農(nóng)作物的產(chǎn)量除了施肥量的影響外,還受氣候、土壤等許多因素的影響。在收人確定的情況下,消費者的購買行為還與商場促銷、購物環(huán)境、同事的評價等息息相關。這些現(xiàn)象表面上看起來并不相關,但是通過大量的調(diào)查研究還是可以發(fā)現(xiàn)其中某些變量之間是有
規(guī)律可循的。
把這些變量之間的相互關系稱之為相關關系,而對于這類相關關系的研究理論和方法稱之為相關分析。
變量之間的相關關系主要有線性相關和非線性相關、正相關和負相關等。如果變量之間的關系近似的表現(xiàn)為一條直線,則稱之為線性相關。在線性相關中,如果兩個變量的變化關系相同,當一個變量增大或減小時。另一個變量的數(shù)值也隨著增大或減小,則稱之為正相關。如果變化關系相反,稱之為負相關。
(三)推理分析
在市場調(diào)研中,通常很少做普查,更多地是進行抽樣調(diào)查。這樣,必須除了對樣本數(shù)據(jù)的特征進行描述之外,還需要根據(jù)樣本的特征對總體作出推斷,這就是推理分析。推理分析主要包括參數(shù)估計和假設檢驗。
參數(shù)估計是根據(jù)樣本的情況來枯計總體的情況。而假設檢驗是先假設總體的情況,然后以一個隨機樣本的統(tǒng)計值來檢驗這個假設是否正確,二者在邏輯上略有不同。