結構方程式模型假定在一組潛在變量中存在因果關系,這些潛在變量可以分別用一組可觀測的變量表示。假設的模型通常包括某個基本線性回歸模型和很多觀測變量,而這個基本的線性回歸模型應該是一組潛在變量的結構關系模型。這一組潛在變量分別是那些觀測變量中的某幾個的線性組合。在技術上,通過驗證觀測變量之間的協方差,可以估計出這個基本線性回歸模型的系數值,從而在統計上檢驗所假設的模型對所研究的過程是否合適,也就是檢驗觀測變量的方差協方差矩陣與模型擬合后的引申方差協方差矩陣的擬和程度,如果證實所假設的模型合適,就可以得出結論:我們所假設的潛在變量之間的關系是合理的。
結構方程式的基本概念
一般采用路徑圖(pathdiagram)的形式表示結構方程式模型,這是最簡單、最直觀的描述模型的方法,研究人員可以借助路徑圖直接和明了地將變量之間的關系以圖形的方式表現出來。流行的AMOS軟件可以直接利用路徑圖的模型設定進行分析,并將分析結果直接標識在圖中。習慣上,在路徑圖中潛在變量用橢圓型表示,觀測變量用矩形表示;如果兩個潛在變量之間有相互關系,用雙箭頭聯結這兩個潛在變量;如果兩個潛在變量是因果關系,則用單箭頭聯結這兩個潛在變量,箭頭指向結果變量。如果一個潛在變量可由若干觀測變量表示,這個潛在變量被看作觀測變量的因子(factor),用單箭頭聯結這個潛在變量與觀測變量,箭頭指向觀測變量,表示潛在變量直接影響了觀測變量的值。在因果關系模型中,影響其它變量而其自身的變化又假定是由因果關系模型外部的其它因素所決定的變量稱之為外生變量(exogenousvariable),由外生變量和其它變量解釋的變量稱為內生變量(endogenousvariable)。
在SEM中,所假設的潛在變量之間的關系模型,是一種關于傳播理論的臨時的基本模型,我們稱之為結構模型(structuralmodel);而那些在統計顯著的觀測變量與測量的潛在變量之間的線性關系模型,稱之為度量模型(measurementmodel)。結構模型實際上是某種意義上的回歸模型,要做的工作是驗證這個模型是否合適,也就變成了估計潛在變量之間相應的回歸系數(路徑系數)的值,而度量模型便是估計這些回歸系數的依據。
結構方程式模型的評價
結構方程是模型的目標就是再生一個觀測變量的引申方差協方差矩陣Σ,使之與樣本方差協方差矩陣S盡可能地接近,同時評價模型對數據的擬合程度。如果引申的方差協方差矩陣Σ與樣本方差協方差矩陣S之間的差別非常小,也就是殘差矩陣各個元素接近于0,就可以認為模型擬合了數據。
關于模型的總體擬合程度有許多測量指標和標準,對模型的評價,涉及到模型對數據的總的擬合程度,AMOS軟件提供了多種判定擬合優度的量。用戶可以在模型上面直接給出擬合統計量,顯示統計量結果。
①卡方統計量(X2)
最常用的擬合指標是擬合優度的卡方檢驗(X2-goodness-of-fittest)統計量。在最大似然估計ML、一般最小二乘法GLS和廣義加權最小二乘法ADF下,卡方值X2等于樣本量減1乘以擬合函數的最小值。
在觀測變量服從多元正態分布且模型設定正確的話,如果分析方差協方差矩陣,則乘積服從卡方分布(或漸進服從卡方平方分布)。這里需注意,它的檢驗正好與傳統的統計研究相反,我們希望得到的不顯著的卡方值,大的值對應差的擬合,小的值對應于好的擬合。事實上,這里的卡方檢驗是“擬合劣度(badness-of-fit)”檢驗,很小的卡方值說明模型擬合很好。但是,卡方檢驗統計量與樣本量的大小密切相關,當樣本量越大,卡方值也越大,拒絕一個模型的概率就會隨著樣本量的增加而增加,也就是說,最好把卡方檢驗看成是度量擬合優度的量,而不是把它當作檢驗統計量。為減小樣本量對擬合檢驗的影響,習慣上采用卡方值與自由度之比,如果比值小于2,則可以認為模型擬合較好。
②擬合優度指數(GFI)
擬合優度指數(goodness-of-fitindex)GFI度量了觀測變量的方差協方差矩陣S在多大程度上被模型引申的方差協方差矩陣所預測,如果Σ=S,GFI=1,意味著模型完美擬合。
③修正的擬合優度指數(AGFI)
修正的擬合優度指數(adjustedgoodness-of-fitindex)AGFI利用模型中參數估計的總數與模型估計的獨立參數—自由度來修正,估計的參數相對于數據點越小,AGFI越接近GFI。 以上兩個指數都在0和1之間,較大的數對應于較好的擬合,一般大于0.9時,則認為模型擬合觀測數據。與X2不同的是,GFI和AGFI不是樣本容量的函數,因為它們并不是統計量,只是測量了樣本方差中估計方差所占的加權比例,因此不能用來對模型的擬合優度進行統計檢驗。
④平方平均殘差的平方根(RMR)
平方平均殘差的平方根(rootmeansquareresidual)RMR度量了擬合殘差的一種平均值,說明樣本方差和協方差在假定模型正確的情況下的估計值的差異,RMR越小,說明擬合較好,如果RMR等于0,表明模型完美擬合。
⑤本特勒-波內特規范指數(NFI)
本特勒-波內特規范指數(Bentler-Bonettnormedfixindex)是從設定模型的擬合(或是擬合函數,或用卡方值)與獨立模型(independencemodel)的擬合之間的比較。獨立模型是指假設所有變量之間沒有相關關系,也就是說,模型中所有的路徑系數和外生變量之間都固定為0,只估計方差。用來比較設定模型與獨立模型在擬合上的改善程度。
⑥近似誤差的平方根(RMSEA)
近似誤差的平方根(rootmeansquareerrorofapproximation)。習慣上,RMSEA取值小于0.05,表明相對于自由度模型擬合了數據;另外,建議在90%的置信度下,如果RMSEA取值小于0.08,則可認為近似誤差是合理的,或者說在置信水平0.01下不能拒絕這一假設。RMSEA評價指標近年來越來越受到重視。
⑦信息標準指數(informationcriteriaindex)
信息標準測量是為了作不同模型的比較,信息標準測量的值越小說明含獨立估計參數越少的模型擬合越好,也就是說簡約模型(parsimoniousmodel)越好。一般在設定的理論模型中,使用同一數據,按照理論減少模型中某個或某幾個自由參數,比較某種信息標準指數的差異,選擇指數最小的模型,也就是簡約模型。
需要強調的是,雖然這里給出了許多評價模型擬合指數,但是沒有唯一的模型擬合標準指數是正確的。所以,在模型擬合過程中,要盡量納入各種指標,并盡可能地了解各種指數的內在含義,這可能完全需要研究者來判斷。
實際應用中,研究者還需要對度量模型和結構模型的可靠性和有效性進行必要的檢驗,一般可根據經典的檢驗理論,采用復相關系數和總決定系數說明單個觀測變量或全部觀測變量作為潛在變量的度量指標的可靠程度,以及單個或全部外生潛在變量對內生潛在變量的方差效應。
此外,模型及擬合的標準并不完全是統計問題,即使一個模型擬合了數據,也不意味著這個模型是“正確的”或是“最好的”。因為可能存在著等價模型(equivalentmodels),競爭模型(competingmodels)。如果簡單模型的擬合與復雜模型的擬合一樣好,就應該接受簡單模型,因為,我們的目標就是建立簡約模型,也就是說模型中的參數越少越好。因此,結構方程式模型的模型策略簡單就是美,最重要的是所有估計參數應該有實際意義,能夠得到合理的解釋,研究者始終應該將結構方程式模型建立在有說服力的理論假設上。