定義:
分層抽樣法(stratified sampling),也叫類型抽樣法。就是將總體單位按其屬性特征分成若干類型或層,然后在類型或層中隨機抽取樣本單位。分層抽樣的特點是:由于通過劃類分層,增大了各類型中單位間的共同性,容易抽出具有代表性的調查樣本。該方法適用于總體情況復雜,各單位之間差異較大,單位較多的情況。
分層抽樣的具體程序:
把總體各單位分成兩個或兩個以上的相互獨立的完全的組(如男性和女性),從兩個或兩個以上的組中進行簡單隨機抽樣,樣本相互獨立。總體各單位按主要標志加以分組,分組的標志與關心的總體特征相關。例如,正在進行有關啤酒品牌知名度方面的調查,初步判別,在啤酒方面男性的知識與和女性的不同,那么性別應是劃分層次的適當標準。如果不以這種方式進行分層抽樣,分層抽樣就得不到什么效果,花再多時間、精力和物資也是白費。
分層抽樣與簡單隨機抽樣相比,往往選擇分層抽樣,因為它有顯著的潛在統計效果。也就是說,如果從相同的總體中抽取兩個樣本,一個是分層樣本,另一個是簡單隨機抽樣樣本,那么相對來說,分層樣本的誤差更小些。另一方面,如果目標是獲得一個確定的抽樣誤差水平,那么更小的分層樣本將達到這一目標。
分層抽樣又稱分類抽樣或類型抽樣。將總體劃分為若干個同質層,再在各層內隨機抽樣或機械抽樣,分層抽樣的特點是將科學分組法與抽樣法結合在一起,分組減小了各抽樣層變異性的影響,抽樣保證了所抽取的樣本具有足夠的代表性。分層抽樣根據在同質層內抽樣方式不同,又可分為一般分層抽樣和分層比例抽樣,一般分層抽樣是根據樣品變異性大小來確定各層的樣本容量,變異性大的層多抽樣,變異性小的層少抽樣,在事先并不知道樣品變異性大小的情況下,通常多采用分層比例抽樣。
樣本數:各層樣本數的確定方法有3種。
①分層定比。即各層樣本數與該層總體數的比值相等。例如,樣本大小n=50,總體N=500,則n/N=0.1 即為樣本比例,每層均按這個比例確定該層樣本數。
②奈曼法。即各層應抽樣本數與該層總體數及其標準差的積成正比。
③非比例分配法。當某個層次包含的個案數在總體中所占比例太小時,為使該層的特征在樣本中得到足夠的反映,可人為地適當增加該層樣本數在總體樣本中的比例。但這樣做會增加推論的復雜性。
步驟:
在調查實踐中,為提高分層樣本的精確度實際上要付出一些代價。通常,現實正確的分層抽樣一般有三個步驟:
首先,辯明突出的(重要的)人口統計特征和分類特征,這些特征與所研究的行為相關。例如,研究某種產品的消費率時,按常理認為男性和女性有不同的平均消費比率。為了把性別作為有意義的分層標志,調查者肯定能夠拿出資料證明男性與女性的消費水平明顯不同。用這種方式可識別出各種不同的顯著特征。調查表明,一般來說,識別出 6 個重要的顯著特征后,再增加顯著特征的辨別對于提高樣本代表性就沒有多大幫助了。
第二,確定在每個層次上總體的比例(如性別已被確定為一個顯著的特征,那么總體中男性占多少比例,女性占多少比例呢?)。利用這個比例,可計算出樣本中每組(層)應調查的人數。
最后,調查者必須從每層中抽取獨立簡單隨機樣本。
應用:總體中賴以進行分層的變量為分層變量,理想的分層變量是調查中要加以測量的變量或與其高度相關的變量。分層的原則是增加層內的同質性和層間的異質性。常見的分層變量有性別、年齡、教育、職業等。分層隨機抽樣在實際抽樣調查中廣泛使用,在同樣樣本容量的情況下,它比純隨機抽樣的精度高,此外管理方便,費用少,效度高。
分層抽樣是將總體按照一定標志分成若干層,分別從各層中抽檢一定數量樣本,最后匯總推算所需的總體估計量的一種統計抽樣技術。在變量抽樣稅務稽查中合理地運用分層抽樣法,可以提高抽樣的精確度,減少需要抽查的樣本。在運用分層抽樣法時,需要對總體進行重新組織整理,計算工作復雜。因此,只有當被查總體中大部分項目(的金額)分布均勻,少數項目屬于高金額或低金額之類的異常項目時,運用分層抽樣法才有意義。
運用分層抽樣稅務稽查方法時,各層樣本抽查方法是相對獨立的,可以是隨機數表法,也可以是系統選樣法。分層抽樣法研究的重點,一是如何計算總的樣本規模和如何將樣本在各層進行分配;二是如何將各層檢查結果匯總推算總體估計量。
1.樣本規模的確定及在各層間的分配
在分層抽樣法中,樣本規模仍然按照總體計算,然后再把它分配到各層。分層抽樣法中樣本規模的確定,需要首先了解各層子總體容量及其標準差。
2.各層檢查結果的匯總
決定了各層樣本規模之后,稅務稽查人員即可按照計劃的抽樣組織方式和稅務稽查檢查大綱開始實施抽樣稅務稽查。經過對選取樣本的檢查計算,可以得到各層平均值(或平均差錯額)和實際樣本標準差等項資料,在此基礎上,稅務稽查人員需要將它們匯總,形成對總體的點估計和區間估計。