一些所謂的普查信息實際上是通過抽樣獲得的。計算機輔助統計程序使得對選定樣本進行詢問而獲得有關總體有效特征的有用信息成為可能,抽樣成本只是詢問每個人所花費成本的很小一部分。
對某事物進行抽樣就是調查該事物的很小一部分,通常的目的是為了判斷整體的屬性或質量。在統計學中,具有一個或多個特定屬性的無素集合叫做總體,樣本是總體的一個部分。因為很多我們感興趣的總體太大了,不能直接進行調研,因此抽樣統計技術用以從大總體中抽取樣本。
樣本除非是隨機選取的,否則,從調研中所獲得的結果可能在某些方面存在偏差。出于這個原因,設計了隨機抽樣的方法。比如,一個隨機樣本可以通過擲色子選出,更普遍的做法是,對于可以選擇樣本的名單,實際的技術是應用計算機產生隨機數表,將該名單進行編號,同時計算機以表中每一項具有同等概率的抽取方式從表中提取一串隨機數。
假設正在進行一項市場調研,按照上述方法從總體中選出一個樣本,對組成樣本的個體部分進行訪問。比如詢問一個個體對洗衣粉品牌的選擇,全部個體答案的算術平均值顯示了偏好于某一個品牌或其他品牌的比例。任何被問到該問題的統計總體都會有一個平均應答。
總體中的個體應答就在這個平均值的左右波動,應答的波動的通過一外叫總體方差的基本描述反映出來。算術平均值隨樣本的不同而波動,但其圍繞平均應答上下波動。此外,樣本量相對總體越大,從樣本得出的結論就越精確。