將定量調(diào)查或者其他消費(fèi)者數(shù)據(jù)進(jìn)行聚類分析,再通過交叉分析描述細(xì)分市場輪廓是我們常用的方法。 聚類分析可以作為其他多元統(tǒng)計(jì)分析的預(yù)備過程,先聚類,然后再利用判別分析進(jìn)一步研究各個(gè)群體之間的差異。先通過聚類分析達(dá)到簡化數(shù)據(jù)的目的,將眾多的個(gè)體先聚集成比較好處理的幾個(gè)類別或子集,然后再進(jìn)行后續(xù)的多元分析。它也可以用于抽樣設(shè)計(jì)中的分層抽樣。
對一個(gè)數(shù)據(jù),既可以對變量(指標(biāo))進(jìn)行分類,也可以對觀測值來分類。分類的時(shí)候,不一定要事先假定有多少類,也可以完全根據(jù)數(shù)據(jù)自身的規(guī)律來分類。一般將變量的聚類分析稱為R型聚類,而對觀測值聚類稱為Q型聚類。
聚類分析中,比較重要的概念涉及到對兩個(gè)距離概念的認(rèn)識。搞清楚這兩個(gè)距離概念對于聚類分析本身具有很大的幫助。按照遠(yuǎn)近程度來聚類是聚類分析法的要義,那么這個(gè)遠(yuǎn)近究竟指什么呢?一指點(diǎn)與點(diǎn)之間的距離,二是類和類之間的距離。點(diǎn)間距離本身有多個(gè)定義方式也即多種運(yùn)算方法。因此,你只要選擇一種算法即可。由一個(gè)點(diǎn)組成的類是最基本的類;如果每一類都由一個(gè)點(diǎn)組成,那么點(diǎn)間距離就是類間距離。但是如果一個(gè)類包含不止一個(gè)點(diǎn),那么就需要確定類間距離。類間距離是基于點(diǎn)間距離定義的。如兩類之間最近點(diǎn)之間的距離可以作為兩類間距離,也可以選用最遠(yuǎn)點(diǎn)的距離,還可以選擇各類之間的中心距離。