準確預測客戶的購買行為,對企業的重要性不言而喻,然而這點卻很難做到。企業往往是根據客戶過去發生過的購買行為,運用相關軟件,來預測某個客戶會在某個時間購買某個產品的可能性。按理說,在擁有大量數據的基礎上,預測結果應該與實際結果相差不大,但現實情況恰恰相反。作者研究了兩家大型企業的數千名客戶的購買模式,結果表明,它們預測客戶購買行為的準確率僅有60%。準確率為什么會這樣低?作者認為,原因不在于記錄了客戶購買信息的CRM系統本身,或是這些信息不具備預測作用,而在于多數企業用于解讀數據的數學方法存在局限性。
企業在預測客戶行為時,最常用的方法包括兩個步驟:第一步是估算某個客戶選購某個特定產品的概率,第二步是估算某個客戶在某個特定時間進行購買的概率。具體方法是對大量相關客戶數據進行回歸分析,得出計算概率等式中各變量的權重,然后再用此等式計算概率。企業將兩個步驟中算出的概率相乘后,就可以得出每個客戶未來購買行為的聯合概率。據此還可以建立一個概率方塊,了解更多有關客戶行為的信息。
這種方法綜合了產品選擇概率與購買時機概率,而且,許多行業的客戶樣本規模龐大,客戶數據也相當充足。那么,為什么得出的預測數字還這么不可靠呢?部分原因在于,將產品選擇概率與購買時機概率相乘這種做法,完全忽視了這兩個概率之間的互相依存關系,從而導致錯誤的預測,不過,公司可以通過統計修正來解決回歸分析中這一偏差,這并不是傳統方法的主要問題所在。
真正的問題在于這兩種概率預測都采用同一個樣本群體的數據,而這會導致抽樣誤差。傳統的概率估計方法之所以極易出現抽樣誤差,原因就在于,所有回歸分析都存在一個隱含假設,即由樣本群體得出的變量的權重代表了整個總體。但是,這種假設在實際中幾乎無法成立。
那么,怎樣才能消除概率估計中的抽樣誤差呢?答案在于一個名為貝葉斯估計的數學統計方法。貝葉斯估計法不是像回歸分析那樣計算出概率等式中每個變量的權重,而是先確定一個權重范圍。然后,通過一連串迭代計算,確定相關變量最有可能占的權重。這種計算具有更大的預測作用,因為它再現了樣本實際發生過的行為。作者利用丹尼爾•麥克法登的開創性成果,開發了一個名為似然函數的多變量公式。通過這個公式,我們可以準確計算出客戶總體在面對兩種以上產品時的購買概率和時機概率。要進行估計和使用作者開發的似然函數,需要有特殊的軟件,如Gauss或MATLAB。
作者分別在一家大型B2B高科技企業和一家B2C金融服務企業應用了這一新方法,并與傳統預測方法得出的結果進行了比較。結果表明,利用新方法,B2B企業的預測能力提高了54%,B2C企業提高了近33%。在這一過程中,一個重要發現是,營銷過度和營銷不足同樣會降低企業的收入。作者由此做出的推斷是,如果企業將傳播力度降到合適的水平,不僅可以節省成本,還可以提高單位客戶收入。為了驗證這一點,作者開展了一項實地研究,結果顯示,作者的新模型不僅能夠幫助企業避免在沒有購買意愿的客戶身上亂花錢,還能幫助挽回因傳統營銷戰略而正在失去的銷售收入。