我們每個人都聽說過這樣的老生常談:這世上有謊言、該死的謊言,還有統計數據。但是,當我耐著性子聽完一大堆亂七八糟的高管層分析報告之后,卻忍不住要拿這句話惡搞一下:這世上有說謊者、該死的說謊者,還有統計學家。
我們歡迎以分析為依據的洞見和決策日益大行其道,但我們并不歡迎人們以虛偽和欺騙的方式提交大量的統計數據。在企業監督的最高層,這些分析已經被過度操縱了,對此我感到既震驚又失望。唯一一件比這更令人吃驚,同時也更令人失望的事,就是居然有那么多的高管不愿或無法就他們看到的分析提出一些簡單的問題。
例如,一家金融服務公司呼叫中心的分析報告顯示,客戶滿意度數據出現一個接一個的負高峰,等待時間和“問題解決”時間顯著增加。因此,提交分析報告的高管當然要為自己的團隊爭取更多的資金和培訓。其中暗含的威脅不言而喻:公司快速響應服務的好名聲可能會受損。
后來,三個簡單而具有針對性的問題揭穿了這位高管在分析上耍的小花招。她在報告中提到客服趨勢令人不安,但這在很大程度上是因為某項政策調整影響了公司大約20%剛剛退休的客戶。由于涉及到他們的年齡和可能的稅務影響,而且批準程序需要另一個部門的協調配合,因此客服與他們之間的通話時間常常會延長到35 – 45分鐘以上。
而高管層的一項決策更是令情況雪上加霜(同時也解釋了為何那位報告者沒有對數據進行詳盡的分析):他們沒有將這些呼叫統一轉接給一個接受過專門培訓的團隊,而是規定任何客服代表都有權處理客戶質詢,結果造成了更多的延誤,令整個部門的績效越來越低。
從技術的角度來說,報告者提交的每個數據都是準確無誤的。但她以某種方式對它們進行匯總,為自己的部門制造出一種資源不足的假象。分析刻意隱瞞了某個離群值,而正是這一因素在統計上令這些數據看起來格外糟糕。
更可惡的是,一次簡單的排隊論模擬表明,如果呼叫中心針對那20%的特殊客戶群體稍微調整一下自己的管理方式,那么呼叫中心的整體績效數據幾乎不會受到什么影響。因此,問題的真正根源不在于系統投資不足,而是管理不當。
我發現,有越來越多老謀深算的統計高手醉心于鼓吹分析——他們通過精心編排數據來影響并贏得辯論,而不是為了發現潛在的動態并形成洞見。這種現象尤其令人不安,因為雖然分析(從最嚴格的技術意義上說)對形勢進行了精確的描繪,但同時它也妨礙人們提出有益的質疑。
我始終認為,分析報告和報告者應標出離群值,說明如何界定和處理它們,而且最重要的是,如果離群值不存在,分析結果會是怎樣的。如果你在了解分析數據時,能將離群值的重要性等同于匯總數據和平均值,那么你會為自己的發現而吃驚的。
不用說,在這方面我最喜歡的一個例子當然是來自哈佛大學(Harvard)。很少有人意識到,哈佛輟學生的平均凈資產實際上大大超過了畢業生。
其實原因很簡單。哈佛畢業生的人數要比輟學生多得多。但哈佛輟學生的隊伍中包括比爾·蓋茨(Bill Gates)、馬克·扎克伯格(Mark Zuckerberg),以及寶麗來(Polaroid)創始人埃德溫·蘭德(Edwin Land)這樣的人。如果將通貨膨脹因素計算在內,他們的凈資產總額可能高達1,000億美元。用這筆巨額財富做分子,用人數較少的“輟學生”做分母,二者相除后,你就會制造出一個精確的統計學假象:哈佛輟學生普遍比取得學位的畢業生富有得多。
當然,這很荒唐。但不幸的是,這并不比你從一大堆呈交給董事會的分析統計報告中所得出的結論更荒唐。我發現,同離群值相關的方向性錯誤和管理不善正是許多組織最令人苦惱的通病,即使是精于統計的組織也不能幸免。
要始終要求引入離群值,無論何時,都要讓分析師展示排除離群值之后的數據狀態。當然,還有一些同樣重要的方法,也可以讓匯總分析發揮更大的作用,但你首先要引入離群值。因為對離群值處理不當的分析會成為“大騙子”。
你是否曾成功地將離群值隱藏在匯總分析中,從而為自己爭取到更多的預算?你是否發現某位同事或客戶在統計時對離群值做了手腳?
.