大數(shù)據(jù)是2012的時髦詞匯,正受到越來越多人的關(guān)注和談?wù)?。大?shù)據(jù)之所以受到人們的關(guān)注和談?wù)摚且驗殡[藏在大數(shù)據(jù)后面超千億美元的市場機會。
大數(shù)據(jù)時代,數(shù)據(jù)挖掘是最關(guān)鍵的工作。以下內(nèi)容供個人學(xué)習(xí)用,感興趣的朋友可以看一下。
智庫百科是這樣描述數(shù)據(jù)挖掘的“數(shù)據(jù)挖掘又稱數(shù)據(jù)庫中的知識發(fā)現(xiàn),是目前人工智能和數(shù)據(jù)庫領(lǐng)域研究的熱點問題,所謂數(shù)據(jù)挖掘是指從數(shù)據(jù)庫的大量數(shù)據(jù)中揭示出隱含的、先前未知的并有潛在價值的信息的非平凡過程。數(shù)據(jù)挖掘是一種決策支持過程,它主要基于人工智能、機器學(xué)習(xí)、模式識別、統(tǒng)計學(xué)、數(shù)據(jù)庫、可視化技術(shù)等,高度自動化地分析企業(yè)的數(shù)據(jù),做出歸納性的推理,從中挖掘出潛在的模式,幫助決策者調(diào)整市場策略,減少風(fēng)險,做出正確的決策。
數(shù)據(jù)挖掘的定義
技術(shù)上的定義及含義
數(shù)據(jù)挖掘(Data Mining)就是從大量的、不完全的、有噪聲的、模糊的、隨機的實際應(yīng)用數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。這個定義包括好幾層含義:數(shù)據(jù)源必須是真實的、大量的、含噪聲的;發(fā)現(xiàn)的是用戶感興趣的知識;發(fā)現(xiàn)的知識要可接受、可理解、可運用;并不要求發(fā)現(xiàn)放之四海皆準(zhǔn)的知識,僅支持特定的發(fā)現(xiàn)問題。
與數(shù)據(jù)挖掘相近的同義詞有數(shù)據(jù)融合、人工智能、商務(wù)智能、模式識別、機器學(xué)習(xí)、知識發(fā)現(xiàn)、數(shù)據(jù)分析和決策支持等。
----何為知識從廣義上理解,數(shù)據(jù)、信息也是知識的表現(xiàn)形式,但是人們更把概念、規(guī)則、模式、規(guī)律和約束等看作知識。人們把數(shù)據(jù)看作是形成知識的源泉,好像從礦石中采礦或淘金一樣。原始數(shù)據(jù)可以是結(jié)構(gòu)化的,如關(guān)系數(shù)據(jù)庫中的數(shù)據(jù);也可以是半結(jié)構(gòu)化的,如文本、圖形和圖像數(shù)據(jù);甚至是分布在網(wǎng)絡(luò)上的異構(gòu)型數(shù)據(jù)。發(fā)現(xiàn)知識的方法可以是數(shù)學(xué)的,也可以是非數(shù)學(xué)的;可以是演繹的,也可以是歸納的。發(fā)現(xiàn)的知識可以被用于信息管理,查詢優(yōu)化,決策支持和過程控制等,還可以用于數(shù)據(jù)自身的維護(hù)。因此,數(shù)據(jù)挖掘是一門交叉學(xué)科,它把人們對數(shù)據(jù)的應(yīng)用從低層次的簡單查詢,提升到從數(shù)據(jù)中挖掘知識,提供決策支持。在這種需求牽引下,匯聚了不同領(lǐng)域的研究者,尤其是數(shù)據(jù)庫技術(shù)、人工智能技術(shù)、數(shù)理統(tǒng)計、可視化技術(shù)、并行計算等方面的學(xué)者和工程技術(shù)人員,投身到數(shù)據(jù)挖掘這一新興的研究領(lǐng)域,形成新的技術(shù)熱點。
這里所說的知識發(fā)現(xiàn),不是要求發(fā)現(xiàn)放之四海而皆準(zhǔn)的真理,也不是要去發(fā)現(xiàn)嶄新的自然科學(xué)定理和純數(shù)學(xué)公式,更不是什么機器定理證明。實際上,所有發(fā)現(xiàn)的知識都是相對的,是有特定前提和約束條件,面向特定領(lǐng)域的,同時還要能夠易于被用戶理解。最好能用自然語言表達(dá)所發(fā)現(xiàn)的結(jié)果。
商業(yè)角度的定義
數(shù)據(jù)挖掘是一種新的商業(yè)信息處理技術(shù),其主要特點是對商業(yè)數(shù)據(jù)庫中的大量業(yè)務(wù)數(shù)據(jù)進(jìn)行抽取、轉(zhuǎn)換、分析和其他模型化處理,從中提取輔助商業(yè)決策的關(guān)鍵性數(shù)據(jù)。
簡而言之,數(shù)據(jù)挖掘其實是一類深層次的數(shù)據(jù)分析方法。數(shù)據(jù)分析本身已經(jīng)有很多年的歷史,只不過在過去數(shù)據(jù)收集和分析的目的是用于科學(xué)研究,另外,由于當(dāng)時計算能力的限制,對大數(shù)據(jù)量進(jìn)行分析的復(fù)雜數(shù)據(jù)分析方法受到很大限制?,F(xiàn)在,由于各行業(yè)業(yè)務(wù)自動化的實現(xiàn),商業(yè)領(lǐng)域產(chǎn)生了大量的業(yè)務(wù)數(shù)據(jù),這些數(shù)據(jù)不再是為了分析的目的而收集的,而是由于純機會的(Opportunistic)商業(yè)運作而產(chǎn)生。分析這些數(shù)據(jù)也不再是單純?yōu)榱搜芯康男枰?,更主要是為商業(yè)決策提供真正有價值的信息,進(jìn)而
獲得利潤。但所有企業(yè)面臨的一個共同問題是:企業(yè)數(shù)據(jù)量非常大,而其中真正有價值的信息卻很少,因此從大量的數(shù)據(jù)中經(jīng)過深層分析,獲得有利于商業(yè)運作、提高競爭力的信息,就像從礦石中淘金一樣,數(shù)據(jù)挖掘也因此而得名。
因此,數(shù)據(jù)挖掘可以描述為:按企業(yè)既定業(yè)務(wù)目標(biāo),對大量的企業(yè)數(shù)據(jù)進(jìn)行探索和分析,揭示隱藏的、未知的或驗證已知的規(guī)律性,并進(jìn)一步將其模型化的先進(jìn)有效的方法。
數(shù)據(jù)挖掘常用的方法
利用數(shù)據(jù)挖掘進(jìn)行數(shù)據(jù)分析常用的方法主要有分類、回歸分析、聚類、關(guān)聯(lián)規(guī)則、特征、變化和偏差分析、Web頁挖掘等, 它們分別從不同的角度對數(shù)據(jù)進(jìn)行挖掘。
?、俜诸悺7诸愂钦页鰯?shù)據(jù)庫中一組數(shù)據(jù)對象的共同特點并按照分類模式將其劃分為不同的類,其目的是通過分類模型,將數(shù)據(jù)庫中的數(shù)據(jù)項映射到某個給定的類別。它可以應(yīng)用到客戶的分類、客戶的屬性和特征分析、客戶滿意度分析、客戶的購買趨勢預(yù)測等,如一個汽車零售商將客戶按照對汽車的喜好劃分成不同的類,這樣營銷人員就可以將新型汽車的廣告手冊直接郵寄到有這種喜好的客戶手中,從而大大增加了商業(yè)機會。
?、诨貧w分析。回歸分析方法反映的是事務(wù)數(shù)據(jù)庫中屬性值在時間上的特征,產(chǎn)生一個將數(shù)據(jù)項映射到一個實值預(yù)測變量的函數(shù),發(fā)現(xiàn)變量或?qū)傩蚤g的依賴關(guān)系,其主要研究問題包括數(shù)據(jù)序列的趨勢特征、數(shù)據(jù)序列的預(yù)測以及數(shù)據(jù)間的相關(guān)關(guān)系等。它可以應(yīng)用到市場營銷的各個方面,如客戶尋求、保持和預(yù)防客戶流失活動、產(chǎn)品生命周期分析、銷售趨勢預(yù)測及有針對性的促銷活動等。
?、劬垲?。聚類分析是把一組數(shù)據(jù)按照相似性和差異性分為幾個類別,其目的是使得屬于同一類別的數(shù)據(jù)間的相似性盡可能大,不同類別中的數(shù)據(jù)間的相似性盡可能小。它可以應(yīng)用到客戶群體的分類、客戶背景分析、客戶購買趨勢預(yù)測、市場的細(xì)分等。
④關(guān)聯(lián)規(guī)則。關(guān)聯(lián)規(guī)則是描述數(shù)據(jù)庫中數(shù)據(jù)項之間所存在的關(guān)系的規(guī)則,即根據(jù)一個事務(wù)中某些項的出現(xiàn)可導(dǎo)出另一些項在同一事務(wù)中也出現(xiàn),即隱藏在數(shù)據(jù)間的關(guān)聯(lián)或相互關(guān)系。在客戶關(guān)系管理中,通過對企業(yè)的客戶數(shù)據(jù)庫里的大量數(shù)據(jù)進(jìn)行挖掘,可以從大量的記錄中發(fā)現(xiàn)有趣的關(guān)聯(lián)關(guān)系,找出影響市場營銷效果的關(guān)鍵因素,為產(chǎn)品定位、定價與定制客戶群,客戶尋求、細(xì)分與保持,市場營銷與推銷,營銷風(fēng)險評估和詐騙預(yù)測等決策支持提供參考依據(jù)。
?、萏卣?。特征分析是從數(shù)據(jù)庫中的一組數(shù)據(jù)中提取出關(guān)于這些數(shù)據(jù)的特征式,這些特征式表達(dá)了該數(shù)據(jù)集的總體特征。如營銷人員通過對客戶流失因素的特征提取,可以得到導(dǎo)致客戶流失的一系列原因和主要特征,利用這些特征可以有效地預(yù)防客戶的流失。
?、拮兓推罘治?。偏差包括很大一類潛在有趣的知識,如分類中的反常實例,模式的例外,觀察結(jié)果對期望的偏差等,其目的是尋找觀察結(jié)果與參照量之間有意義的差別。在企業(yè)危機管理及其預(yù)警中,管理者更感興趣的是那些意外規(guī)則。意外規(guī)則的挖掘可以應(yīng)用到各種異常信息的發(fā)現(xiàn)、分析、識別、評價和預(yù)警等方面。
?、遅eb頁挖掘。隨著Internet的迅速發(fā)展及Web 的全球普及, 使得Web上的信息量無比豐富,通過對Web的挖掘,可以利用Web 的海量數(shù)據(jù)進(jìn)行分析,收集政治、經(jīng)濟、政策、科技、金融、各種市場、競爭對手、供求信息、客戶等有關(guān)的信息,集中精力分析和處理那些對企業(yè)有重大或潛在重大影響的外部環(huán)境信息和內(nèi)部經(jīng)營信息,并根據(jù)分析結(jié)果找出企業(yè)管理過程中出現(xiàn)的各種問題和可能引起危機的先兆,對這些信息進(jìn)行分析和處理,以便識別、分析、評價和管理危機。
數(shù)據(jù)挖掘的功能
數(shù)據(jù)挖掘通過預(yù)測未來趨勢及行為,做出前攝的、基于知識的決策。數(shù)據(jù)挖掘的目標(biāo)是從數(shù)據(jù)庫中發(fā)現(xiàn)隱含的、有意義的知識,主要有以下五類功能。
1、自動預(yù)測趨勢和行為
數(shù)據(jù)挖掘自動在大型數(shù)據(jù)庫中尋找預(yù)測性信息,以往需要進(jìn)行大量手工分析的問題如今可以迅速直接由數(shù)據(jù)本身得出結(jié)論。一個典型的例子是市場預(yù)測問題,數(shù)據(jù)挖掘使用過去有關(guān)促銷的數(shù)據(jù)來尋找未來投資中回報最大的用戶,其它可預(yù)測的問題包括預(yù)報破產(chǎn)以及認(rèn)定對指定事件最可能作出反應(yīng)的群體。
2、關(guān)聯(lián)分析
數(shù)據(jù)關(guān)聯(lián)是數(shù)據(jù)庫中存在的一類重要的可被發(fā)現(xiàn)的知識。若兩個或多個變量的取值之間存在某種規(guī)律性,就稱為關(guān)聯(lián)。關(guān)聯(lián)可分為簡單關(guān)聯(lián)、時序關(guān)聯(lián)、因果關(guān)聯(lián)。關(guān)聯(lián)分析的目的是找出數(shù)據(jù)庫中隱藏的關(guān)聯(lián)網(wǎng)。有時并不知道數(shù)據(jù)庫中數(shù)據(jù)的關(guān)聯(lián)函數(shù),即使知道也是不確定的,因此關(guān)聯(lián)分析生成的規(guī)則帶有可信度。
3、聚類
數(shù)據(jù)庫中的記錄可被化分為一系列有意義的子集,即聚類。聚類增強了人們對客觀現(xiàn)實的認(rèn)識,是概念描述和偏差分析的先決條件。聚類技術(shù)主要包括傳統(tǒng)的模式識別方法和數(shù)學(xué)分類學(xué)。80年代初,Mchalski提出了概念聚類技術(shù)牞其要點是,在劃分對象時不僅考慮對象之間的距離,還要求劃分出的類具有某種內(nèi)涵描述,從而避免了傳統(tǒng)技術(shù)的某些片面性。
4、概念描述
概念描述就是對某類對象的內(nèi)涵進(jìn)行描述,并概括這類對象的有關(guān)特征。概念描述分為特征性描述和區(qū)別性描述,前者描述某類對象的共同特征,后者描述不同類對象之間的區(qū)別。生成一個類的特征性描述只涉及該類對象中所有對象的共性。生成區(qū)別性描述的方法很多,如決策樹方法、遺傳算法等。
5、偏差檢測
數(shù)據(jù)庫中的數(shù)據(jù)常有一些異常記錄,從數(shù)據(jù)庫中檢測這些偏差很有意義。偏差包括很多潛在的知識,如分類中的反常實例、不滿足規(guī)則的特例、觀測結(jié)果與模型預(yù)測值的偏差、量值隨時間的變化等。偏差檢測的基本方法是,尋找觀測結(jié)果與參照值之間有意義的差別。 數(shù)據(jù)挖掘與傳統(tǒng)分析方法的區(qū)別
數(shù)據(jù)挖掘與傳統(tǒng)的數(shù)據(jù)分析(如查詢、報表、聯(lián)機應(yīng)用分析)的本質(zhì)區(qū)別是數(shù)據(jù)挖掘是在沒有明確假設(shè)的前提下去挖掘信息、發(fā)現(xiàn)知識.數(shù)據(jù)挖掘所得到的信息應(yīng)具有先未知,有效和可實用三個特征.
先前未知的信息是指該信息是預(yù)先未曾預(yù)料到的,既數(shù)據(jù)挖掘是要發(fā)現(xiàn)那些不能靠直覺發(fā)現(xiàn)的信息或知識,甚至是違背直覺的信息或知識,挖掘出的信息越是出乎意料,就可能越有價值.在商業(yè)應(yīng)用中最典型的例子就是一家連鎖店通過數(shù)據(jù)挖掘發(fā)現(xiàn)了小孩尿布和啤酒之間有著驚人的聯(lián)系。
數(shù)據(jù)挖掘應(yīng)用
1、數(shù)據(jù)挖掘解決的典型商業(yè)問題
需要強調(diào)的是,數(shù)據(jù)挖掘技術(shù)從一開始就是面向應(yīng)用的。目前,在很多領(lǐng)域,數(shù)據(jù)挖掘(data mining)都是一個很時髦的詞,尤其是在如銀行、電信、保險、交通、零售(如超級市場)等商業(yè)領(lǐng)域。數(shù)據(jù)挖掘所能解決的典型商業(yè)問題包括:數(shù)據(jù)庫營銷(Database Marketing)、客戶群體劃分(Customer Segmentation & Classification)、背景分析(Profile Analysis)、交叉銷售(Cross-selling)等市場分析行為,以及客戶流失性分析(Churn Analysis)、客戶信用記分(Credit Scoring)、欺詐發(fā)現(xiàn)(Fraud Detection)等等。
2、數(shù)據(jù)挖掘在市場營銷的應(yīng)用
數(shù)據(jù)挖掘技術(shù)在企業(yè)市場營銷中得到了比較普遍的應(yīng)用,它是以市場營銷學(xué)的市場細(xì)分原理為基礎(chǔ),其基本假定是“消費者過去的行為是其今后消費傾向的最好說明”。
通過收集、加工和處理涉及消費者消費行為的大量信息,確定特定消費群體或個體的興趣、消費習(xí)慣、消費傾向和消費需求,進(jìn)而推斷出相應(yīng)消費群體或個體下一步的消費行為,然后以此為基礎(chǔ),對所識別出來的消費群體進(jìn)行特定內(nèi)容的定向營銷,這與傳統(tǒng)的不區(qū)分消費者對象特征的大規(guī)模營銷手段相比,大大節(jié)省了營銷成本,提高了營銷效果,從而為企業(yè)帶來更多的利潤。
商業(yè)消費信息來自市場中的各種渠道。例如,每當(dāng)我們用信用卡消費時,商業(yè)企業(yè)就可以在信用卡結(jié)算過程收集商業(yè)消費信息,記錄下我們進(jìn)行消費的時間、地點、感興趣的商品或服務(wù)、愿意接收的價格水平和支付能力等數(shù)據(jù);當(dāng)我們在申辦信用卡、辦理汽車駕駛執(zhí)照、填寫商品保修單等其他需要填寫表格的場合時,我們的個人信息就存入了相應(yīng)的業(yè)務(wù)數(shù)據(jù)庫;企業(yè)除了自行收集相關(guān)業(yè)務(wù)信息之外,甚至可以從其他公司或機構(gòu)購買此類信息為自己所用。
這些來自各種渠道的數(shù)據(jù)信息被組合,應(yīng)用超級計算機、并行處理、神經(jīng)元網(wǎng)絡(luò)、模型化算法和其他信息處理技術(shù)手段進(jìn)行處理,從中得到商家用于向特定消費群體或個體進(jìn)行定向營銷的決策信息。這種數(shù)據(jù)信息是如何應(yīng)用的呢?舉一個簡單的例子,當(dāng)銀行通過對業(yè)務(wù)數(shù)據(jù)進(jìn)行挖掘后,發(fā)現(xiàn)一個銀行帳戶持有者突然要求申請雙人聯(lián)合帳戶時,并且確認(rèn)該消費者是第一次申請聯(lián)合帳戶,銀行會推斷該用戶可能要結(jié)婚了,它就會向該用戶定向推銷用于購買房屋、支付子女學(xué)費等長期投資業(yè)務(wù),銀行甚至可能將該信息賣給專營婚慶商品和服務(wù)的公司。數(shù)據(jù)挖掘構(gòu)筑競爭優(yōu)勢。
在市場經(jīng)濟比較發(fā)達(dá)的國家和地區(qū),許多公司都開始在原有信息系統(tǒng)的基礎(chǔ)上通過數(shù)據(jù)挖掘?qū)I(yè)務(wù)信息進(jìn)行深加工,以構(gòu)筑自己的競爭優(yōu)勢,擴大自己的營業(yè)額。美國運通公司(American Express)有一個用于記錄信用卡業(yè)務(wù)的數(shù)據(jù)庫,數(shù)據(jù)量達(dá)到54億字符,并仍在隨著業(yè)務(wù)進(jìn)展不斷更新。運通公司通過對這些數(shù)據(jù)進(jìn)行挖掘,制定了“關(guān)聯(lián)結(jié)算(Relation ship Billing)優(yōu)惠”的促銷策略,即如果一個顧客在一個商店用運通卡購買一套時裝,那么在同一個商店再買一雙鞋,就可以得到比較大的折扣,這樣既可以增加商店的銷售量,也可以增加運通卡在該商店的使用率。再如,居住在倫敦的持卡消費者如果最近剛剛乘英國航空公司的航班去過巴黎,那么他可能會得到一個周末前往紐約的機票打折優(yōu)惠卡。
基于數(shù)據(jù)挖掘的營銷,常常可以向消費者發(fā)出與其以前的消費行為相關(guān)的推銷材料??ǚ?Kraft)食品公司建立了一個擁有3000萬客戶資料的數(shù)據(jù)庫,數(shù)據(jù)庫是通過收集對公司發(fā)出的優(yōu)惠券等其他促銷手段作出積極反應(yīng)的客戶和銷售記錄而建立起來的,卡夫公司通過數(shù)據(jù)挖掘了解特定客戶的興趣和口味,并以此為基礎(chǔ)向他們發(fā)送特定產(chǎn)品的優(yōu)惠券,并為他們推薦符合客戶口味和健康狀況的卡夫產(chǎn)品食譜。美國的讀者文摘(Reader's Digest)出版公司運行著一個積累了40年的業(yè)務(wù)數(shù)據(jù)庫,其中容納有遍布全球的一億多個訂戶的資料,數(shù)據(jù)庫每天24小時連續(xù)運行,保證數(shù)據(jù)不斷得到實時的更新,正是基于對客戶資料數(shù)據(jù)庫進(jìn)行數(shù)據(jù)挖掘的優(yōu)勢,使讀者文摘出版公司能夠從通俗雜志擴展到專業(yè)雜志、書刊和聲像制品的出版和發(fā)行業(yè)務(wù),極大地擴展了自己的業(yè)務(wù)。
基于數(shù)據(jù)挖掘的營銷對我國當(dāng)前的市場競爭中也很具有啟發(fā)意義,我們經(jīng)常可以看到繁華商業(yè)街上一些廠商對來往行人不分對象地散發(fā)大量商品宣傳廣告,其結(jié)果是不需要的人隨手丟棄資料,而需要的人并不一定能夠得到。如果搞家電維修服務(wù)的公司向在商店中剛剛購買家電的消費者郵寄維修服務(wù)廣告,賣特效藥品的廠商向醫(yī)院特定門診就醫(yī)的病人郵寄廣告,肯定會比漫無目的的營銷效果要好得多。
數(shù)據(jù)挖掘在企業(yè)危機管理中的應(yīng)用
危機管理是管理領(lǐng)域新出現(xiàn)的一個熱點研究領(lǐng)域,它是以市場競爭中危機的出現(xiàn)為研究起點,分析企業(yè)危機產(chǎn)生的原因和過程,研究企業(yè)預(yù)防危機、應(yīng)付危機、解決危機的手段和策略,以增強企業(yè)的免疫力、應(yīng)變力和競爭力,使管理者能夠及時準(zhǔn)確地獲取所需要的信息,迅速捕捉到企業(yè)可能發(fā)生危機的一切可能事件和先兆,進(jìn)而采取有效的規(guī)避措施,在危機發(fā)生之前對其進(jìn)行控制,趨利避害,從而使企業(yè)能夠適應(yīng)迅速變化的市場環(huán)境,保持長久的競爭優(yōu)勢。但是由于危機產(chǎn)生的原因復(fù)雜,種類繁多,許多因素難以量化,而且危機管理中帶有大量不確定因素的半結(jié)構(gòu)化問題和非結(jié)構(gòu)化問題,很多因素由于沒有歷史數(shù)據(jù)和相應(yīng)的統(tǒng)計資料,很難進(jìn)行科學(xué)地計算和評估,因此需要應(yīng)用其它技術(shù)和方法來加強企業(yè)的危機管理工作。
隨著計算機技術(shù)、網(wǎng)絡(luò)技術(shù)、通訊技術(shù)、Internet技術(shù)的迅速發(fā)展和電子商務(wù)、辦公自動化、管理信息系統(tǒng)、Internet 的普及等,企業(yè)業(yè)務(wù)操作流程日益自動化,企業(yè)經(jīng)營過程中產(chǎn)生了大量的數(shù)據(jù),這些數(shù)據(jù)和由此產(chǎn)生的信息是企業(yè)的寶貴財富,它如實地記錄著企業(yè)經(jīng)營的本質(zhì)狀況。但是面對如此大量的數(shù)據(jù),傳統(tǒng)的數(shù)據(jù)分析方法,如數(shù)據(jù)檢索、統(tǒng)計分析等只能獲得數(shù)據(jù)的表層信息,不能獲得其內(nèi)在的、深層次的信息,管理者面臨著數(shù)據(jù)豐富而知識貧乏的困境。如何從這些數(shù)據(jù)中挖掘出對企業(yè)經(jīng)營決策有用的知識是非常重要的,數(shù)據(jù)挖掘便是為適應(yīng)這種需要應(yīng)運而生的。
數(shù)據(jù)挖掘是一種新的信息處理技術(shù),其主要特點是對企業(yè)數(shù)據(jù)庫中的大量業(yè)務(wù)數(shù)據(jù)進(jìn)行抽取、轉(zhuǎn)換、分析和其他模型化處理,從中提取輔助經(jīng)營決策的關(guān)鍵性數(shù)據(jù),它在企業(yè)危機管理中得到了比較普遍的應(yīng)用,具體可以應(yīng)用到以下幾個方面。
1.利用Web頁挖掘搜集外部環(huán)境信息
信息是危機管理的關(guān)鍵因素。在危機管理過程中,可以利用Web 頁挖掘技術(shù)對企業(yè)外部環(huán)境信息進(jìn)行收集、整理和分析,盡可能地收集政治、經(jīng)濟、政策、科技、金融、各種市場、競爭對手、供求信息、消費者等與企業(yè)發(fā)展有關(guān)的信息,集中精力分析處理那些對企業(yè)發(fā)展有重大或潛在重大影響的外部環(huán)境信息,抓住轉(zhuǎn)瞬即逝的市場機遇,獲得企業(yè)危機的先兆信息,采取有效措施規(guī)避危機,促使企業(yè)健康、持續(xù)地發(fā)展。
2.利用數(shù)據(jù)挖掘分析企業(yè)經(jīng)營信息
利用數(shù)據(jù)挖掘技術(shù)、數(shù)據(jù)倉庫技術(shù)和聯(lián)機分析技術(shù),管理者能夠充分利用企業(yè)數(shù)據(jù)倉庫中的海量數(shù)據(jù)進(jìn)行分析,并根據(jù)分析結(jié)果找出企業(yè)經(jīng)營過程中出現(xiàn)的各種問題和可能引起危機的先兆,如經(jīng)營不善、觀念滯后、產(chǎn)品失敗、戰(zhàn)略決策失誤、財務(wù)危機等內(nèi)部因素引起企業(yè)人、財、物、產(chǎn)、供、銷的相對和諧平衡體遭到重大破壞,對企業(yè)的生存、發(fā)展構(gòu)成嚴(yán)重威脅的信息,及時做出正確的決策,調(diào)整經(jīng)營戰(zhàn)略,以適應(yīng)不斷變化的市場需求。
3.利用數(shù)據(jù)挖掘識別、分析和預(yù)防危機
危機管理的精髓在于預(yù)防。利用數(shù)據(jù)挖掘技術(shù)對企業(yè)經(jīng)營的各方面的風(fēng)險、威脅和危險進(jìn)行識別和分析,如產(chǎn)品質(zhì)量和責(zé)任、環(huán)境、健康和人身安全、財務(wù)、營銷、自然災(zāi)害、經(jīng)營欺詐、人員及計算機故障等,對每一種風(fēng)險進(jìn)行分類,并決定如何管理各類風(fēng)險;準(zhǔn)確地預(yù)測企業(yè)所面臨的各種風(fēng)險,并對每一種風(fēng)險、威脅和危險的大小及發(fā)生概率進(jìn)行評價,建立各類風(fēng)險管理的優(yōu)先次序,以有限的資源、時間和資金來管理最嚴(yán)重的一種或某幾類風(fēng)險;制定危機管理的策略和方法,擬定危機應(yīng)急計劃和危機管理隊伍,做好危機預(yù)防工作。
4.利用數(shù)據(jù)挖掘技術(shù)改善客戶關(guān)系管理
客戶滿意度歷來就是衡量一個企業(yè)服務(wù)質(zhì)量好壞的重要尺度,特別是當(dāng)客戶的反饋意見具有廣泛效應(yīng)的時候更是如此。目前很多企業(yè)利用營銷中心、新聞組、 BBS以及呼叫中心等收集客戶的投訴和意見,并對這些投訴和意見進(jìn)行分析,以發(fā)現(xiàn)客戶關(guān)系管理中存在的問題,如果有足夠多的客戶都在抱怨同一個問題,管理者就有理由對其展開調(diào)查,為企業(yè)及時捕捉到發(fā)生危機的一切可能事件和先兆,從而挽
救客戶關(guān)系,避免經(jīng)營危機。
5.利用數(shù)據(jù)挖掘進(jìn)行信用風(fēng)險分析和欺詐甄別
客戶信用風(fēng)險分析和欺詐行為預(yù)測對企業(yè)的財務(wù)安全是非常重要的,使用企業(yè)信息系統(tǒng)中數(shù)據(jù)庫的數(shù)據(jù),利用數(shù)據(jù)挖掘中的變化和偏差分析技術(shù)進(jìn)行客戶信用風(fēng)險分析和欺詐行為預(yù)測,分析這些風(fēng)險為什么會發(fā)生?哪些因素會導(dǎo)致這些風(fēng)險?這些風(fēng)險主要來自于何處?如何預(yù)測到可能發(fā)生的風(fēng)險?采取何種措施減少風(fēng)險的發(fā)生?通過評價這些風(fēng)險的嚴(yán)重性、發(fā)生的可能性及控制這些風(fēng)險的成本,匯總對各種風(fēng)險的評價結(jié)果,進(jìn)而建立一套信用風(fēng)險管理的戰(zhàn)略和監(jiān)督體系,設(shè)計并完善信用風(fēng)險管理能力,準(zhǔn)確、及時地對各種信用風(fēng)險進(jìn)行監(jiān)視、評價、預(yù)警和管理,進(jìn)而采取有效的規(guī)避和監(jiān)督措施,在信用風(fēng)險發(fā)生之前對其進(jìn)行預(yù)警和控制,趨利避害,做好信用風(fēng)險的防范工作。
6.利用數(shù)據(jù)挖掘控制危機
危機一旦爆發(fā),來勢迅猛,損失嚴(yán)重,因此危機發(fā)生以后,要采取有力的措施控制危機,管理者可以利用先進(jìn)的信息技術(shù)如基于Web 的挖掘技術(shù)、各種搜索引擎工具、E-mail自動處理工具、基于人工智能的信息內(nèi)容的自動分類、聚類以及基于深層次自然語言理解的知識檢索、問答式知識檢索系統(tǒng)等快速地獲取危機管理所需要的各種信息,以便向客戶、社區(qū)、新聞界發(fā)布有關(guān)的危機管理信息,并在各種媒體尤其是公司的網(wǎng)站上公布企業(yè)的詳細(xì)風(fēng)險防御和危機管理計劃,使全體員工能夠及時獲取危機管理信息及危機最新的進(jìn)展情況。這樣企業(yè)的高層管理人員、公關(guān)人員、危機管理人員和全體員工就能隨時有準(zhǔn)備地應(yīng)付任何復(fù)雜情況和危急形勢的壓力,對出現(xiàn)的危機立即做出反應(yīng),使危機的損失降到最低。
危機就是危險和機遇,企業(yè)的每一次危機既包含了導(dǎo)致失敗的根源,又蘊藏著成功的種子,發(fā)現(xiàn)、培育,進(jìn)而收獲潛在的成功機會,就是危機管理的精髓;而錯誤地估計形勢,并令事態(tài)進(jìn)一步惡化,則是不良危機管理的典型特征。企業(yè)應(yīng)加強危機管理工作,利用先進(jìn)的數(shù)據(jù)挖掘技術(shù)加強企業(yè)的危機管理工作,以便準(zhǔn)確及時地獲取所需要的危機信息,迅速捕捉到企業(yè)可能發(fā)生危機的一切事件和征兆,進(jìn)而采取有效的規(guī)避措施,在危機發(fā)生之前對其進(jìn)行控制,趨利避害,從而使企業(yè)能夠適應(yīng)迅速變化的市場環(huán)境,保持長久的競爭優(yōu)勢,實現(xiàn)可持續(xù)發(fā)展戰(zhàn)略。
.