通信企業(yè)CRM的數(shù)據(jù)挖掘技術(shù)研究 |
發(fā)布時(shí)間: 2012/8/8 11:02:41 |
未來(lái)中國(guó)通信市場(chǎng)上還會(huì)有一段充滿(mǎn)變數(shù)時(shí)間,數(shù)據(jù)挖掘會(huì)將大量通信數(shù)據(jù)轉(zhuǎn)換成可靠的、商用的決策支持信息的最好解決方案,面向通信企業(yè)客戶(hù)關(guān)系管理系統(tǒng)的數(shù)據(jù)挖掘可以為通信企業(yè)提供市場(chǎng)分析力量。
一、數(shù)據(jù)挖掘的概念 數(shù)據(jù)挖掘是根據(jù)企業(yè)的既定業(yè)務(wù)目標(biāo)和存在的問(wèn)題,對(duì)大量的業(yè)務(wù)數(shù)據(jù)進(jìn)行探索,揭示其中隱藏的規(guī)律,并將其模型化,指導(dǎo)并應(yīng)用于企業(yè)的實(shí)際經(jīng)營(yíng)。數(shù)據(jù)挖掘是建立在數(shù)據(jù)倉(cāng)庫(kù)基礎(chǔ)上的高層應(yīng)用,但數(shù)據(jù)挖掘跟數(shù)據(jù)倉(cāng)庫(kù)的其它一些應(yīng)用如OLAP分析、預(yù)定義報(bào)表和即席查詢(xún)等有很大的區(qū)別。后三者通常是用戶(hù)根據(jù)已知的情況對(duì)所關(guān)心的業(yè)務(wù)指標(biāo)進(jìn)行分析;而前者則是在業(yè)務(wù)問(wèn)題和目標(biāo)明確但考察的問(wèn)題不清楚時(shí),對(duì)數(shù)據(jù)進(jìn)行探索,揭示隱藏其中的規(guī)律性,進(jìn)而將其模型化。 二、數(shù)據(jù)挖掘的方法 1.神經(jīng)網(wǎng)絡(luò)方法 神經(jīng)網(wǎng)絡(luò)由于本身良好的自組織自適應(yīng)性、并行處理、分布存儲(chǔ)和高度容錯(cuò)等特性非常適合解決數(shù)據(jù)挖掘的問(wèn)題,因此近年來(lái)越來(lái)越受到人們的關(guān)注。典型的神經(jīng)網(wǎng)絡(luò)模型主要分3大類(lèi):以感知機(jī)、BP反向傳播模型、函數(shù)型網(wǎng)絡(luò)為代表的,用于分類(lèi)、預(yù)測(cè)和模式識(shí)別的前饋式神經(jīng)網(wǎng)絡(luò)模型;以Hopfield的離散模型和連續(xù)模型為代表的,分別用于聯(lián)想記憶和優(yōu)化計(jì)算的反饋式神經(jīng)網(wǎng)絡(luò)模型;以ART模型、Koholon模型為代表的,用于聚類(lèi)的自組織映射方法。神經(jīng)網(wǎng)絡(luò)方法的缺點(diǎn)是“黑箱”性,人們難以理解網(wǎng)絡(luò)的學(xué)習(xí)和決策過(guò)程。 2.遺傳算法 遺傳算法是一種基于生物自然選擇與遺傳機(jī)理的隨機(jī)搜索算法,是一種仿生全局優(yōu)化方法。遺傳算法具有的隱含并行性、易于和其它模型結(jié)合等性質(zhì)使得它在數(shù)據(jù)挖掘中被加以應(yīng)用。Sunil已成功地開(kāi)發(fā)了一個(gè)基于遺傳算法的數(shù)據(jù)挖掘工具,利用該工具對(duì)兩個(gè)飛機(jī)失事的真實(shí)數(shù)據(jù)庫(kù)進(jìn)行了數(shù)據(jù)挖掘?qū)嶒?yàn),結(jié)果表明遺傳算法是進(jìn)行數(shù)據(jù)挖掘的有效方法之一。遺傳算法的應(yīng)用還體現(xiàn)在與神經(jīng)網(wǎng)絡(luò)、粗集等技術(shù)的結(jié)合上。如利用遺傳算法優(yōu)化神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),在不增加錯(cuò)誤率的前提下,刪除多余的連接和隱層單元;用遺傳算法和BP算法結(jié)合訓(xùn)練神經(jīng)網(wǎng)絡(luò),然后從網(wǎng)絡(luò)提取規(guī)則等。但遺傳算法的算法較復(fù)雜,收斂于局部極小的較早收斂問(wèn)題尚未解決。 3.決策樹(shù)方法 決策樹(shù)是一種常用于預(yù)測(cè)模型的算法,它通過(guò)將大量數(shù)據(jù)有目的分類(lèi),從中找到一些有價(jià)值的,潛在的信息。它的主要優(yōu)點(diǎn)是描述簡(jiǎn)單,分類(lèi)速度快,特別適合大規(guī)模的數(shù)據(jù)處理。最有影響和最早的決策樹(shù)方法是由Quinlan提出的著名的基于信息熵的ID3算法。它的主要問(wèn)題是:ID3是非遞增學(xué)習(xí)算法;ID3決策樹(shù)是單變量決策樹(shù),復(fù)雜概念的表達(dá)困難;同性間的相互關(guān)系強(qiáng)調(diào)不夠;抗噪性差。針對(duì)上述問(wèn)題,出現(xiàn)了許多較好的改進(jìn)算法,如Schlimmer和Fisher設(shè)計(jì)了ID4遞增式學(xué)習(xí)算法;鐘鳴,陳文偉等提出了IBLE算法等。 4.粗集方法 粗集理論是一種研究不精確、不確定知識(shí)的數(shù)學(xué)工具。粗集方法有幾個(gè)優(yōu)點(diǎn):不需要給出額外信息;簡(jiǎn)化輸入信息的表達(dá)空間;算法簡(jiǎn)單,易于操作。粗集處理的對(duì)象是類(lèi)似二維關(guān)系表的信息表。目前成熟的關(guān)系數(shù)據(jù)庫(kù)管理系統(tǒng)和新發(fā)展起來(lái)的數(shù)據(jù)倉(cāng)庫(kù)管理系統(tǒng),為粗集的數(shù)據(jù)挖掘奠定了堅(jiān)實(shí)的基礎(chǔ)。但粗集的數(shù)學(xué)基礎(chǔ)是集合論,難以直接處理連續(xù)的屬性。而現(xiàn)實(shí)信息表中連續(xù)屬性是普遍存在的。因此連續(xù)屬性的離散化是制約粗集理論實(shí)用化的難點(diǎn),F(xiàn)在國(guó)際上已經(jīng)研制出來(lái)了一些基于粗集的工具應(yīng)用軟件,如加拿大Regina大學(xué)開(kāi)發(fā)的KDD-R1美國(guó)Kansas大學(xué)開(kāi)發(fā)的LERS等。 5.覆蓋正倒排斥反倒方法 它是利用覆蓋所有正例、排斥所有反例的思想來(lái)尋找規(guī)則。首先在正例集合中任選一個(gè)種子,到反例集合中逐個(gè)比較。與字段取值構(gòu)成的選擇子相容則舍去,相反則保留。按此思想循環(huán)所有正例種子,將得到正例的規(guī)則(選擇子的合取式)。比較典型的算法有Michalski的AQ11方法、洪家榮改進(jìn)的AQ15方法以及他的AE5方法。 6.統(tǒng)計(jì)分析方法 在數(shù)據(jù)庫(kù)字段項(xiàng)之間存在兩種關(guān)系:函數(shù)關(guān)系(能用函數(shù)公式表示的確定性關(guān)系)和相關(guān)關(guān)系(不能用函數(shù)公式表示,但仍是相關(guān)確定性關(guān)系),對(duì)它們的分析可采用統(tǒng)計(jì)學(xué)方法,即利用統(tǒng)計(jì)學(xué)原理對(duì)數(shù)據(jù)庫(kù)中的信息進(jìn)行分析。可進(jìn)行常用統(tǒng)計(jì)(求大量數(shù)據(jù)中的最大值、最小值、總和、平均值等)、回歸分析(用回歸方程來(lái)表示變量間的數(shù)量關(guān)系),相關(guān)分析(用相關(guān)系數(shù)來(lái)度量變量間的相關(guān)程度)、差異分析(從樣本統(tǒng)計(jì)量的值得出差異來(lái)確定總體參數(shù)之間是否存在差異)等。 7.模糊集方法 即利用模糊集合理論對(duì)實(shí)際問(wèn)題進(jìn)行模糊評(píng)判、模糊決策、模糊模式識(shí)別和模糊聚類(lèi)分析。系統(tǒng)的復(fù)雜性越高,模糊性越強(qiáng),一般模糊集合理論是用隸屬度來(lái)刻畫(huà)模糊事物的亦此亦彼性的。李德毅等人在傳統(tǒng)模糊理論和概率統(tǒng)計(jì)的基礎(chǔ)上,提出了定性定量不確定性轉(zhuǎn)換模型——云模型,并形成了云理論。 三、數(shù)據(jù)挖掘的流程 1.定義問(wèn)題:清晰地定義出業(yè)務(wù)問(wèn)題,確定數(shù)據(jù)挖掘的目的。 2.數(shù)據(jù)準(zhǔn)備:數(shù)據(jù)準(zhǔn)備包括:選擇數(shù)據(jù)——在大型數(shù)據(jù)庫(kù)和數(shù)據(jù)倉(cāng)庫(kù)目標(biāo)中提取數(shù)據(jù)挖掘的目標(biāo)數(shù)據(jù)集;數(shù)據(jù)預(yù)處理——進(jìn)行數(shù)據(jù)再加工,包括檢查數(shù)據(jù)的完整性及數(shù)據(jù)的一致性、去噪聲,填補(bǔ)丟失的域,刪除無(wú)效數(shù)據(jù)等。 3.數(shù)據(jù)挖掘:根據(jù)數(shù)據(jù)功能的類(lèi)型和和數(shù)據(jù)的特點(diǎn)選擇相應(yīng)的算法,在凈化和轉(zhuǎn)換過(guò)的數(shù)據(jù)集上進(jìn)行數(shù)據(jù)挖掘。 4.結(jié)果分析:對(duì)數(shù)據(jù)挖掘的結(jié)果進(jìn)行解釋和評(píng)價(jià),轉(zhuǎn)換成為能夠最終被用戶(hù)理解的知識(shí)。 5.知識(shí)的運(yùn)用:將分析所得到的知識(shí)集成到業(yè)務(wù)信息系統(tǒng)的組織結(jié)構(gòu)中去。 四、客戶(hù)關(guān)系管理(CRM) 客戶(hù)關(guān)系管理(CRM)首先是一種管理理念,起源于西方的市場(chǎng)營(yíng)銷(xiāo)理論,產(chǎn)生和發(fā)展在美國(guó)。其核心思想是將企業(yè)的客戶(hù)(包括最終客戶(hù),分銷(xiāo)商和合作伙伴)作為最重要的企業(yè)資源,通過(guò)完善的客戶(hù)服務(wù)和深入的客戶(hù)分析來(lái)滿(mǎn)足客戶(hù)的需求,保證實(shí)現(xiàn)客戶(hù)的終生價(jià)值。 客戶(hù)關(guān)系管理(CRM)又是一種旨在改善企業(yè)與客戶(hù)之間關(guān)系的新型管理機(jī)制,它實(shí)施于企業(yè)的市場(chǎng)營(yíng)銷(xiāo)、銷(xiāo)售、服務(wù)與技術(shù)支持等與客戶(hù)相關(guān)的領(lǐng)域?蛻(hù)關(guān)系管理(CRM)也是一種管理軟件和技術(shù),它將最佳的商業(yè)實(shí)踐與數(shù)據(jù)挖掘、數(shù)據(jù)倉(cāng)庫(kù)、一對(duì)一營(yíng)銷(xiāo)、銷(xiāo)售自動(dòng)化以及其它信息技術(shù)緊密結(jié)合在一起,為企業(yè)的銷(xiāo)售、客戶(hù)服務(wù)和決策支持等領(lǐng)域提供了一個(gè)業(yè)務(wù)自動(dòng)化的解決方案,從而順利實(shí)現(xiàn)由傳統(tǒng)企業(yè)模式到以電子商務(wù)為基礎(chǔ)的現(xiàn)代企業(yè)模式的轉(zhuǎn)化。 五、數(shù)據(jù)挖掘在通信企業(yè) 客戶(hù)關(guān)系管理中的應(yīng)用客戶(hù)的獲取。把客戶(hù)根據(jù)其性別、收入、交易行為特征等屬性細(xì)分為具有不同需求和交易習(xí)慣的群體,同一群體中的客戶(hù)對(duì)產(chǎn)品的需求以及交易心理等方面具有相似性,而不同群體間差異較大。那么這就有助于企業(yè)在營(yíng)銷(xiāo)中更加貼近顧客需求。分類(lèi)和聚類(lèi)等挖掘方法可以把大量的客戶(hù)分成不同的類(lèi)(群體),適合于用來(lái)進(jìn)行客戶(hù)細(xì)分。通過(guò)群體細(xì)分,CRM用戶(hù)可以更好地理解客戶(hù),發(fā)現(xiàn)群體客戶(hù)的行為規(guī)律。在行為分組完成后,還要進(jìn)行客戶(hù)理解、客戶(hù)行為規(guī)律發(fā)現(xiàn)和客戶(hù)組之間的交叉分析。 重點(diǎn)客戶(hù)發(fā)現(xiàn)。就是找出對(duì)企業(yè)具有重要意義的客戶(hù),重點(diǎn)客戶(hù)發(fā)現(xiàn)主要包括:發(fā)現(xiàn)有價(jià)值的潛在客戶(hù);發(fā)現(xiàn)有更多的消費(fèi)需求的同一客戶(hù);發(fā)現(xiàn)更多使用的同一種產(chǎn)品或服務(wù);保持客戶(hù)的忠誠(chéng)度。根據(jù)80/20(即20%的客戶(hù)貢獻(xiàn)80%的銷(xiāo)售額)以及開(kāi)發(fā)新客戶(hù)的費(fèi)用是保留老客戶(hù)費(fèi)用的5倍等營(yíng)銷(xiāo)原則,重點(diǎn)客戶(hù)發(fā)現(xiàn)在CRM中具有舉足輕重的作用。 交叉營(yíng)銷(xiāo)。商家與其客戶(hù)之間的商業(yè)關(guān)系是一種持續(xù)的不斷發(fā)展的關(guān)系,通過(guò)不斷地相互是接觸和交流,客戶(hù)得到了更好更貼切的服務(wù)質(zhì)量,商家則因?yàn)樵黾恿虽N(xiāo)售量而獲利。交叉營(yíng)銷(xiāo)指向已購(gòu)買(mǎi)商品的客戶(hù)推薦其它產(chǎn)品和服務(wù)。這種策略成功的關(guān)鍵是要確保推銷(xiāo)的產(chǎn)品是用戶(hù)所感興趣的,有幾種挖掘方法都可以應(yīng)用于此問(wèn)題,關(guān)聯(lián)規(guī)則分析能夠發(fā)現(xiàn)顧客傾向于關(guān)聯(lián)購(gòu)買(mǎi)哪些商品。聚類(lèi)分析能夠發(fā)現(xiàn)對(duì)特定產(chǎn)品感興趣的用戶(hù)群,神經(jīng)網(wǎng)絡(luò)、回歸等方法能夠預(yù)測(cè)顧客購(gòu)買(mǎi)該新產(chǎn)品的可能性。 客戶(hù)流失分析。分類(lèi)等技術(shù)能夠判斷具備哪些特性的客戶(hù)群體最容易流失,建立客戶(hù)流失預(yù)測(cè)模型。從而幫助企業(yè)對(duì)有流失風(fēng)險(xiǎn)的顧客提前采取相應(yīng)營(yíng)銷(xiāo)措施。利用數(shù)據(jù)挖掘技術(shù),可以通過(guò)挖掘大量的客戶(hù)信息來(lái)構(gòu)建預(yù)測(cè)模型,較準(zhǔn)確地找出易流失客戶(hù)群,并制定相應(yīng)的方案,最大程度地保持住老客戶(hù)。通過(guò)研究,認(rèn)為數(shù)據(jù)挖掘技術(shù)中的決策樹(shù)技術(shù)(Decision Tree)能夠較好地應(yīng)用在這一方面。 性能評(píng)估。以客戶(hù)所提供的市場(chǎng)反饋為基礎(chǔ),通過(guò)數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)清潔與集中過(guò)程,將客戶(hù)對(duì)市場(chǎng)的反饋?zhàn)詣?dòng)地輸入到數(shù)據(jù)倉(cāng)庫(kù)中,從而進(jìn)行客戶(hù)行為跟蹤。性能分析與客戶(hù)行為分析和重點(diǎn)客戶(hù)發(fā)現(xiàn)是相互交迭的過(guò)程,這樣才能保證企業(yè)的客戶(hù)關(guān)系管理能夠達(dá)到既定的目標(biāo),建立良好的客戶(hù)關(guān)系。 對(duì)不同信譽(yù)度用戶(hù)給予不同的服務(wù)及優(yōu)惠。 五、小結(jié) 數(shù)據(jù)挖掘的出現(xiàn)只有短短的幾年時(shí)間,而它所表現(xiàn)出的廣闊應(yīng)用前景令人矚目。CRM作為一個(gè)涉及知識(shí)管理、業(yè)務(wù)流程再造和企業(yè)信息化的概念正以前所未有的速度發(fā)展,并且迅速擴(kuò)大著用戶(hù)群體。隨著市場(chǎng)經(jīng)濟(jì)的推動(dòng)和信息技術(shù)的發(fā)展,尤其是網(wǎng)絡(luò)通信和數(shù)據(jù)倉(cāng)庫(kù)技術(shù),廣大用戶(hù)也越來(lái)越注重CRM的實(shí)用價(jià)值。 CRM的良好應(yīng)用前景會(huì)進(jìn)一步加快數(shù)據(jù)挖掘技術(shù)的成熟和發(fā)展。在CRM中有效利用數(shù)據(jù)挖掘,可以指導(dǎo)企業(yè)高層決策者制定最優(yōu)的企業(yè)營(yíng)銷(xiāo)策略,降低企業(yè)運(yùn)營(yíng)成本,增加利潤(rùn),加速企業(yè)的發(fā)展。只有融合了數(shù)據(jù)挖掘技術(shù)的高效的客戶(hù)關(guān)系管理才能更好地適應(yīng)當(dāng)今信息時(shí)代及其網(wǎng)絡(luò)化特征,成為現(xiàn)代企業(yè)在激烈的市場(chǎng)競(jìng)爭(zhēng)中生存的根本和制勝的關(guān)鍵。 本文出自:億恩科技【1tcdy.com】 本文出自:億恩科技【www.enidc.com】 --> 服務(wù)器租用/服務(wù)器托管中國(guó)五強(qiáng)!虛擬主機(jī)域名注冊(cè)頂級(jí)提供商!15年品質(zhì)保障!--億恩科技[ENKJ.COM] |