淺談數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用
摘要: 概述了數(shù)據(jù)挖掘的定義、方法、過(guò)程,論述了數(shù)據(jù)挖掘技術(shù)與電子商務(wù)的關(guān)系,提出了數(shù)據(jù)挖掘技術(shù)在電子商務(wù)系統(tǒng)中應(yīng)用的體系結(jié)構(gòu),經(jīng)過(guò)測(cè)試,達(dá)到了預(yù)定的結(jié)果。

關(guān)鍵詞: 數(shù)據(jù)挖掘 電子商務(wù) 應(yīng)用
當(dāng)今,國(guó)內(nèi)外電子商務(wù)類(lèi)網(wǎng)站日益興起。許多電子商務(wù)類(lèi)網(wǎng)站都提供了一定程度的個(gè)性化服務(wù),比如提供商品推薦服務(wù)。而構(gòu)成這些個(gè)性化服務(wù)的基礎(chǔ)就是數(shù)據(jù)挖掘技術(shù)。
一、數(shù)據(jù)挖掘分析
1.數(shù)據(jù)挖掘的定義。數(shù)據(jù)挖掘 (data mining,DM)是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)中提取隱含在其中的、人們事先不知道的但又是潛在有用的信息和知識(shí)的過(guò)程。包括存儲(chǔ)和處理數(shù)據(jù), 選擇處理大數(shù)據(jù)集的算法、解釋結(jié)果、使結(jié)果可視化。
2.數(shù)據(jù)挖掘的方法。從商業(yè)的角度來(lái)看,數(shù)據(jù)挖掘是一種新的商業(yè)信息處理技術(shù),其主要特點(diǎn)是對(duì)商業(yè)數(shù)據(jù)庫(kù)中的大量業(yè)務(wù)數(shù)據(jù)進(jìn)行抽取、轉(zhuǎn)換、分析和其他模型化處理,從中提取輔助商業(yè)決策的關(guān)鍵性數(shù)據(jù)。數(shù)據(jù)挖掘的方法大致可以分成4類(lèi):關(guān)聯(lián)分析、概括分析、分類(lèi)分析、聚類(lèi)分析。(1)關(guān)聯(lián)分析:分析表面上不相關(guān)數(shù)據(jù)之間的內(nèi)在聯(lián)系,揭示各事之間的依賴(lài)性和相關(guān)性,分析范圍包括簡(jiǎn)單關(guān)聯(lián)、因果關(guān)聯(lián)等。在電子商務(wù)中,用數(shù)據(jù)挖掘找到隱藏的關(guān)聯(lián)規(guī)則,當(dāng)客戶(hù)瀏覽、搜索關(guān)聯(lián)規(guī)則中的某種商品時(shí),就可以在頁(yè)面中以推薦商品的形式顯示關(guān)聯(lián)規(guī)則中的其它商品。在進(jìn)貨計(jì)劃和促銷(xiāo)計(jì)劃中,也可以將這個(gè)因素考慮進(jìn)去。(2)概括分析:即提取數(shù)據(jù)庫(kù)中指定的數(shù)據(jù)集合的一般特性,找出遍性規(guī)律。(3)分類(lèi)分析:設(shè)置分類(lèi)規(guī)則,把各個(gè)事務(wù)或?qū)嶓w按照性質(zhì)和特征不同進(jìn)行歸類(lèi),把數(shù)據(jù)層次化和規(guī)整化,從而建立數(shù)據(jù)的分類(lèi)模型。(4)聚類(lèi)分析:通過(guò)分析和歸納實(shí)體之間的特征差異,選出具相識(shí)特征的實(shí)體聚合成為一個(gè)類(lèi),并用某種規(guī)則來(lái)描述該類(lèi)的相同屬性,形成一種聚類(lèi)規(guī)則,實(shí)際上,它是與分類(lèi)分析法互逆的過(guò)程。
3.數(shù)據(jù)挖掘的過(guò)程。該過(guò)程從大型數(shù)據(jù)庫(kù)中挖掘先前未知的、有效的、可實(shí)用的信息,并使用這些信息做出決策或豐富知識(shí)。(1)確定業(yè)務(wù)對(duì)象:清晰地定義出業(yè)務(wù)問(wèn)題,認(rèn)清數(shù)據(jù)挖掘的目的是數(shù)據(jù)挖掘的重要一步。挖掘的最后結(jié)構(gòu)是不可預(yù)測(cè)的,但要探索的問(wèn)題應(yīng)是有預(yù)見(jiàn)的,為了數(shù)據(jù)挖掘而數(shù)據(jù)挖掘則帶有盲目性,是不會(huì)成功的。(2)數(shù)據(jù)準(zhǔn)備。數(shù)據(jù)的選擇:搜索所有與業(yè)務(wù)對(duì)象有關(guān)的內(nèi)部和外部數(shù)據(jù)信息,并從中選擇出適用于數(shù)據(jù)挖掘應(yīng)用的數(shù)據(jù)。(3)數(shù)據(jù)挖掘:對(duì)所得到的經(jīng)過(guò)轉(zhuǎn)換的數(shù)據(jù)進(jìn)行挖掘。除了完善從選擇合適的挖掘算法外,其余一切工作都能自動(dòng)地完成。(4)結(jié)果分析:解釋并評(píng)估結(jié)果。其使用的分析方法一般應(yīng)作數(shù)據(jù)挖掘操作而定,通常會(huì)用到可視化技術(shù)。(5)知識(shí)的同化:將分析所得到的知識(shí)集成到業(yè)務(wù)信息系統(tǒng)的組織結(jié)構(gòu)中去。
二、數(shù)據(jù)挖掘與電子商務(wù)的關(guān)系
在電子商務(wù)企業(yè)中,數(shù)據(jù)挖掘運(yùn)用于客戶(hù)行為分析,企業(yè)從中受益體現(xiàn)在以下四個(gè)方面:(1)可以發(fā)現(xiàn)客戶(hù)和訪問(wèn)者的愛(ài)好、生活模式。(2)可以爭(zhēng)取新顧客,怎樣使產(chǎn)品適銷(xiāo)對(duì)路、怎樣給產(chǎn)品定價(jià)、怎樣吸引單個(gè)客戶(hù)、怎樣優(yōu)化Web網(wǎng)站。(3)可以用相應(yīng)的信息確定顧客的消費(fèi)周期,針對(duì)不同的產(chǎn)品制定相應(yīng)的營(yíng)銷(xiāo)策略。(4)可以確定客戶(hù)細(xì)分,為每一個(gè)客戶(hù)的獨(dú)特需求設(shè)計(jì)“量身定制”的產(chǎn)品。
三、數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用
1.面向電子商務(wù)的數(shù)據(jù)挖掘系統(tǒng)設(shè)計(jì)。本系統(tǒng)電子商務(wù)平臺(tái)采用基于三層體系結(jié)構(gòu)構(gòu)建,服務(wù)器端采用先進(jìn)的J2EE平臺(tái)構(gòu)架,有完整的體系框架組成,具有很好的可擴(kuò)展性、互聯(lián)性和可維護(hù)性。因此面向電子商務(wù)的數(shù)據(jù)挖掘系統(tǒng)由數(shù)據(jù)庫(kù)服務(wù)器、應(yīng)用服務(wù)器和客戶(hù)端三層組成,整個(gè)體系結(jié)構(gòu)是以J2EE企業(yè)級(jí)的構(gòu)建技術(shù)為基礎(chǔ)。對(duì)數(shù)據(jù)挖掘過(guò)程中產(chǎn)生的數(shù)據(jù),采用獨(dú)立的數(shù)據(jù)挖掘庫(kù)表存放,這樣既不影響也不依賴(lài)數(shù)據(jù)挖掘的數(shù)據(jù)源。應(yīng)用服務(wù)器完成所有的數(shù)據(jù)挖掘運(yùn)算,通過(guò)接受客戶(hù)端的設(shè)置,完成所有對(duì)數(shù)據(jù)進(jìn)行探索、轉(zhuǎn)換、挖掘的工作。數(shù)據(jù)挖掘系統(tǒng)的每個(gè)功能模塊都以EJB的形式進(jìn)行封裝,以實(shí)現(xiàn)分布式計(jì)算和負(fù)載平衡等分布式計(jì)算的要求,把具有繁重計(jì)算任務(wù)的模塊和用戶(hù)交互模塊分開(kāi)。客戶(hù)端要負(fù)責(zé)數(shù)據(jù)挖掘流程的創(chuàng)建工作、所有功能模塊參數(shù)的設(shè)定以及各種可視化結(jié)果的顯示。用戶(hù)可以根據(jù)自己的要求任意創(chuàng)建各種形式的挖掘流程,同時(shí)按照需要執(zhí)行某部分流程,獲取相應(yīng)的可視化分析結(jié)果,其系統(tǒng)體系結(jié)構(gòu)如圖所示。
2.面向電子商務(wù)的數(shù)據(jù)挖掘系統(tǒng)功能設(shè)計(jì)。面向電子商務(wù)的數(shù)據(jù)挖掘系統(tǒng)主要以下幾大功能模塊:(1)用戶(hù)信息分析。運(yùn)用分類(lèi)和聚類(lèi)挖掘方法對(duì)用戶(hù)的信息分析,可以得到用戶(hù)的些特征。對(duì)用戶(hù)分類(lèi)相當(dāng)于對(duì)具有某些公共屬性的用戶(hù)群體建立了概要特征描述,這些特征可以用來(lái)對(duì)新增的用戶(hù)進(jìn)行分類(lèi),可以發(fā)現(xiàn)未來(lái)的潛在用戶(hù)并開(kāi)展有針對(duì)性的商務(wù)活動(dòng),如自動(dòng)給一類(lèi)特定的用戶(hù)發(fā)送銷(xiāo)售郵件,當(dāng)屬于同一類(lèi)的用戶(hù)再次訪問(wèn)站點(diǎn)時(shí)為其動(dòng)態(tài)地改變站點(diǎn)的內(nèi)容等。通過(guò)這些舉措使商務(wù)活動(dòng)能夠在一定程度上滿(mǎn)足用戶(hù)的要求,實(shí)現(xiàn)目標(biāo)營(yíng)銷(xiāo)。(2)商品信息分析。運(yùn)用關(guān)聯(lián)規(guī)則挖掘發(fā)現(xiàn)商品訪問(wèn)中所有關(guān)聯(lián)和相聯(lián)系的規(guī)則,可以從交易事務(wù)數(shù)據(jù)庫(kù)中發(fā)現(xiàn)商品間的相互聯(lián)系。這對(duì)電子商務(wù)公司組織站點(diǎn)網(wǎng)頁(yè)結(jié)構(gòu)、開(kāi)展有效的營(yíng)銷(xiāo)策略非常有幫助。(3)物流信息分析。采用神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)技術(shù),根據(jù)各物流配送點(diǎn)接到的網(wǎng)站用戶(hù)訂單來(lái)預(yù)測(cè)其庫(kù)存數(shù)量。預(yù)測(cè)信息可以給物流配送中心以參考,用來(lái)合理地確定各配送點(diǎn)倉(cāng)庫(kù)的庫(kù)存量,使各配送點(diǎn)的補(bǔ)貨能更加合理有序,降低物流成本,節(jié)約庫(kù)存費(fèi)用。
四、結(jié)束語(yǔ)
數(shù)據(jù)挖掘是一個(gè)新興的領(lǐng)域, 具有廣闊應(yīng)用前景,目前,電子商務(wù)在我國(guó)正處于快速發(fā)展和應(yīng)用階段,利用數(shù)據(jù)挖掘技術(shù),能夠強(qiáng)化對(duì)客戶(hù)的服務(wù)、促進(jìn)市場(chǎng)最優(yōu)化、加速資金周轉(zhuǎn)、實(shí)現(xiàn)企業(yè)的創(chuàng)新發(fā)展。電子商務(wù)平臺(tái)上的數(shù)據(jù)挖掘技術(shù)有待人們?nèi)ミM(jìn)行更深入的研究工作,這將不斷的推動(dòng)數(shù)據(jù)挖掘技術(shù)的深入發(fā)展和廣泛應(yīng)用,創(chuàng)造出更多的社會(huì)和經(jīng)濟(jì)價(jià)值。
【淺談數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用】相關(guān)文章:
數(shù)據(jù)挖掘技術(shù)在Web信息檢索中的應(yīng)用研究論文12-01
數(shù)據(jù)挖掘在電力企業(yè)中的應(yīng)用論文12-13
數(shù)據(jù)挖掘技術(shù)的教學(xué)輔助系統(tǒng)應(yīng)用論文03-16
數(shù)據(jù)挖掘技術(shù)在就業(yè)指導(dǎo)的應(yīng)用論文02-27
淺談透過(guò)數(shù)據(jù)挖掘信用卡中的供應(yīng)鏈及其應(yīng)用12-05
淺談云數(shù)據(jù)中心網(wǎng)絡(luò)虛擬技術(shù)在企業(yè)中的應(yīng)用論文02-21
數(shù)據(jù)挖掘在現(xiàn)代遠(yuǎn)程教育中的應(yīng)用論文11-22
淺談電子商務(wù)在鋼鐵物流中的應(yīng)用11-16
數(shù)據(jù)挖掘技術(shù)在高校學(xué)生成績(jī)分析中的應(yīng)用研究論文03-15
數(shù)據(jù)挖掘技術(shù)在中等職業(yè)學(xué)校管理實(shí)踐中的應(yīng)用研究11-19
- 相關(guān)推薦