- 相關推薦
談數(shù)據(jù)挖掘技術在電子商務中的應用
[摘要]電子商務的廣泛應用使企業(yè)產(chǎn)生了大量的業(yè)務數(shù)據(jù),按企業(yè)既定業(yè)務目標對這些數(shù)據(jù)進行數(shù)據(jù)挖掘可以幫助企業(yè)分析出完成任務所需的關鍵因素。文章先容了數(shù)據(jù)挖掘技術,以實例分析了數(shù)據(jù)挖掘在電子商務中的應用,并先容了在電子商務中如何應用數(shù)據(jù)挖掘技術。。坳P鍵詞]電子商務;數(shù)據(jù)挖掘;路徑分析
隨著Internet 的普及,電子商務的興起,人們的商務理念正在改變, 電子商務的廣泛應用使企業(yè)產(chǎn)生了大量的業(yè)務數(shù)據(jù),如何更快、更好地利用各種有效的數(shù)據(jù)更好地開展電子商務,這是目前電子商務急需解決的題目。
一 、數(shù)據(jù)挖掘技術
20 世紀 90 年代以來,隨著信息技術和數(shù)據(jù)庫技術的迅猛發(fā)展,人們可以非常方便地獲取和存儲大量的數(shù)據(jù)。面對大規(guī)模的海量的數(shù)據(jù),傳統(tǒng)的數(shù)據(jù)分析工具(如治理信息系統(tǒng))只能進行一些表層的處理(如查詢、統(tǒng)計等),而不能獲得數(shù)據(jù)之間的內(nèi)在關系和隱含的信息。為了擺脫“數(shù)據(jù)豐富,知識貧乏”的困境,人們迫切需要一種能夠智能地自動地把數(shù)據(jù)轉換成有用信息和知識的技術和工具,這種對強有力數(shù)據(jù)分析工具的迫切需求使得數(shù)據(jù)挖掘技術應運而生。人們熟悉到數(shù)據(jù)庫中存儲的數(shù)據(jù)量急劇增大,在大量的數(shù)據(jù)背后隱躲著很多重要的信息,假如能把這些信息從數(shù)據(jù)庫中抽取出來,將為公司創(chuàng)造很多潛伏的利潤。這種從海量數(shù)據(jù)庫中挖掘信息的技術,就稱之為數(shù)據(jù)挖掘。數(shù)據(jù)挖掘一般有以下四類主要任務:
(一)數(shù)據(jù)總結
數(shù)據(jù)挖掘能夠?qū)?shù)據(jù)庫中的有關數(shù)據(jù)從較低的個體層次抽象總結到較高的總體層次上,從而實現(xiàn)對原始基本數(shù)據(jù)的總體把握。
(二)分類
分析數(shù)據(jù)的各種屬性,并找出數(shù)據(jù)的屬性模型,確定哪些數(shù)據(jù)屬于哪些組。這樣我們就可以利用該模型來分析已有數(shù)據(jù),并猜測新數(shù)據(jù)將屬于哪一個組。
(三)關聯(lián)分析
數(shù)據(jù)庫中的數(shù)據(jù)一般都存在著關聯(lián)關系,也就是說,兩個或多個變量的取值之間存在某種規(guī)律性。通過挖掘數(shù)據(jù)派生關聯(lián)規(guī)則,可以了解客戶的行為。
(四)聚類
聚類分析是按照某種相近程度度量方法,將用戶數(shù)據(jù)分成一系列有意義的子集合。每一個集合中的數(shù)據(jù)性質(zhì)相近,不同集合之間的數(shù)據(jù)性質(zhì)相差較大。
數(shù)據(jù)挖掘的特點和性質(zhì)對于企業(yè)而言,有助于發(fā)現(xiàn)其企業(yè)業(yè)務發(fā)展的趨勢, 揭示已知的事實, 猜測未知的結果, 并幫助企業(yè)分析出完成任務所需的關鍵因素, 以達到增加收進, 降低本錢, 使企業(yè)處于更有利的競爭位置的目的。
二、數(shù)據(jù)挖掘在電子商務中的作用
數(shù)據(jù)挖掘技術源于貿(mào)易的直接需求, 因此它在各種貿(mào)易領域都存在廣泛的使用價值。電子商務是貿(mào)易領域的一種新興商務模式,是指利用電子信息技術開展一切商務活動。當電子商務在企業(yè)中得到應用時, 企業(yè)信息系統(tǒng)將產(chǎn)生大量數(shù)據(jù), 這些海量數(shù)據(jù)使數(shù)據(jù)挖掘有了豐富的數(shù)據(jù)基礎, 同時高性能計算機和高傳輸速率網(wǎng)絡的使用也給數(shù)據(jù)挖掘技術提供了堅實的保障。因此數(shù)據(jù)挖掘技術在電子商務活動中有了更大的用武之地。下面先容數(shù)據(jù)挖掘在以下電子商務幾個方面的作用:
(一)客戶細分
隨著“以客戶為中心”的經(jīng)營理念的不斷深進人心, 分析客戶、了解客戶并引導客戶的需求已成為企業(yè)經(jīng)營的重要課題。通過對電子商務系統(tǒng)收集的交易數(shù)據(jù)進行分析, 可以按各種客戶指標(如自然屬性、收進貢獻、交易額、價值度等) 對客戶分類, 然后確定不同類型客戶的行為模式, 以便采取相應的營銷措施, 促使企業(yè)利潤的最大化。
(二)客戶獲得
利用數(shù)據(jù)挖掘可以有效地獲得客戶。比如通過數(shù)據(jù)挖掘可以發(fā)現(xiàn)購買某種商品的消費者是男性還是女性, 學歷、收進如何, 有什么愛好, 是什么職業(yè)等等。甚至可以發(fā)現(xiàn)不同的人在購買該種商品的相關商品后多長時間有可能購買該種商品, 以及什么樣的人會購買什么型號的該種商品等等。也許很多因素表面上看起來和購買該種商品不存在任何聯(lián)系, 但數(shù)據(jù)挖掘的結果卻證實它們之間有聯(lián)系。在采用了數(shù)據(jù)挖掘后, 針對目標客戶發(fā)送的廣告的有效性和回應率將得到大幅度的進步, 傾銷的本錢將大大降低。
(三)客戶保持
數(shù)據(jù)挖掘可以把你大量的客戶分成不同的類, 在每個類里的客戶擁有相似的屬性, 而不同類里的客戶的屬性也不同。你完全可以做到給不同類的客戶提供完全不同的服務來進步客戶的滿足度。數(shù)據(jù)挖掘還可以發(fā)現(xiàn)具有哪些特征的客戶有可能流失, 這樣挽留客戶的措施將具有針對性, 挽留客戶的用度將下降。
(四)交叉銷售
交叉銷售可以使企業(yè)比較輕易地得到關于客戶的豐富的信息,而這些大量的數(shù)據(jù)對于數(shù)據(jù)挖掘的正確性來說是有很大幫助的。在企業(yè)所把握的客戶信息, 尤其是以前購買行為的信息中, 可能正包含著這個客戶決定他下一個購買行為的關鍵, 甚至決定因素。這個時候數(shù)據(jù)挖掘的作用就會體現(xiàn)出來, 它可以幫助企業(yè)尋找到這些影響他購買行為的因素。 (五)個性服務
當客戶在電子商務網(wǎng)站注冊時, 客戶將會看到帶有客戶姓名的歡迎詞。根據(jù)客戶的訂單紀錄, 系統(tǒng)可以向客戶顯示那些可能引起客戶特殊愛好的新商品。當客戶留意到一件特殊的商品時, 系統(tǒng)會建議一些在購買中可以增加的其他商品。普通的產(chǎn)品目錄手冊經(jīng)常簡單地按類型對商品進行分組, 以簡化客戶挑選商品的步驟。然而對于在線商店, 商品分組可能是完全不同的, 它經(jīng)常以針對客戶的商品補充條目為基礎。不僅考慮客戶看到的條目, 而且還考慮客戶購物籃中的商品。使用數(shù)據(jù)挖掘技術可以使推薦更加個性化。
(六)資源優(yōu)化
節(jié)約本錢是企業(yè)盈利的關鍵。通過分析歷史的財務數(shù)據(jù)、庫存數(shù)據(jù)和交易數(shù)據(jù), 可以發(fā)現(xiàn)企業(yè)資源消耗的關鍵點和主要活動的投進產(chǎn)出比例, 從而為企業(yè)資源優(yōu)化配置提供決策依據(jù), 例如降低庫存、進步庫存周轉率、進步資金使用率等。
(七)異常事件的確定
在很多貿(mào)易領域中, 異常事件具有明顯的貿(mào)易價值, 如客戶流失、銀行的信用卡欺詐、電信中移動話費拖欠等。通過數(shù)據(jù)挖掘中的奇異點分析可以迅速正確地甄別這些異常事件。
由此可見數(shù)據(jù)挖掘在電子商務中有著重要的作用。在生活中采用數(shù)據(jù)挖掘的成功的例子很多。例如總部位于美國阿肯色州的WalMart零售商的“尿布與啤酒”的故事。WalMart擁有世界上最大的數(shù)據(jù)倉庫系統(tǒng),它利用數(shù)據(jù)挖掘工具對數(shù)據(jù)倉庫中的原始交易數(shù)據(jù)進行分析,得到了一個意外發(fā)現(xiàn):跟尿布一起購買最多的商品竟然是啤酒。假如不是借助于數(shù)據(jù)倉庫和數(shù)據(jù)挖掘,商家決不可能發(fā)現(xiàn)這個隱躲在背后的事實:在美國,一些年輕的父親放工后經(jīng)常要到超市往買嬰兒尿布,而他們中有30%~40%的人同時也為自己買一些啤酒。有了這個發(fā)現(xiàn)后,超市調(diào)整了貨架的擺放,把尿布和啤酒放在一起,明顯增加了銷售額。
三、電子商務中如何應用數(shù)據(jù)挖掘技術
數(shù)據(jù)挖掘在電子商務中有廣泛的應用。那么在電子商務中是如何應用數(shù)據(jù)挖掘技術的?
首先,從挖掘過程說,對在線訪問客戶數(shù)據(jù)的挖掘主要有兩部分:一部分是客戶訪問信息的挖掘,另一部分是客戶登記信息的挖掘。面對大量的訪問日志,首先要做的就是對數(shù)據(jù)進行清洗,即預處理,把無關的數(shù)據(jù),不重要的數(shù)據(jù)等處理掉;接著對數(shù)據(jù)進行事務識別,通過對事務進行劃分后,就可以根據(jù)具體的分析需求選擇模式發(fā)現(xiàn)的技術,如路徑分析、愛好關聯(lián)規(guī)則、聚類等。通過模式分析,找到有用的信息,再通過聯(lián)機分析(OLAP) 的驗證,結合客戶登記信息,找出有價值的市場信息,或發(fā)現(xiàn)潛伏的市場。
其次,挖掘方法主要有以下幾種:
1.路徑分析
路徑分析是一種找尋頻繁訪問路徑的方法,它通過對Web 服務器的日志文件中客戶訪問站點的訪問次數(shù)分析,挖掘出頻繁訪問路徑。 例如:一客戶從某一站點訪問到某一感愛好的頁面后就會經(jīng)常訪問該頁面, 通過路徑分析確定頻繁訪問路徑, 可以了解客戶對哪些頁面感愛好,(下轉第78頁)(上接第80頁)從而更好地改進設計,為客戶服務。
2.愛好關聯(lián)規(guī)則
當客戶訪問某一網(wǎng)頁時,一般會通過愛好詞條找出相關的愛好網(wǎng)頁通過鏈接繼續(xù)訪問, 這種關聯(lián)產(chǎn)生的數(shù)據(jù)假如能夠按照某種策略進行挖掘分析, 統(tǒng)計出客戶訪問某些頁面及愛好關聯(lián)頁面的比率, 就可以很好地組織站點, 實施有效的市場策略。
3.聚類分析
聚類分析是電子商務中很重要的一個方面,通過分組聚類出具有相似瀏覽行為的客戶,并分析客戶的共同特征,更好地幫助電子商務的用戶了解自己的客戶,向客戶提供更合適的服務。如通過對眾多的瀏覽“camera”網(wǎng)頁的客戶分析,發(fā)現(xiàn)在該網(wǎng)頁上經(jīng)常花一段時間瀏覽的客戶,再通過對這部分客戶的登記資料分析,知道這些客戶是潛伏要買相機的客戶群體。就可以調(diào)整“camera”網(wǎng)頁的內(nèi)容和風格,以適應客戶的需要。
通過以上幾種數(shù)據(jù)分析的方法可以有效地對電子商務中的信息進行分析,從而更有效地開展電子商務。
目前,數(shù)據(jù)挖掘技術正以前所未有的速度發(fā)展,并且擴大著用戶群體,在未來越來越激烈的市場競爭中,擁有數(shù)據(jù)挖掘技術必將比別人獲得更快速的反應,贏得更多的貿(mào)易機會,F(xiàn)在世界上的主要數(shù)據(jù)庫廠商紛紛開始把數(shù)據(jù)挖掘功能集成到自己的產(chǎn)品中,加快數(shù)據(jù)挖掘技術的發(fā)展。我國在這一領域正處在研究開發(fā)階段,加快研究數(shù)據(jù)挖掘技術,并把它應用于電子商務中,應用到更多行業(yè)中,勢必會有更好的貿(mào)易機會和更光明的遠景。
。蹍⒖嘉墨I]
。1]韓家煒.Web 挖掘研究[J].計算機研究與發(fā)展,2001 , 38(4).
。2]陳宏. 消費者數(shù)據(jù)挖掘系統(tǒng)建立的幾個題目[J]. www.ctiforum.com,2002-09-03.
【談數(shù)據(jù)挖掘技術在電子商務中的應用】相關文章:
網(wǎng)絡經(jīng)濟數(shù)據(jù)挖掘在工商管理中的應用論文07-29
談Openprocess在熱網(wǎng)監(jiān)控系統(tǒng)中的應用06-09
談電子商務中的網(wǎng)絡安全治理08-25
談灌注樁在水利工程中的應用08-22
談建構主義在大學英語精讀課中的應用08-25
多媒體技術在鋼琴教學中應用論文04-28
談三維制作軟件在園林設計中的應用08-30