- 相關(guān)推薦
數(shù)據(jù)挖掘技術(shù)在電子商務(wù)網(wǎng)站中的應(yīng)用
當(dāng)用戶和電子商務(wù)的商家充分享受電子商務(wù)的快捷和方便時,他們同時面臨著某些新的題目。一方面,用戶面對網(wǎng)站上提供的琳瑯滿目的眾多商品,他們只對其中的一部分商品感愛好。用戶要實現(xiàn)一次的購買,就必須瀏覽很多不相關(guān)的網(wǎng)頁,在眾多的商品分類中找到自己所需要的商品;另一方面,商家面對眾多的用戶,不知道他們對商品的愛好和要求是什么。因此,電子商務(wù)的商家無法及時調(diào)整網(wǎng)站的頁面結(jié)構(gòu),提供給所有的用戶是千篇一律的界面。缺乏個性化服務(wù)己經(jīng)成為制約電子商務(wù)發(fā)展的關(guān)鍵題目;赪eb數(shù)據(jù)挖掘技術(shù)的電子商務(wù)推薦系統(tǒng)提供了一種有效的解決方法。推薦系統(tǒng)就是根據(jù)用戶個人的喜好、習(xí)慣來向其推薦信息、商品的程序。電子商務(wù)推薦系統(tǒng)能夠直接與用戶交互,模擬商店銷售職員向用戶提供商品推薦,幫助用戶找到所需商品,從而順利完成購買過程。從用戶角度來看,電子商務(wù)推薦系統(tǒng)通過對收集到的用戶的訪問行為、訪問頻度、訪問內(nèi)容等瀏覽信息進行挖掘,提取用戶的特征,獲取用戶訪問Web的模式,動態(tài)地調(diào)整頁面結(jié)構(gòu),為用戶實現(xiàn)主動推薦,提供個性化服務(wù);從企業(yè)角度來看,企業(yè)?茨軌颢@取用戶的訪問規(guī)律,以幫助企業(yè)確定顧客消費的生命周期,針對不同的產(chǎn)品制定相應(yīng)的營銷策略,進一步優(yōu)化網(wǎng)站的組織結(jié)構(gòu)和服務(wù)方式,以進步網(wǎng)站的效率。推薦系統(tǒng)在幫助了客戶的同時也進步了顧客對商務(wù)活動的滿足度,換來對商務(wù)網(wǎng)站的進一步支持。
一、推薦系統(tǒng)在電子商務(wù)活動中的作用
一般說來,推薦系統(tǒng)在電子商務(wù)活動中的作用可以回納為以下幾點:
(一)把瀏覽者轉(zhuǎn)變成購買者
己有明確購物目標(biāo)的客戶也許可以借助檢索系統(tǒng)找到自己需要的東西,但對于大多數(shù)只是四處走走看一看的沖浪者,或是對自己的需要比較模糊的購買者,很難有耐心在幾十頁長的商品目錄逐項查找是否有自己感愛好的東西。而推薦系統(tǒng)通過合適的推薦,可以將一個瀏覽者變?yōu)橘徺I者。
(二)進步電子商務(wù)系統(tǒng)的交叉銷售能力
電子商務(wù)推薦系統(tǒng)在用戶購買過程中向用戶提供其它有價值的商品推薦,用戶能夠從提供的推薦列表中購買自己確實需要但在購買過程中沒有想到的商品,從而有效進步電子商務(wù)系統(tǒng)的交叉銷售。例如站點可以根據(jù)客戶當(dāng)前購物車中的物品向他們推薦一些和這些己選購的物品相關(guān)的物品。假如有一個比較好的推薦系統(tǒng),則企業(yè)的均勻定購量就可能增加。
(三)進步客戶對電子商務(wù)網(wǎng)站忠誠度。
與傳統(tǒng)的商務(wù)模式相比,電子商務(wù)系統(tǒng)使得用戶擁有越來越多的選擇,用戶更換商家及其方便,只需要一兩次鼠標(biāo)的點擊就可以在不同電子商務(wù)系統(tǒng)之間跳轉(zhuǎn)。電子商務(wù)推薦系統(tǒng)分析用戶的購買習(xí)慣,根據(jù)用戶需求向用戶提供有價值的商品推薦。假如電子商務(wù)推薦系統(tǒng)的推薦質(zhì)量很高,用戶可以很輕易找到自己想要的商品,那么用戶會再次訪問這個網(wǎng)站,并會推薦給其他人,這對于網(wǎng)站來說是一個很大的上風(fēng)。
二、數(shù)據(jù)挖掘技術(shù)在電子商務(wù)推薦系統(tǒng)的具體應(yīng)用
數(shù)據(jù)挖掘是在大型數(shù)據(jù)存儲庫中,自動地發(fā)現(xiàn)有用信息的過程。數(shù)據(jù)挖掘技術(shù)用來探查大型
數(shù)據(jù)庫,發(fā)現(xiàn)先前未知的有用模式。電子商務(wù)推薦系統(tǒng)將數(shù)據(jù)挖掘技術(shù)運用到電子商務(wù)領(lǐng)域,以數(shù)據(jù)挖掘為基礎(chǔ)衍生出很多算法。
(一)基于關(guān)聯(lián)規(guī)則的推薦算法
關(guān)聯(lián)規(guī)則是數(shù)據(jù)挖掘技術(shù)的一種,該技術(shù)挖掘發(fā)現(xiàn)大量數(shù)據(jù)中項集之間有趣的關(guān)聯(lián)或相關(guān)聯(lián)系。關(guān)聯(lián)規(guī)則挖掘的一個典型例子就是購物籃分析。該過程通過發(fā)現(xiàn)顧客放進其購物籃中不同商品之間的聯(lián)系,分析顧客的購買習(xí)慣。通過了解哪些商品頻繁地被顧客同時購買,這種關(guān)聯(lián)的發(fā)現(xiàn)可以幫助商家制定營銷策略。
關(guān)聯(lián)規(guī)則的挖掘是一個兩步過程:
首先,找出所有頻繁項集。這些項集出現(xiàn)的頻繁性至少和預(yù)定義的最小支持計數(shù)一樣。其次,由頻繁項集產(chǎn)生強關(guān)聯(lián)規(guī)則。這些規(guī)則必須滿足最小支持度和最小置信度。
關(guān)聯(lián)規(guī)則挖掘算法的瓶頸出現(xiàn)在第一步。由于第一步需要反復(fù)掃描交易數(shù)據(jù)庫,所以增加了系統(tǒng)的開銷,降低了系統(tǒng)性能。例如:Aprior算法是一種最有影響的挖掘關(guān)聯(lián)規(guī)則頻繁項集的算法。該算法使用一種稱為逐層搜索的迭代方法尋找頻繁項集,它開創(chuàng)性地使用基于支持度的剪枝技術(shù),系統(tǒng)地控制候選項集指數(shù)增長。它缺點就是由于數(shù)據(jù)庫數(shù)據(jù)的增多,需要多次掃描數(shù)據(jù)庫,這樣便影響了系統(tǒng)的性能。
(二)基于內(nèi)同的推薦算法
基于內(nèi)容的推薦系統(tǒng)的產(chǎn)生根源于信息檢索與信息過濾。其具體是根據(jù)項之間的相似性來進行推薦的,先用機器學(xué)習(xí)等技術(shù)分析用戶已經(jīng)評分的項的內(nèi)容,建立用戶檔案,然后從項集中選擇與用戶檔案相似的項,再從中根據(jù)評分選擇一定的項推薦給用戶,最后根據(jù)用戶的反饋信息修正推薦。
基于內(nèi)容得推薦技術(shù)具有一定的局限性。首先,資源內(nèi)容必須以機器可以理解的格式表示,而很多信息例如圖像、視頻等多媒體信息是很難做到這一點的;其次,資源內(nèi)容的分析范圍比較小,不能提供較多的建議;再次,基于內(nèi)容的推薦不能從質(zhì)量、樣式、審美等角度對項進行過濾。
(三)協(xié)同過濾推薦算法
協(xié)同過濾是在信息過濾和信息系統(tǒng)中正迅速成為一項很受歡迎的技術(shù)。與傳統(tǒng)的基于內(nèi)容過濾直接分析內(nèi)容進行推薦不同,協(xié)同過濾分析用戶愛好,在用戶群中找到指定用戶的相似(愛好)用戶,綜合這些相似用戶對某一信息的評價,形成系統(tǒng)對該指定用戶對此信息的喜好程度猜測。
協(xié)同過濾推薦算法的缺點是:(1)用戶對商品的評價非常稀疏,這樣基于用戶的評價所得到的用戶間的相似性可能不正確(即稀疏性題目)。(2)隨著用戶和商品的增多,系統(tǒng)的性能會越來越低(即可擴展性題目)。(3)假如從來沒有用戶對某一商品加以評價,則這個商品就不可能被推薦(即最初評價題目)。
為了彌補各種推薦方法的缺點,在實際中常采用組合推薦。在組合推薦上,國外的有關(guān)學(xué)者提出了七種組合思路:
(1)加權(quán):加權(quán)多種推薦技術(shù)結(jié)果。
(2)變換:根據(jù)題目背景和實際情況采用不同的推薦技術(shù)。
(3)混合:同時采用多種推薦技術(shù)給出多種推薦結(jié)果,為用戶提供參考。
(4)特征組合:組合來自不同推薦數(shù)據(jù)源的特征被另一種推薦算法所采用。
(5)層疊:先用一種推薦技術(shù)產(chǎn)生一種粗糙的推薦結(jié)果,第二種推薦技術(shù)在此推薦結(jié)果的基礎(chǔ)上進一步做出更精確的推薦。
(6)特征擴充:一種技術(shù)產(chǎn)生附加的特征信息嵌進到另一種推薦技術(shù)的特征輸進中。
(7)Metal-Level:一種推薦方法產(chǎn)生的模型作為另一種推薦方法的輸進。
盡治理論上有很多種推薦組合方法,但在某一具體題目中并不見得都有效,組合推薦一個最重要的原則,就是通過組合后要能避免或彌補各自推薦技術(shù)的弱點。
三、電子商務(wù)推薦算法面臨的挑戰(zhàn)
電子商務(wù)推薦技術(shù)在實際應(yīng)用中取得了巨大成功,很多電子商務(wù)網(wǎng)站都提供了各種不同的推薦服務(wù)。但隨著站點結(jié)構(gòu)內(nèi)容的復(fù)雜度和用戶人數(shù)的增加,電子商務(wù)推薦算法也面臨很多挑戰(zhàn),主要包括:
(一)實時性和擴展性題目:對于上百萬之巨的數(shù)據(jù),推薦系統(tǒng)必須快速處理、實時搜索,在幾毫秒內(nèi)處理成千上萬用戶并提供推薦。通常的推薦算法將遭到嚴(yán)重的實時性和擴展性題目。
(二)智能化推薦:目前大部分的協(xié)同過濾推薦系統(tǒng)采用顯示評分輸進的方式提供個推薦服務(wù),用戶必須顯示輸進對商品的數(shù)值評分。這種方式一方面使得評分?jǐn)?shù)據(jù)的獲取比較正確可信,但同時也使得用戶在使用上不是很方便。如何根據(jù)用戶的行為向用戶提供完全智能化得推薦需要做進一步的研究。
(三)實時性與推薦質(zhì)量之間的平衡:推薦系統(tǒng)的推薦精度和實時性是一對矛盾。大部分推薦技術(shù)在保證實時性要求的同時,是以犧牲推薦系統(tǒng)的推薦質(zhì)量為條件的。在提供實時推薦服務(wù)的同時,如何有效進步推薦系統(tǒng)的推薦質(zhì)量,需要做進一步深進的研究。
(四)效率更好的數(shù)據(jù)挖掘算法的研究:更有效的K-最近搜索算法和聚類算法能夠進步推薦的實時性和正確性。目前的推薦系統(tǒng)中,K-最近搜索算法存在實時性的不足等缺陷,難以快速處理大規(guī)模的數(shù)據(jù);質(zhì)量高的聚類算法能夠有效分割用戶群,適合推薦的聚類算法的性能也有待進步。
(五)新型電子商務(wù)推薦系統(tǒng)體系結(jié)構(gòu)研究:當(dāng)前大部分的電子商務(wù)推薦系統(tǒng)都只是一個單一的工具,只能提供一種推薦模型。但由于電子商務(wù)系統(tǒng)本身的復(fù)雜性,不同場合需要不同類型的推薦。因此,需要研究新型電子商務(wù)推薦系統(tǒng)體系結(jié)構(gòu),以有效集成多種推薦工具,收集多種類型的數(shù)據(jù),提供多種推薦模型,使得不同的推薦工具組合使用,互補是非,滿族不同類型的推薦需要。
參考文獻:
[1] 曾子明,余小鵬(著):電子商務(wù)推薦系統(tǒng)與智能談判技術(shù)[M]武漢大學(xué)出版社2008.5
[2]Mehmed Kantardzic (著) 閃四清,陳茵,程雁 等(譯):數(shù)據(jù)挖掘
【數(shù)據(jù)挖掘技術(shù)在電子商務(wù)網(wǎng)站中的應(yīng)用】相關(guān)文章:
談數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用03-21
數(shù)據(jù)挖掘技術(shù)在CRM中的應(yīng)用03-22
Web數(shù)據(jù)挖掘在電子商務(wù)中的應(yīng)用.03-21
數(shù)據(jù)挖掘在旅游電子商務(wù)中應(yīng)用論文11-28
數(shù)據(jù)挖掘技術(shù)在企業(yè)知識管理中的應(yīng)用03-19
Web數(shù)據(jù)挖掘在電子商務(wù)中的應(yīng)用研究03-07
數(shù)據(jù)挖掘技術(shù)在客戶關(guān)系管理中的應(yīng)用12-09