- 相關推薦
在電子商務中如何正確的使用數據挖掘技術
摘要:對于企業而言,數據挖掘有助于發現業務發展的趨勢,幫助企業做出正確的決策,使企業處于更有利的競爭位置。數據挖掘中應用的技術包括經典的統計、近鄰、聚類,也包括最新發展起來的決策樹、神經網絡和關聯規則等一些較新的方法。當實際開發一個數據挖掘系統時,究竟應該選擇哪種數據挖掘技術,往往是一件很困難的事情。本文結合數據挖掘技術在電子商務中的應用,提出選擇數據挖掘技術的兩個重要依據,以便開發出有效、實用的數據挖掘系統。
關鍵詞:數據挖掘 電子商務 關聯分析 分類 聚類
1引言
隨著網絡技術和數據庫技術的成熟,全球傳統商務正經歷一次重大變革,向電子商務全速挺進。這種商業電子化的趨勢不僅為客戶提供了便利的交易方式和廣泛的選擇,同時也為商家提供了更加深入地了解客戶需求信息和購物行為特征的可能性。數據挖掘技術作為電子商務的重要應用技術之一,將為正確的商業決策提供強有力的支持和可靠的保證,是電子商務不可缺少的重要工具。
電子商務的發展促使公司內部收集了大量的數據,并且迫切需要將這些數據轉換成有用的信息和知識,為公司創造更多潛在的利潤,數據挖掘概念就是從這樣的商業角度開發出來的。數據挖掘涉及的學科領域和方法很多,其核心技術歷經了數十年的發展,其中包括統計、近鄰、聚類、決策樹、神經網絡和規則等。今天,這些成熟的技術在電子商務中已進入了實用階段,并取得了良好的效果。但數據挖掘作為一個新興領域,在實際應用當中仍存在許多尚未解決的問題。其中最困難的往往在于決定什么時候采用哪種數據挖掘技術。為了對數據挖掘技術進行明智的選擇,本文結合數據挖掘技術在電子商務中的應用,從挖掘任務和數據信息兩個角度進行分析,指出各種數據挖掘技術適用的場合,以便開發出切實可用的數據挖掘系統。
2數據挖掘的概念及其在電子商務中的應用
2.1數據挖掘的概念
數據挖掘是通過挖掘數據倉庫中存儲的大量數據,從中發現有意義的新的關聯模式和趨勢的過程。從商業的角度定義,數據挖掘是一種新的商業信息處理技術,其主要特點是對商業數據庫中的大量業務數據進行抽取、轉換、分析和其它模型化處理,從中提取輔助商業決策的關鍵性數據。數據挖掘最吸引人的地方是它能建立預測模型而不是回顧型的模型。利用功能強大的數據挖掘技術,可以使企業把數據轉化為有用的信息幫助決策,從而在市場競爭中獲得優勢地位。
2.2數據挖掘在電子商務中的應用
由于數據挖掘能帶來顯著的經濟效益,它在電子商務中(特別是金融業、零售業和電信業)應用也越來越廣泛。
在金融領域,管理者可以通過對客戶償還能力以及信用的分析,進行分類,評出等級。從而可減少放貸的麻木性,提高資金的使用效率。同時還可發現在償還中起決定作用的主導因素,從而制定相應的金融政策。更值得一提的是通過對數據的分析還可發現洗黑錢以及其它的犯罪活動。
在零售業,數據挖掘可有助于識別顧客購買行為,發現顧客購買模式和趨勢,改進服務質量,取得更好的顧客保持力和滿意程度,提高貨品銷量比率,設計更好的貨品運輸與分銷策略,減少商業成本。
電信業已經迅速地從單純的提供市話和長話服務演變為綜合電信服務,如語音、傳真、尋呼、移動電話、圖像、電子郵件、計算機和WEB數據傳輸以及其它的數據通信服務。電信、計算機網絡、因特網和各種其它方式的通信和計算的融合是目前的大勢所趨。而且隨著許多國家對電信業的開放和新型計算與通信技術的發展,電信市場正在迅速擴張并越發競爭激烈。因此,利用數據挖掘技術來幫助理解商業行為、確定電信模式、捕捉盜用行為、更好的利用資源和提高服務質量是非常有必要的。分析人員可以對呼叫源、呼叫目標、呼叫量和每天使用模式等信息進行分析,還可以通過挖掘進行盜用模式分析和異常模式識別,從而可盡早發現盜用,為公司減少損失。
3選擇數據挖掘技術的兩個重要依據
數據挖掘使用的技術很多,其中主要包括統計方法、機器學習方法、和神經網絡方法和數據庫方法。統計方法可細分為回歸分析、判別分析、聚類分析、探索性分析等。機器學習方法可細分為歸納學習方法(決策樹、規則歸納)、基于范例學習、遺傳算法等。神經網絡方法可細分為錢箱神經網絡(BP算法)、自組織神經網絡等。數據庫方法主要是多維數據分析或OLAP方法,另外還有面向屬性的歸納方法。由于每一種數據挖掘技術都有其自身的特點和實現的步驟,對數據的形式有具體的要求,并且與具體的應用問題密切相關,因此成功的應用數據挖掘技術以達到目標過程本身就是一件很復雜的事情,本文主要從挖掘任務和可獲得的數據兩個角度來討論對數據挖掘技術的選擇。
3.1不同的挖掘任務使用不同的挖掘技術
數據挖掘的任務是從數據中發現模式。根據挖掘任務,數據挖掘可分為概念描述、聚集發現、關聯規則發現、分類發現、回歸發現和序列模式發現等。在選擇使用某種數據挖掘技術之前,首先要將待解決的商業問題轉化成正確的數據挖掘的任務,然后根據挖掘的任務來選擇具體使用某一種或幾種挖掘技術。下面具體的分析每一種挖掘任務應使用哪些挖掘技術。
概念描述
概念描述是描述式數據挖掘的最基本形式。它以簡潔匯總的形式描述給定的任務相關數據集,提供數據的有趣的一般特性。概念描述由特征化和比較組成。數據特征化是目標類數據的一般特征或特性的匯總。通常,用戶指定類的數據通過數據庫查詢收集。例如,為研究上一年銷售增加10%的軟件產品的特征,可以通過執行一個SQL查詢收集關于這些產品的數據。概念的特征化有兩種一般方法:基于數據立方體OLAP的方法和面向屬性歸納的方法。二者都是基于屬性或維的概化方法.數據特征的輸出可以用多種形式提供。包括餅圖、條圖、曲線、多維數據立方體和包括交叉表在內的多維表。數據區分是將目標類對象的一般特征與一個或多個對比類對象的一般特征比較。例如,將上一年銷售增加10%的軟件產品與同一時期銷售至少下降30%的那些產品進行比較。用于數據區分的方法與用于數據特征化的方法類似。總之,進行概念描述挖掘時一般采用面向數據庫的方法,另外還可以采用機器學習方法的基于范例學習技術。與機器學習方法相比,面向數據庫的概念描述導致在大型數據庫和數據倉庫中的有效性和可伸縮性。
聚集發現
聚集是把整個數據庫分成不
【在電子商務中如何正確的使用數據挖掘技術】相關文章:
談數據挖掘技術在電子商務中的應用03-21
數據挖掘技術在電子商務網站中的應用03-28
數據挖掘技術在CRM中的應用03-22
Web數據挖掘在電子商務中的應用.03-21
電子商務中數據挖掘方法淺談03-01
數據挖掘技術在飯店營銷中的運用03-28
數據挖掘在旅游電子商務中應用論文11-28
基于愛好的電子商務數據挖掘技術的研究12-08