- 相關推薦
淺析改進的Apriori關聯挖掘算法的實踐應用
摘要:本文介紹了數據挖掘技術在圖書館中的應用,并運用改進的Apriori關聯挖掘算法對安徽省圖書館自動化系統中讀者流通庫進行挖掘,并對挖掘出的結果及其意義進行評價,從而為圖書館讀者管理、圖書資源的采購提供決策支持。關鍵詞:數據挖掘 Apriori算法 圖書館管理 讀者管理
數據挖掘技術在商業領域內的應用給圖書館帶來了很大的啟發。圖書館的數據庫可以運用數據挖掘技術中的關聯規則分析、聚類分析、決策樹、時間序列分析等數據挖掘方法,以找出數據庫中蘊藏的對于圖書館管理有用的潛在規則,并且通過描述和預測,為圖書館的圖書采購、讀者服務、館藏目錄設置等管理工作提供決策支持。
關聯規則是與多數人想象的挖掘過程中最相近的一種數據挖掘形式,即尋找在同一事件中出現的不同項的相關性。關聯規則的研究有助于發現數據庫中不同商品間的聯系,找出顧客購買行為模式。在圖書館運用關聯規則分析可以細分出讀者群,根據其借閱情況提供不同的服務,為圖書館的管理決策提供參考。關聯規則的核心算法是Apriori算法。
關聯規則的基本概念及算法
挖掘流通借閱事務數據庫中所有的關聯規則的問題可以被劃分成如下兩個子問題:
找出所有具有最小支持度的項集(即頻繁項集),可用Apriori算法來找出頻繁項集。由頻繁項集產生強關聯規則,對于每一個頻繁項集I,找出其中所有的非空子集,然后,對于每一個這樣的子集a,如果support(I)與support(a)的比值大于最小置信度,則存在規則a=