淺析數據挖掘技術在企業職工培訓中的應用論文
從現狀看,數據挖掘范疇內的技術,慣常用于金融、大規模特性的商業之中。然而,企業預設的職員培訓,較少采納這一技術。對于搜集得來的培訓信息,仍停留于建構某一數據庫、單一情形下的數據查驗。數據信息特有的決策價值,沒能充分被發覺。本文依循數據挖掘的本源原理,創設了新穎情形下的數據庫。采納挖掘手段,予以深入調研。數據挖掘得來的適宜結論,能為后續時段的培訓規劃,提供最佳指引。
1新穎技術的特性
搜集得來的初始數據通常數目偏多,數據表征出來的不完整傾向應當被注重。原初的數據夾帶著噪聲,且帶有模糊特性及隨機特性。數據挖掘依托著的手段,是從搜集得來的最初數據以內提煉出潛藏著的、不被知曉的、帶有高層級價值這樣的信息、關聯著的知識等。慣用的挖掘方式包含關聯規則、建構好的決策樹、神經網絡及特有的貝葉斯、建構的粗糙集、對應著的模糊集、挖掘流程內的聚類分析。細分出來的挖掘步驟整合了初始時段的數據預備、數值的選取、預處理特有的流程、側重的挖掘流程、模型更替及轉變、后續時段的挖掘評價。
數據挖掘概念。數據挖掘是從大量的、不完整的、有噪聲的、模糊的和隨即的數據中,提取隱含在其中的、人們事先不知道的、潛在的和有價值的信息和知識的過程。數據挖掘的技術最常用的數據挖掘技術主要有決策樹、關聯規則、貝葉斯、神經網絡、聚類分析、模糊集和粗糙集等。數據挖掘的步驟數據的挖掘過程主要包括5個階段:數據準備、數據選擇、數據預處理、數據挖掘、轉換模型及模式評價。
2構建數據庫
數據挖掘特性的新穎技術不能脫離建構起來的數據庫。它能從數目偏多的信息之內提煉得來可用的數值。職員培訓特有的領域以內,數據庫可以歸整在冊范疇的一切職員,對于獲取到的關聯結果予以辨識解析。數據庫存留著的信息之內涵蓋基礎數據、培訓得來的真正結果。
2. 1擬定物理框架
職員培訓特有的數據庫,應設定適宜情形下的物理模型。擬定好的物理模型是數據特有的存留方式、多層級的數據組織。例如:某企業篩選出來的數據庫,帶有關系型這樣的特性。搭配的管理系統設定成SQL架構下的server。
2. 2擬定概念模型
職員培訓關涉的概念模型能夠明晰預設的系統界限,擬定根本主題。數據庫涵蓋著的根本信息是職員固有的自身信息、這一時段的培訓成績。歸整好的這些信息凸顯了單一性,但又潛藏著某些關聯。采納數據倉庫,提煉并歸整這樣的數值,以便提煉得來決策依憑的可用信息。依循細分出來的職員特性、建構的主題,把總體范疇內的培訓結果,分成多個層級,并歸入數據庫。
3選出來的運用實例
3. 1采納的關聯規則
依循的評判指標,是體系架構中的置信度、對應著的支持度。必備的概率信息包含物品集特有的出現頻次。最小數值的支持度表征著篩選出來的這一項目,在統計之中凸顯了最低層級的重要價值。最小數值的置信度表征著設定好的這類規則,凸顯了不可靠的傾向。采納關聯規則,建構精準模型,以便解析某一時段的培訓狀態。
3. 2采納的模型
抽取出來的數值涵蓋固有的職員信息、測試得來的成績等。采納預設的規則,操作這些數值。這樣做能夠明晰數值潛藏著的彼此關聯,抽取得來的字段含有單位稱呼、職員個體姓名、微機處理特有的等級。
3. 3具體的挖掘步驟
預處理特有的時段中,為了辨識設定好的關聯規則,對于初始數據予以概念化。采納A這樣的符號來表征職員固有的年齡。這種情形之下,A (1)特有的信J息,表T年齡沒能達到25歲;A (2)表征著年齡涵蓋在25歲至35歲;A (3)表征著年齡超出了35歲。采納H這一符號,表明測試特有的通過狀態。H (1)涵蓋著沒能通過的職員,H (2)涵蓋著通過的職員。經山離散化特有的處理以后,得來最終結果。
3. 4后續的挖掘步驟
在測試之中,職員特有的通過人數,總和5910;沒能通過的人數,總和1810。沒能通過的概率,占到了22%。采納預定的關聯規則來挖掘這樣的數據。體系范疇內的每類行為都設定了這一規則。這就表明輸入數值及對應著的輸出之間帶有偏強的關聯。
3. 5解析得來的結論
數據特有的重要性,也即興趣度,能夠辨識頻繁項、設定好的規則等。依循降序排列可以獲取明晰的規則列表。例如某次解析得來這種結論:年齡超出50這樣的職員、工齡超出25這樣的職員或者高級別范疇內的職員通過培訓概率還是偏大的。與此同時,學歷層級偏低的職員,通過等級與特有的學歷,凸顯了相關的傾向,這樣的對應符合慣常的認知。
由此可見,學歷層級偏低這樣的職員在接納新認知時能力是偏弱的。針對企業以內的這類職員,在接續的培訓之中應多加注重。設定出來的培訓形式,應符合帶有差異特性的職員群體;劃分的培訓時段應傾向于認知偏弱的職工。例如:可以添加課時,調整預設的培訓時段,保障體系以內的這些職員,能參與擬定好的培訓規劃。此外,對于接納能力偏強這樣的職工,可適當縮減原有的課時,縮減設定好的多樣科目。這樣做可縮減耗費掉的培訓經費,并創設最優情形下的整體效益。離散化情形下的數值處理驗證了歸結出來的這一結論。
4結語
數據庫建構依循的根本原理不能脫離數據挖據。企業培訓之中,借助挖掘得來的多重信息,能夠解析各時段的培訓成果。連續值固有的屬性,在設定好的挖掘流程內得以離散化,這就為接續的深入挖掘提供了基礎。調整擬定好的培訓規劃,確保預設的新規劃,符合職員培訓特有的真實狀態。
【淺析數據挖掘技術在企業職工培訓中的應用論文】相關文章:
數據挖掘在電力企業中的應用論文12-13
數據挖掘技術的教學輔助系統應用論文03-16
數據挖掘技術在就業指導的應用論文02-27
數據挖掘在現代遠程教育中的應用論文11-22
淺析警犬技術在合成作戰中的應用論文05-17
網絡編碼中數據通信技術的應用論文03-17
淺析現代測繪技術在水利工程中的應用論文12-03
油田井場監測中數據通信技術的應用論文03-16
- 相關推薦