• <sub id="h4knl"><ol id="h4knl"></ol></sub>
    <sup id="h4knl"></sup>
      <sub id="h4knl"></sub>

      <sub id="h4knl"><ol id="h4knl"><em id="h4knl"></em></ol></sub><s id="h4knl"></s>
      1. <strong id="h4knl"></strong>

      2. 數據挖掘論文的參考文獻

        時間:2022-04-15 14:19:22 參考文獻 我要投稿

        數據挖掘論文的參考文獻

          在日常學習、工作生活中,大家都有寫論文的經歷,對論文很是熟悉吧,借助論文可以有效訓練我們運用理論和技能解決實際問題的的能力.相信寫論文是一個讓許多人都頭痛的問題,以下是小編收集整理的數據挖掘論文的參考文獻,供大家參考借鑒,希望可以幫助到有需要的朋友.

        數據挖掘論文的參考文獻

          數據挖掘論文的參考文獻 篇1

          [1]劉瑩;跀祿诰虻纳唐蜂N售預測分析[J].科技通報.2014(07)

          [2]姜曉娟,郭一娜.基于改進聚類的電信客戶流失預測分析[J].太原理工大學學報.2014(04)

          [3]李欣海.隨機森林模型在分類與回歸分析中的應用[J].應用昆蟲學報.2013(04)

          [4]朱志勇,徐長梅,劉志兵,胡晨剛;谪惾~斯網絡的客戶流失分析研究[J].計算機工程與科學.2013(03)

          [5]翟健宏,李偉,葛瑞海,楊茹;诰垲惻c貝葉斯分類器的網絡節點分組算法及評價模型[J].電信科學.2013(02)

          [6]王曼,施念,花琳琳,楊永利。成組刪除法和多重填補法對隨機缺失的二分類變量資料處理效果的比較[J].鄭州大學學報(醫學版).2012(05)

          [7]黃杰晟,曹永鋒。挖掘類改進決策樹[J].現代計算機(專業版).2010(01)

          [8]李凈,張范,張智江。數據挖掘技術與電信客戶分析[J].信息通信技術.2009(05)

          [9]武曉巖,李康。基因表達數據判別分析的隨機森林方法[J].中國衛生統計.2006(06)

          [10]張璐。論信息與企業競爭力[J].現代情報.2003(01)

          [11]楊毅超;赪eb數據挖掘的作物商務平臺分析與研究[D].湖南農業大學2008

          [12]徐進華。基于灰色系統理論的數據挖掘及其模型研究[D].北京交通大學2009

          [13]俞馳;诰W絡數據挖掘的客戶獲取系統研究[D].西安電子科技大學2009

          [14]馮軍。數據挖掘在自動外呼系統中的應用[D].北京郵電大學2009

          [15]于寶華;跀祿诰虻母呖紨祿治鯷D].天津大學2009

          [16]王仁彥。數據挖掘與網站運營管理[D].華東師范大學2010

          [17]彭智軍。數據挖掘的若干新方法及其在我國證券市場中應用[D].重慶大學2005

          [18]涂繼亮;跀祿诰虻闹悄芸蛻絷P系管理系統研究[D].哈爾濱理工大學2005

          [19]賈治國。數據挖掘在高考填報志愿上的應用[D].內蒙古大學2005

          [20]馬飛;跀祿诰虻暮竭\市場預測系統設計及研究[D].大連海事大學2006

          [21]周霞。基于云計算的太陽風大數據挖掘分類算法的研究[D].成都理工大學2014

          [22]阮偉玲。面向生鮮農產品溯源的基層數據庫建設[D].成都理工大學2015

          [23]明慧。復合材料加工工藝數據庫構建及數據集成[D].大連理工大學2014

          [24]陳鵬程。齒輪數控加工工藝數據庫開發與數據挖掘研究[D].合肥工業大學2014

          [25]岳雪。基于海量數據挖掘關聯測度工具的設計[D].西安財經學院2014

          [26]丁翔飛。基于組合變量與重疊區域的SVM—RFE方法研究[D].大連理工大學2014

          [27]劉士佳。基于MapReduce框架的頻繁項集挖掘算法研究[D].哈爾濱理工大學2015

          [28]張曉東。全序模塊模式下范式分解問題研究[D].哈爾濱理工大學2015

          [29]尚丹丹。基于虛擬機的Hadoop分布式聚類挖掘方法研究與應用[D].哈爾濱理工大學2015

          [30]王化楠。一種新的混合遺傳的基因聚類方法[D].大連理工大學2014

          拓展閱讀

          什么是大數據?

          “大數據”到底有多大?根據研究機構統計,僅在2011年,全球數據增量就達到了1.8ZB(即1.8萬億GB),相當于全世界每個人產生200GB以上的數據。這種增長趨勢仍在加速,據保守預計,接下來幾年中,數據將始終保持每年50%的增長速度。

          縱觀人類歷史,每一次劃時代的變革都是以新工具的出現和應用為標志的。蒸汽機把人們從農業時代帶入了工業時代,計算機和互聯網把人們從工業時代帶入了信息時代,而如今大數據時代已經到來,它源自信息時代,又是信息時代全方位的深化應用與延伸。大數據時代的生產原材料是數據,生產工具則是大數據技術,是對信息時代所產生的海量數據的挖掘和分析,從而快速地獲取有價值信息的技術和應用。

          概括來講,大數據有三個特征,可總結歸納為“3V”,即量(Volume)、類(Variety)、時(Velocity)。量,數據容量大,現在數據單位已經躍升至ZB級別。類,數據種類多,主要來自業務系統,例如社交網絡、電子商務和物聯網應用。時,處理速度快,時效性要求高,從傳統的事務性數據到實時或準實時數據。

          什么是數據挖掘?

          數據挖掘,又稱為知識發現(Knowledge Discovery),是通過分析每個數據,從大量數據中尋找其規律的技術。知識發現過程通常由數據準備、規律尋找和規律表示3個階段組成。數據準備是從數據中心存儲的數據中選取所需數據并整合成用于數據挖掘的數據集;規律尋找是用某種方法將數據集所含規律找出來;規律表示則是盡可能以用戶可理解的方式(如可視化)將找出的規律表示出來。

          “數據海量、信息缺乏”是相當多企業在數據大集中之后面臨的尷尬問題。目前,大多數事物型數據庫僅實現了數據錄入、查詢和統計等較低層次的功能,無法發現數據中存在的有用信息,更無法進一步通過數據分析發現更高的價值。如果能夠對這些數據進行分析,探尋其數據模式及特征,進而發現某個客戶、群體或組織的興趣和行為規律,專業人員就可以預測到未來可能發生的變化趨勢。這樣的數據挖掘過程,將極大拓展企業核心競爭力。例如,在網上購物時遇到的提示“瀏覽了該商品的人還瀏覽了如下商品”,就是在對大量的購買者“行為軌跡”數據進行記錄和挖掘分析的基礎上,捕捉總結購買者共性習慣行為,并針對性地利用每一次購買機會而推出的銷售策略。

          數據挖掘在供電企業的應用前景

          隨著社會的進步和信息通信技術的發展,信息系統在各行業、各領域快速拓展。這些系統采集、處理、積累的數據越來越多,數據量增速越來越快,以至用“海量、爆炸性增長”等詞匯已無法形容數據的增長速度。

          2011年5月,全球知名咨詢公司麥肯錫全球研究院發布了一份題為《大數據:創新、競爭和生產力的.下一個新領域》的報告。報告中指出,數據已經滲透到每一個行業和業務職能領域,逐漸成為重要的生產因素;而人們對于大數據的運用預示著新一波生產率增長和消費者盈余浪潮的到來。2012年3月29日,美國政府在白宮網站上發布了《大數據研究和發展倡議》,表示將投資2億美元啟動“大數據研究和發展計劃”,增強從大數據中分析萃取信息的能力。

          在電力行業,堅強智能電網的迅速發展使信息通信技術正以前所未有的廣度、深度與電網生產、企業管理快速融合,信息通信系統已經成為智能電網的“中樞神經”,支撐新一代電網生產和管理發展。目前,國家電網公司已初步建成了國內領先、國際一流的信息集成平臺。隨著三地集中式數據中心的陸續投運,一級部署業務應用范圍的拓展,結構化和非結構化數據中心的上線運行,電網業務數據從總量和種類上都已初具規模。隨著后續智能電表的逐步普及,電網業務數據將從時效性層面進一步豐富和拓展。大數據的“量類時”特性,已在海量、實時的電網業務數據中進一步凸顯,電力大數據分析迫在眉睫。

          當前,電網業務數據大致分為三類:一是電力企業生產數據,如發電量、電壓穩定性等方面的數據;二是電力企業運營數據,如交易電價、售電量、用電客戶等方面的數據;三是電力企業管理數據,如ERP、一體化平臺、協同辦公等方面的數據。如能充分利用這些基于電網實際的數據,對其進行深入分析,便可以提供大量的高附加值服務。這些增值服務將有利于電網安全檢測與控制(包括大災難預警與處理、供電與電力調度決策支持和更準確的用電量預測),客戶用電行為分析與客戶細分,電力企業精細化運營管理等等,實現更科學的需求側管理。

          例如,在電力營銷環節,針對“大營銷”體系建設,以客戶和市場為導向,省級集中的95598客戶服務、計量檢定配送業務屬地化管理的營銷管理體系和24小時面向客戶的營銷服務系統,可通過數據分析改善服務模式,提高營銷能力和服務質量;以分析型數據為基礎,優化現有營銷組織模式,科學配置計量、收費和服務資源,構建營銷稽查數據監控分析模型;建立各種針對營銷的系統性算法模型庫,發現數據中存在的隱藏關系, 為各級決策者提供多維的、直觀的、全面的、深入的分析預測性數據, 進而主動把握市場動態,采取適當的營銷策略,獲得更大的企業效益,更好地服務于社會和經濟發展。此外,還可以考慮在電力生產環節,利用數據挖掘技術,在線計算輸送功率極限,并考慮電壓等因素對功率極限的影響,從而合理設置系統輸出功率,有效平衡系統的安全性和經濟性。

          公司具備非常好的從數據運維角度實現更大程度信息、知識發現的條件和基礎,完全可以立足數據運維服務,創造數據增值價值,提供并衍生多種服務。以數據中心為紐帶,新型數據運維的成果將有可能作為一種新的消費形態與交付方式,給客戶帶來全新的使用體驗,打破傳統業務系統間各自為陣的局面,進一步推動電網生產和企業管理,從數據運維角度對企業生產經營、管理以及堅強智能電網建設提供更有力、更長遠、更深入的支撐。

          數據挖掘專業就業方向

          1.數據挖掘主要是做算法還是做應用?分別都要求什么?

          這個問題太籠統,基本上算法和應用是兩個人來做的,可能是數據挖掘職位。做算法的比較少,也比較高級。

          其實所謂做算法大多數時候都不是設計新的算法(這個可以寫論文了),更多的是技術選型,特征工程抽取,最多是實現一些已經有論文但是還沒有開源模塊的算法等,還是要求扎實的算法和數據結構功底,以及豐富的分布式計算的知識的,以及不錯的英文閱讀和寫作能力。但即使是這樣也是百里挑一的,很難找到。

          絕大讀書數據挖掘崗位都是做應用,數據清洗,用現成的庫建模,如果你自己不往算法或者架構方面繼續提升,和其他的開發崗位的性質基本沒什么不同,只要會編程都是很容易入門的。

          2.北上廣以外的普通公司用的多嗎?待遇如何?

          實際情況不太清楚,由于數據挖掘和大數據這個概念太火了,肯定到處都有人招聘響應的崗位,但是二線城市可能僅僅是停留在概念上,很多實際的工作并沒有接觸到足夠大的數據,都是生搬硬套框架(從我面試的人的工作經驗上看即使是在北上廣深這種情況也比較多見)。

          只是在北上廣深,可能接觸到大數據的機會多一些。而且做數據挖掘現在熱點的技術比如Python,Spark,Scala,R這些技術除了在一線城市之外基本上沒有足夠的市場(因為會的人太少了,二線城市的公司找不到掌握這些技術的人,不招也沒人學)。

          所以我推測二線城市最多的還是用JAVA+Hadoop,或者用JAVA寫一些Spark程序。北上廣深和二線城市程序員比待遇是欺負人,就不討論了。

          3.和前端后端程序員比有什么區別?有什么優缺點?

          和傳統的前后端程序員相比,最主要的去別就是對編程水平的要求。從我招聘的情況來看,做數據挖掘的人編程水平要求可以降低一個檔次,甚至都不用掌握面向對象。

          但是要求技術全面,編程、SQL,Linux,正則表達式,Hadoop,Spark,爬蟲,機器學習模型等技術都要掌握一些。前后端可能是要求精深,數據挖掘更強調廣博,有架構能力更好。

          4.目前在學習機器學習,如果想找數據挖掘方面的工作應該學習哪些內容?

          打基礎是最重要的,學習一門數據挖掘常用的語言,比如Python,Scala,R;學習足夠的Linux經驗,能夠通過awk,grep等Linux命令快速的處理文本文件。掌握SQL,MySQL或者PostgreSQL都是比較常用的關系型數據庫,搞數據的別跟我說不會用數據庫。

          補充的一些技能,比如NoSQL的使用,Elasticsearch的使用,分詞(jieba等模塊的使用),算法的數據結構的知識。

          5.hadoop,hive之類的需要學習嗎?

          我覺得應當學習,首先Hadoop和Hive很簡單(如果你用AWS的話你可以開一臺EMR,上面直接就有Hadoop和Hive,可以直接從使用學起)。

          我覺得如果不折騰安裝和部署,還有Linux和MySQL的經驗,只要半天到一天就能熟悉Hadoop和Hive的使用(當然你得有Linux和MySQL的基礎,如果沒有就先老老實實的學Linux和MySQL,這兩個都可以在自己的PC上安裝,自己折騰)。

          Spark對很多人來說才是需要學習的,如果你有JAVA經驗大可以從JAVA入門。如果沒有那么還是建議從Scala入門,但是實際上如果沒有JAVA經驗,Scala入門也會有一定難度,但是可以慢慢補。

          所以總的來說Spark才足夠難,以至于需要學習。

          最后的最后我有一些建議。第一要對自己有一個系統的認知,自己的編程水平夠么,SQL會用么,Linux會用么,能流暢的看英文文檔么?

          如果上面任何一個問題的答案是No,我都不建議直接轉行或者申請高級的數據挖掘職位(因為你很難找到一個正經的數據挖掘崗位,頂多是一些打擦邊球的崗位,無論是實際干的工作還是未來的成長可能對你的幫助都不大)。

          無論你現在是學生還是已經再做一些前段后端、運維之類的工作你都有足夠的時間補齊這些基礎知識。

          補齊了這些知識之后,第一件事就是了解大數據生態,Hadoop生態圈,Spark生態圈,機器學習,深度學習(后兩者需要高等數學和線性代數基礎,如果你的大學專業學這些不要混)。

        【數據挖掘論文的參考文獻】相關文章:

        數據挖掘論文參考文獻范文08-21

        數據挖掘類論文參考文獻范例12-16

        淺談數據挖掘財務分析論文09-12

        淺談反病毒數據庫的數據分類挖掘論文07-08

        數據結構論文參考文獻07-30

        論計算機病毒數據庫的數據挖掘論文06-21

        計算機教學評價中數據挖掘的應用論文07-06

        辯證角度下金融時間序列數據挖掘研究論文06-15

        數據挖掘在股票估價的運用07-29

        国产高潮无套免费视频_久久九九兔免费精品6_99精品热6080YY久久_国产91久久久久久无码
      3. <sub id="h4knl"><ol id="h4knl"></ol></sub>
        <sup id="h4knl"></sup>
          <sub id="h4knl"></sub>

          <sub id="h4knl"><ol id="h4knl"><em id="h4knl"></em></ol></sub><s id="h4knl"></s>
          1. <strong id="h4knl"></strong>

          2. 亚洲欧洲在线另类 | 在线观看免费不打码 | 亚洲尤物在线精品一区 | 中日韩国语视频在线观看免费 | 亚洲福利国产精品合集在线看 | 色天堂在线观看 |