數據挖掘技術在經濟統計中的應用論文
隨著我國社會經濟的全面發展,經濟統計數據的工作量也逐漸加大。然而傳統的數據處理方式卻不能滿足實際工作的需要,拖后了經濟工作的步伐,由于這一系列問題得不到很好的解決,人們在探索的過程中就逐步產生了數據挖掘技術。
1、數據挖掘技術的概念、功能及優點
數據挖掘(Data Mining),從名字來看就是從大量復雜的數據信息中挖掘出有利用價值的信息。通常,這些大量的復雜的數據信息都被認為是隨機的、模糊的、不完全的、有噪音的,完全沒有進行處理的信息。然而經過挖掘之后,這些原本看似沒有任何利用價值的信息,就會呈現出一種新穎、有效、潛在有用的狀態,最終為人們的生活與生產提供便利。這種信息數據的處理變化過程,就常常被稱作是數據挖掘。它也可以理解成是在一些觀察數據或事實的集合中找正確模式的決策支持過程。數據挖掘是一門涉及面極其廣大的交叉學科,它可以簡單的認為是經濟信息轉換的一個過程,同時它還包含了機器學習、模式識別、數據庫、數理統計、神經網絡、模糊數學等相關技術。
數據挖掘的大體步驟是:數據的準備、數據的挖掘、結果的分析。在這樣一個完整的過程中,處于核心地位的就是數據的挖掘。而它的功能主要包括數據的聚類、模型的預測、分析等。除此之外,在挖掘信息數據的過程中,通常還會牽涉到其它方面的技術,比如鏈接分析、聚集檢測、關聯規則等。
數據挖掘主要功能有:預測模型、分類、數據聚類、數據總結、關聯規則發現、依賴關系或依賴模型發現、序列模式發現等。根據數據挖掘技術的作用和特點來看,它具備的優點是:它具有自動找出有價值的數據信息的功能;它能夠處理大量的數據信息;它反映數據信息快速有效;它能夠有效的對數據信息進行分析與評判,描繪過去和未來。
2、數據挖掘在經濟統計中的體現
對于經濟統計問題,對于我們所要探究的問題一定要定義,并且確定此次數據挖掘的目的。1.數據準備。就是對我們即將要面對的經濟問題中所涉及到的數據進行相應的采集,做好預處理這些工作,最終使數據得到簡化,使后續工作能順利進行。2.數據挖掘。根據數據的特點以及數據的類型選擇相適應的算法,利用統計、人工智能等方法,去挖掘有利用價值的信息3.結果分析。對第二步得到的結果進行充分的分析和評估,同時也是通過這一步驟反過來去調整上面,來得到更好的方法,從而讓結果更加真實。4.知識的運用。將得到的最符合實際的結果應用到現實的經濟問題中去,使得經濟能更好的運行和發展。
3、數據挖掘技術在經濟統計中的可行性研究
3.1 能為經濟統計提供有效的服務
數據挖掘技術雖然經歷的時間不是很長,然而,它的研究與應用水平已達到了一種相對穩定的狀態。隨著科學技術的不斷發展,數據挖掘技術在各國也普遍受到關注,特別是在經濟統計領域。數據挖掘技術能夠這樣的的迅速發展,在很大程度上也是依賴于它對經濟統計的有效服務。
3.2 能夠為經濟統計的不同需要提供不同的需求
目前,最常見的數據挖掘工具主要有綜合工具、通用型工具、和面向特定應用的工具。綜合工具,不僅能夠為處于商業中的經濟體拿出有效的管理報告,并且還能夠對普通經濟結構中的數據信息經行深入挖掘。通用型工,在市場上占最大比例,在應用方面最為成熟的挖掘工具。面向特定應用工具,從字面來理解,這種工具就是針對特定領域來提供服務的,具有很強的.特別性。
3.3 建立宏觀經濟數據庫,為數據挖掘的應用提供了良好的電子平臺
在目前的情況下,全國范圍內的大部分經濟統計部門主要使用的還是應用統計系統。大部分經濟統計的數據信息都處于一種不相聚分散的狀態,并沒有形成一套有效的管理系統。經濟統計過程中一旦出現問題,嚴重的就會導致經濟數據的有效性與準確性受到影響。然而,當建立了宏觀經濟數據庫以后,以上問題就可以尋找到有效的解決辦法。當宏觀經濟數據庫與數據挖掘技術一起合理運用,就能保證挖掘到的信息準確、真實。這樣的情況下,在經濟統計中數據挖掘技術就能為其提供更好的服務,不僅滿足了現實中經濟發展的需要,同時也為經濟決策的制定提供了準確、重要的依據。
4、數據挖掘在經濟統計中的應用
正是由于對數據的大量收集、數據算法的產生、經濟數據庫的出現、先進的計算機技術、對數據進行精深統計方法計算的能力、數據訪問速度的提升等一系列東西的出現,使得數據挖掘技術的作用越來越廣泛。由于經濟統計中數據的實用性和準確性的需要,數據挖掘技術也開始慢慢在經濟統計中大展身手。數據挖掘技術的主要方法有:
4.1 統計分析法
經濟數據庫字段項之間存在兩種關系,相關關系和函數關系。就是對于數據庫中的信息利用統計學原理來進行分析。
4.2 決策樹
決策樹一般用于預測模型,通過對大量復雜無順序的數據有目的分類,找到有價值的信息。同時,正是因為描述簡單,分類速度快,特別適合運用于經濟運行過程中出現的大規模數據的處理。
4.3 遺傳算法
它是一種根據生物遺傳機理和自然選擇的隨機搜索算法,其主要思路是依據特定的社會問題,然后在指定對象中去采集相關信息,最后通過對信息中隱含部分的歸整、分析,進而得到結果。經濟問題不是固定不變的,相反它是一個不斷發展變化的問題,內部的聯系千絲萬縷,改變其中一項其他的也會相應改變。按照遺傳算法的步驟,從源頭開始,我們就一步步向下探索,去提取信息數據,對整體進行分析,這樣就能把經濟問題目標化、具體化、直接化,使得在研究問題時可以更加直觀,把隱性的表現出來,使得經濟統計工作更加直白、簡單。
4.4 粗集理論法
這是一種探究不確定知識、不精確的數學工具,它通過上下集比較而出來結果。它易于操作,算法簡單;簡化輸入信息的表達空間;不需要給出額外信息。特別適合那些不確定的經濟因素,同時正是通過這種原則,才能使得制定的經濟決策與需求更加接近,為獲得最大利益化給予了強有力支持。
4.5 神經網絡法
神經網絡法是一種高強度模擬人腦加工信息過程的智能現代信息技術。它和人的神經運動過程一樣,首先進行數據的輸入,然后進行精準的分析,最后輸出。在經濟統計過程中得到了實際的應用。神經網絡法為我們提供了一種準確的、完整的處理經濟統計的過程,使得經濟運行模式和人在處理信息的過程很相像,一樣實用化、形象化、具體化。使經濟過程中各個部分之間能取得更好的聯系,從而獲得對經濟統計題的處理辦法。
5、結束語
隨著數據挖掘技術的發展,社會中利用數據挖掘技術的領域也越來越多。數據挖掘運用在經濟統計領域,能有效地提高經濟統計信息中資源的利用價值。通過長期的實踐表明,采用數據挖掘技術能夠使經濟統計工作獲得明顯的、不斷的進步,結果也更加的準確、清晰,在國家財富的積累、社會經濟發展中都起到了重要的作用。
【數據挖掘技術在經濟統計中的應用論文】相關文章: