數據挖掘的區域經濟數據分析系統設計

前言:尋找寫作靈感?中文期刊網用心挑選的數據挖掘的區域經濟數據分析系統設計,希望能為您的閱讀和創作帶來靈感,歡迎大家閱讀并分享。

摘要:在區域經濟分析中,由于分散化的數據庫形式以及多源異構的數據類型,使得對區域經濟數據的分析,難以獲得令人滿意的效果。基于區域經濟特征,提出采用Multi-Agents分布式數據管理模式來構建區域經濟分析的數據挖掘應用框架,通過XMLWebService技術和XML格式訪問建立系統的四層結構體系,實現多數據庫訪問Agent來集中管理數據訪問,并引入Microsoft時序算法和期望最大化算法進行異構采集和數據挖掘。采用C#語言開發區域經濟數據分析系統,實現對不同數據庫數據的采集、數據挖掘、結構展示,為用戶提供跨數據庫平臺的數據共享環境。

關鍵詞:區域經濟;數據挖掘;Multi-Agents;分布式數據管理

區域經濟作為國民經濟的重要組成部分,是地區社會活動活力的主要體現[1]。由于區域經濟在國民經濟中扮演著重要的角色,區域經濟是社會各領域重點關注和普遍研究的領域。中國作為一個地域、人口大國,經濟發展內向程度高,經濟系統及其復雜,不同部門、不同領域在日常經濟活動中均產生大量經濟數據,分散化的數據以不同格式、不同類型存在在各經濟部門數據庫中[2-4]。如何從多源異構數據尋找到有用的信息,為區域經濟的發展提供數據支撐,成為函待解決的關鍵問題[5-7]。數據挖掘是從海量的、不完全、模糊的異構數據中提取隱藏在其中的有潛在價值的信息和知識過程[8]。目前,比較成熟的數據挖掘技術主要有遺傳算法[9]、人工神經網絡[10,11]、鄰近搜索方法[12]等,通過在大量數據中提取隱含規則和信息,為區域經濟的發展推進策略提供分類指導、分區推進的技術支持[13]。基于此,本研究根據區域經濟系統的特點,提出一種基于Multi-Agents數據挖掘技術的區域經濟系統,將數據挖掘算法應用于區域經濟分析中,把握地區發展方向和進程,提高區域規劃的及時性和有效性。

1Multi-Agents的區域經濟分析

1.1Multi-Agents技術

Agent是能夠感知環境、接收環境消息并作出反應,進而反作用環境中的一種實體[14]。在移動互聯網數據挖掘中,將Agent看作是一種能在異構網絡中有一臺主機前移到另一臺主機實現資源交互的程序。而Multi-Agents是通過多個Agent組成的集合,系統中各Agent根據具有的知識對外界刺激作出反應,并獲取新的消息更新自身狀態,通過消息獲取和數據交互來完成任務。由于Multi-Agents系統的Agent都是相互獨立的,各Agent間、Agent與環境間通過通訊、協商和協作共同完成系統數據的采集、傳輸、分析和評價[15]。Multi-Agents系統在異構、分布控制、解決多個關聯性任務場合具有較高的可靠性,可動態對系統任務進行分解。根據區域經濟系統的特點,結合數據挖掘系統結構,將Multi-Agents技術應用于區域經濟系統,建立基于Multi-Agents的區域經濟應用框架如圖1所示。從Multi-Agents應用框架可以看出,整個系統被劃分為了數據處理模塊、挖掘挖掘引擎、模式評估、知識庫系統4個部分。數據處理模塊將區域經濟數據庫基礎數據提取、過濾、轉化為數據庫要求數據文件。數據挖掘引擎包括關聯規則、聚類算法等數據挖掘工具。模式評估根據知識庫相關知識,對獲得的結果評估。知識庫中存取經濟領域知識,將獲得的數據評估結果與知識庫相關領域比較,用以指導數據挖掘執行。Multi-Agents的區域經濟數據挖掘通過分布在網絡中的多個Agent完成各區域經濟事務的數據服務,將各Agent挖掘信息匯總,與綜合分析系統形成交互機制,分析區域經濟現狀成因、宏觀調控有效性等,各Agent智能間采用聯邦式協同挖掘機制[16]。

1.2Multi-Agents的數據處理

在區域經濟數據庫中,選擇某些經濟事務的相關數據,對數據進行預處理,通過數據分析和挖掘獲得準確的結果來指導區域經濟發展成為關鍵點。由于區域經濟分析基本是在過往數據基礎上進行[17],因此,首先選擇Microsoft時序算法對經濟數據分析挖掘并預測經濟指標,再通過聚類算法對選定的預測指標相關的數據進行挖掘分析。

1.2.1Microsoft時序算法

自回歸是在特定的時間點t內,根據過往的時點計算,獲得當前時刻的預測值。因此,考慮n個以前時點,獲得當前時刻點t的函數關系為:Xt=a1Xt-1+a2Xt-2+⋯anXt-n+εt(1)式中,Xt為t時刻的預測值,ai為i時刻點的自回歸系數,εt為閾值,通常取0~1。采用自回歸時序算法的關鍵是將系統內部不同時間序列轉化為多個事件,創建一個行列允許算法根據過往值獲得當前某一時刻的計算值。確定自回歸系數采用最小化建模時間序列與觀察時間序列的均值。

1.2.2Microsoft聚類算法

當數據分組不明顯時,采用Micorsoft聚類算法從數據中尋找自然分組。聚類算法創建一組聚類,假設該聚類為正確的,并將事例分布到每一個聚類,建立了正確的模型[18]。將需要訓練數據的事例隨機分配到模型中進行合適的聚類,并通過不斷調整使之與現實世界相適應,直至某個事例不在滿足提前設置的終止條件或不在聚類間,此時該模型與實際相符,處于一個準確狀態。在聚類算法中,采用期望最大化算法(Expectationmaximization,EM)將事例分配到聚類中。即便對于一個包含m個元素和d個連續屬性的數據庫D,假設每事例x∈D,計算x屬于每一個聚類h=1,2,⋯,k的概率:Wjh(x)=ωjh⋅fh(x|μjh⋅∑hj)∑iωji⋅fi(x|μji⋅∑ij)(2)其中,ωjh為數據庫中記錄屬于聚集h的權重,fh為第h聚集的成分密度函數;μjh為聚集h中構成的j維向量。將獲得的元素概率結果放入到模型中,更新混合模型參數值:wj+1h=∑x∈Dwjh(x)(3)設函數Φw||k,μk,∑k,建立函數關系判別式:L(Φ)=∑x∈Dlog∑h=1kwh⋅fh(x,μk,∑k(4)當模型結果滿足:L||(Φj)-L(Φj+1)≤ε時,停止模型調整,否則j←j+1,計算另外事例的概率值。EM算法通過度量某對象的概率來決定該對象屬于哪個類別[19]。算法將每一維作為鐘型曲線計算標準差和均差,當某點落入鐘型曲線內,則表示該點以計算的概率分為某一個聚類。由于各聚類曲線可重疊,因此該點也可以屬于其他聚類,但聚類概率不同,存在模糊邊界,表征實際參數間存在的相互關聯關系,因此可通過統計每個對象的聚類概率進行結果預測。

2Multi-Agents的區域經濟系統

2.1系統軟件結構

創建區域經濟分析系統的重點是解決異構數據格式和數據服務方式的統一[20]。本研究選擇采用XMLWebService技術實現數據服務Agent,以XML格式文件作為系統數據的表達方式。XMLWebService是一個與具體開發工具和平臺無關的標準,XMLWebService采用SOAP協議,并通過http來調用。利用XMLWebService建立網絡中的服務節點,響應數據請求,進而形成具有標準傳輸接口的數據庫“黑盒”服務節點[21]。XML作為用戶數據服務標準格式,實現數據在網絡上的無損傳輸,形成網絡共享的數據庫服務數據流[22]。通過XMLWebService技術和XML系統數據表達方式建立區域經濟分析系統結構框架如圖2所示。系統被分為四層結構,分別為數據庫層、數據庫服務擴展層、異構數據庫服務層、用戶應用層。數據庫層作為系統最底層,既可作為異構數據庫系統的底層數據源,也可作為網絡中數據服務節點。數據庫層作為系統共享資源,應該能為系統提供可視化數據圖表信息,同時根據用戶訪問權限的不同將數據分為共有或私有數據,強化數據庫的訪問安全性。數據庫服務擴展層主要為系統提供數據服務資源結構,為數據信息共享提供數據服務,并根據功能需求進行數據提取,以XML形式屏蔽不同數據庫間的差異,提供統一的數據格式響應,并將數據交付給上一層。異構數據庫數據服務層通過系統服務里列表記錄不同數據庫數據服務,并實時更新數據庫數據,提供全局數據服務視圖響應用戶服務請求,建立全面的數據服務平臺將數據服務分解,向下層傳遞請求信息,并根據下層數據庫返回的信息進行再加工,生成滿足用戶要求服務數據。用戶應用層通過互聯網進行數據服務請求。用戶應用層可以對數據庫服務擴展層、異構數據庫層進行管理,通過數據庫服務擴展層的全局數據服務為用戶提供面向系統的數據服務,這種服務屏蔽掉平臺系統的差異,在異構數據庫層提供全局的共享平臺。通過系統的4層網絡結構,為用戶提供基于互聯網的XMLWebService數據服務體系,用戶能夠在異構數據庫進行數據采集、加工和數據整合,建立透明的數據綜合服務平臺。

2.2區域經濟分析系統實現

針對系統結構框架,采用C#語言開發區域經濟數據分析同。系統開發工具為:NET集成開發平臺,服務器采用WindowsServer2016服務器,采用MySQL數據庫。系統硬件標準為:PIII/1G以上CPU,內存16G以上,操作系統Windows10。數據庫軟件:MySQL數據庫。數據挖掘采集過程中采用Micorsoft聚類的期望最大化算法抓取Agent系統文本內容,采用XMLwebService技術實現數據服務,由XML作為用戶數據存儲和傳輸。

2.2.1數據采集功能

以某個金融行業數據庫為基礎,進行進入系統的數據分析,由于金融機構所屬行業眾多,金融數據差異性極大,采用Micorsoft支持的時序算法抓取數據,系統保留數據源,并對數據應用層進行數據更新,圖3為數據采集界面。

2.2.2數據挖掘功能

用戶根據采集到的數據,由需求分析,選擇Micorsoft聚類算法進行數據挖掘技第四層數據服務列表第三層HttpHttpHttpHttpHttpHttpHttpHttpHttp數據服務列表數據服務列表InternetXMLWebService異構數據庫第二層第一層XMLWebService數據服務XMLXMLXMLDB1DB2DB3XMLWebService數據服務XMLWebService數據服務圖2區域經濟分析系統結構設計術,根據用戶執行命令獲取異構數據庫中信息,并進行數據挖掘,并將挖掘的數據信息在界面顯示,每一次挖掘出來的數據,系統都會詳細羅列出來,用戶能查詢每項數據的詳細信息,圖4為數據挖掘界面。

2.2.3數據監控功能

為加強對數據的管理,系統開發了數據監控功能,數據監控功能包括數據的選擇、監控信息反饋、進度查看等子功能。用戶在進行數據監控時,首先確定監控數據,然后由系統應用層對全局覆蓋監控數據,用戶能查看到數據實時狀態,并將最終反饋發送至數據服務層,如圖5所示。

3結論

區域經濟是經濟社會活動普遍存關注的問題,對地方尋求經濟振興、中央制定宏觀決策具有重要參考作用。而區域經濟涉及海量的多源異構數據,如何從分散化的數據庫異構數據中提取有價值的經濟數據成為難點。在充分認識區域經濟特征基礎上,從分布式網絡管理體系結構入手,基于Multi-Agents的分布式數據管理模式和協作方式,建立起區域經濟分析的數據挖掘應用框架,采用Microsoft時序算法和期望最大化算法進行系統數據的采集和數據挖掘,并以通過XMLWebService技術實現數據服務Agent,以標準XML格式進行數據訪問,創建一個多數據庫訪問Agent來集中管理數據訪問,為用戶提供跨數據庫平臺的數據共享環境。

作者:程童 單位:陜西警官職業學院基礎部

亚洲精品一二三区-久久