前言:尋找寫作靈感?中文期刊網用心挑選的數據挖掘技術在軟件工程的運用,希望能為您的閱讀和創作帶來靈感,歡迎大家閱讀并分享。
摘要:首先對數據挖掘技術的基本含義進行概述,從便于各項信息的了解、便于信息的正確錄入、利于縮短數據處理時間三個方面,對數據挖掘技術在軟件工程中的應用意義進行解析,并以此為依據,提出數據挖掘技術在軟件工程中的應用意義對策。
關鍵詞:數據挖掘技術;軟件工程;應用對策
1引言
隨著信息化時代的來臨,傳統信息處理技術已經無法滿足現代化信息處理需求,無法實現大量信息精準傳送和保存。數據挖掘技術的出現,可以將這一現象進行處理,實現各項信息的精準記錄和傳遞?,F階段,數據挖掘技術已經在各個領域中廣泛應用。軟件工程作為近幾年快速發展的產業,軟件工程發展往往和信息技術發展有著直接關聯。把數據挖掘技術運用到軟件工程中,能夠將數據挖掘技術自身作用全面激發,提升軟件工程研發效率,減少軟件工程管理成本投放,防止不必要問題的出現。由此可見,數據挖掘技術在軟件工程中應用,具備現實性意義。下面,本文將進一步闡述和解析數據挖掘技術在軟件工程中應用。
2數據挖掘技術的基本概述
從數據挖掘技術自身角度來說,其主要指一種現代化信息處理技術,和傳統信息處理技術進行比較,數據挖掘技術憑借自身強大的功能,在各個領域中廣泛應用。當前,數據挖掘技術沒有得到全面普及和推廣,大部分IT行業對數據挖掘技術應用價值缺少深入了解,依舊采用傳統信息處理技術,使得信息處理效率相對不高。通常情況下,數據挖掘技術中包含了數據處理、數據轉換、數據分析等功能,并且各個功能之間均存在一定關聯,能夠實現綜合評估[1]。針對部分軟件工程企業而言,通過將數據挖掘技術運用到軟件工程中,可以有效提升信息處理效率,防止不必要失誤出現,對企業穩定發展起到了重要作用。
3數據挖掘技術在軟件工程中的應用意義
3.1便于各項信息的了解
由于數據挖掘技術中包含了傳統信息處理技術中各個功能,通過把各種信息集中采集之后,根據數據類型進行分類管理。在這種信息采集方式的作用下,其涉及范疇更加廣泛,可以根據數據特性展開分析,能夠在大量數據中,構建完善的信息管理系統,便于快速獲取和查詢所需信息。通過把數據挖掘技術運用到軟件工程中,能夠把部分信息資源加以整合,以此讓企業全方位的掌握和了解各個數據。
3.2便于信息的正確錄入
數據挖掘技術中具備較強的運算功能,常規數據信息系統在開展運算工作時,消耗的時間成本比較多,甚至因為數據數量的龐大,使得運算系統出現崩潰。在數據挖掘技術的作用下,不會出現該問題,運算時間相對較短。同時,在進行數據運算的過程中,不會出現數據丟失或者混亂的現象,有效提升數據的完善性[2]。在大規模數據中,部分數據不具備應用價值,屬于垃圾數據,但是由于其保存在數據處理系統中,將會影響處理系統整體運行效率,而通過應用數據挖掘技術,能夠把垃圾數據從中剔除,把精準的數據錄入到數據系統中,保證數據整體質量。
3.3利于縮短數據處理時間
在數據挖掘技術中能夠實現數據轉換,把部分雜亂數據進行處理,變成試用形式,針對這些數據而言,能夠實現科學調用。在進行數據挖掘時,將會自主的選擇合適分析工作,對各個模糊數據進行清理,讓最終獲取的數據得到科學應用。之后根據獲取的相關數據,從各個角度入手,對其是否真實有效進行考核,把真實的數據進行整合,讓數據成為一種可讀模式。換言之,把分析結果當作新知識給管理人員提供參考。數據分析作為一項較為繁瑣的流程,其各個流程均要進行反復驗證才能得出,直到獲取最終運算結果。通過把數據挖掘技術運用到軟件工程中,能夠有效提升數據質量,減少應用時間。
4數據挖掘技術在軟件工程中的應用對策
4.1應用分析
4.1.1挖掘結構
數據挖掘技術在結構及流程代碼等方面應用流程如下。首先,檢測克隆代碼方法。從克隆代碼角度來說,主要指根據有關軟件工程云隱標準,將部分代碼進行復制的流程或者工具。假設在特殊情況下,還要綜合實際情況對部分代碼進行更改,同時對以上代碼進行管理和檢測,其目的就是防止部分故障傳遞,促進維護系統目標的實現。通過應用克隆代碼方式[1],能夠保證軟件系統的順利運行。當前,克隆代碼檢測方式主要有四種,第一種是標識符比較;第二種是文本對比;第三種是程序結構;第四種是度量[3]。每個克隆代碼檢測方式都具備特有的診斷和評估方式,在應用的過程中,應該根據實際狀況合理選擇。其次,Aspect挖掘法。該項技術是人們通過橫切關注點獲取的挖掘方式,在軟件工程中,通過應用Aspect挖掘法,能夠實現系統的改造。特別是在處理有關問題的過程中,能夠提供諸多方式,其中,形式概念及度量分析法可以起到理想的效果。上述方式均需要借助重新構建選集,才能將橫切點挖掘問題進行處理。并且,該項數據挖掘技術可以應用在各個領域,具備良好的應用功能。數據挖掘示意圖見圖2。
4.1.2軟件項目管理
要想把數據挖掘技術運用到軟件工程管理活動中,可以從兩個方面入手,一個是版本控制信息挖掘中涉及了對組織關系挖掘,另一個是版本控制信息挖掘。從軟件工程管理角度來說,其自身具備明顯的系統及繁瑣特性,對組織關系挖掘有著較高的標準,是促進各項資源科學調配和應用的依據。把整個軟件工程管理流程當作主體,根據形成的電子郵件及共享文件,對數據實施挖掘,能夠形成各個工種人員組織關系,防止流程混亂現象出現,確保軟件工程管理工作有序落實[4]。除此之外,版本控制能夠促進對文件內部信息變化情況的記錄,并將其當作用戶掌握版本內容的依據。通過將數據挖掘技術運用到版本控制信息中,能夠有效減少系統維護成本投放,并且還能發揮警示效果,將系統修復環節中各項披露現象進行體現,從而促進軟件工程管理水平的提升。
4.1.3軟件開發
數據挖掘技術最初主要是把數據庫當作基本進行發展的,隨著其快速發展,已經由之前的理論逐漸發展到實際應用中,并且在實際應用中逐漸形成了更多深層次的科學和內容,實現一同發展。軟件工程作為一個工程化學科,能夠結合各個項目指標、資金及用戶需求研發出新型的產品。在以往軟件工程中,開發流程較為繁瑣,但是隨著時間的發展,其逐漸發展起來,并且得到了各個領域的應用,應用性得到了大幅度提升。把數據庫挖掘技術運用到軟件工程中,在數據庫信息的作用下,能夠保存諸多具備探究價值的內容,對軟件工程開發今后發展起到了現實性意義。此外,軟件工程能夠掌握諸多信息挖掘內容,應用范疇較為廣泛。軟件工程版本能夠把軟件開發過程中各項信息進行統一處理,確保數據在軟件開發環節中做到實時更新,保障軟件開發質量?,F階段,軟件開發更換數據信息中涉及了數據挖掘等內容,能夠實現軟件內部的劃分,便于及時找出存在問題并處理,保證軟件開發目標的快速實現。
4.1.4故障檢測
從故障檢測角度來說,對程序執行記錄實施數據挖掘,能夠提供程序交互模式以及說明,而上述信息均能夠給軟件故障定位及檢查提供憑證。針對程序說明數據挖掘而言,也就是對信息追蹤及逆向建模的過程,通過對流程的深入了解及優化,可以給后續維護管理工作開展提供條件[5]。現階段,廣泛應用的挖掘方式主要以常規方式為主,通過對程序行為挖掘,找出對應流程,并根據事態落實進行表述。
4.2應用方式
4.2.1分類
數據挖掘技術中包含了大量的分類方式,主要集中于對同種預測分類標號的執行動作。在實際過程中,一般應該通過建立對應分析模型,并提前結合對應流程標準輸入相關數據,以此將其當作分析模式應用依據?,F階段,數據挖掘技術在軟件工程應用的分類方式中,采用的分類方式主要有神經網絡分類法、判斷樹法、貝葉斯分類法以及支持向量機等幾類[6]。其中,判斷樹法在分類方式應用過程中,利用貪心算法將其當作邏輯依據,秉持由上至下的標準實現判定樹框架的構建,而判定樹中涉及了諸多子節點,各個子節點均代表對應的軟件類別符號。
4.2.2聚類
聚類主要指,把探究環節中包含的各個數據,根據相關標準進行細化,細化成各個類型的流程,以此在保證相同類型對象之間具備較強相似性的同時,還能讓不同類型對象之間具備明顯差異。聚類和分類在本質上存在一定偏差,聚類過程劃分對象往往為不可預測性,也就是無指導學習方式。聚類分析方式在其他算法處理過程中,應用范疇較為廣泛,特別是數據分析獨立性方面有著重要意義,不但能夠充分挖掘孤立點,同時還能提升檢測結果的真實性和精準性。
5結語
總而言之,隨著信息化時代的來臨,數據挖掘技術作為一種數據處理、找尋目標信息的重要方式,通過把數據挖掘技術運用到軟件工程中,從軟件開發、軟件工程管理、程序代碼等方面入手,加強數據挖掘,將數據挖掘作用充分發揮,在提升數據挖掘質量的同時,縮短開發時間,減少不必要成本投放,從而給我國軟件工程企業創造理想效益,實現軟件工程行業穩定發展。
參考文獻
[1]李孟臻.淺析軟件工程行業中數據挖掘的應用[J].中國新通信,2018,20(16):98.
[2]王藝霏.計算機軟件工程數據挖掘及發展趨勢研究[J].電腦知識與技術,2018,14(14):261-262.
[3]蒯天宇.數據挖掘技術在軟件工程中的應用[J].數字技術與應用,2018,36(05):112-113.
[4]段彬,魏巍.數據挖掘在軟件工程領域中的應用淺析[J].信息系統工程,2018(04):89.
[5]劉超.軟件工程數據挖掘研究進展[J].農家參謀,2018(03):201.
[6]譚薇.芻議軟件工程中數據挖掘技術的實踐運用[J].科技創新與應用,2016(30):97.
作者:程志平 徐涢基