大數據時代計算機網絡安全技術探究

前言:尋找寫作靈感?中文期刊網用心挑選的大數據時代計算機網絡安全技術探究,希望能為您的閱讀和創作帶來靈感,歡迎大家閱讀并分享。

大數據時代計算機網絡安全技術探究

摘要:傳統的計算機網絡技術已經不能夠滿足計算機網絡安全需求,大數據技術本身能夠實現對海量數據信息的有效挖掘、整合、分析,在網絡安全方面有著先天優勢。在網絡安全信息挖掘方面,大數據技術支持對海量網絡數據的高效率挖掘;在網絡信息數據處理方面,大數據技術實現了對非結構化數據的關聯性分析。信息安全問題在大數據時代已經轉變為一個數據分析問題,大數據技術所具有的特性能夠滿足當下計算機網絡的安全保障需求。

關鍵詞:大數據;計算機網絡;安全技術

據Gemalto的《數據泄露水平指數(BreachLevelIndex)》,僅2018年上半年,全球就發生了945起較大型的數據泄露事件,共導致45億條數據泄露,與2017年相比增加了133%。傳統的網絡安全技術方法存在諸多不足,新興的威脅也對網絡安全檢測提出了更高的要求。大數據技術本身能夠實現對海量數據信息的有效挖掘、整合、分析,在網絡安全方面有著先天優勢。

1大數據技術和計算機網絡安全技術整合的必要性

網絡安全分析的數據量正從TB朝著PB發展,數據的內容更加細化、數據分析的維度更為多元、信息數據的發送速率也在逐步提升,0day等漏洞日益增多,多階段組織式APT攻擊發生也越發頻繁,對計算機網絡安全提出了更高要求。傳統計算機網絡安全技術在數據儲存方面主要采用“結構化數據庫”,數據的儲存成本相對較高。儲存時間較長的數據容易丟失,尋本溯源較為困難,尤其是對體量較大、降噪較為困難的數據,分析效率極為低下,數據分析的準確性也難以得到保障[1]。大數據技術支持海量非結構化數據的整合、分析、儲存、計算,相較于傳統的數據庫分析技術,處理成本更低、安全投入更低、對于非結構化數據的分析效率更高、檢測的相應速度更快。同時,大數據技術能夠實現精準化挖掘,支持對多維度非結構化數據的關聯性分析[2]。大數據技術和計算機網絡安全技術的整合是必然的發展趨勢。

2大數據技術在計算機網絡安全分析中的應用

根據計算機網絡的運作特征,網絡安全分析主要針對計算機數據流量、日志、漏洞等對象,輔助參考用戶行為、業務行為、應用行為、外部情報等方面。傳統的數據庫分析技術,主要包括惡意代碼檢測、僵木蠕檢測、異常流量檢測、Web安全分析等內容,在整合大數據技術后,就能夠在保證可靠分析的基礎上,實現不同結構數據和訪問日志的整合,達成高效率的儲存、檢索、分析、挖掘。尤其是針對APT、0day等傳統計算機網絡安全技術難以防范的攻擊類型,大數據技術在檢測、分析方面的優勢更為突出[3-4]。在網絡安全信息挖掘方面,大數據技術支持對海量網絡數據的高效率挖掘,同時整合Scribe、Flume、Chukwa等工具,采用“分布式挖掘”的方式,對網絡信息數據的挖掘速度可達到每秒數百兆。為了滿足不同需求的數據儲存,提高數據分析、數據查詢的效率,大數據技術可有效應用Gbase、Hbase等儲存方式,同時利用Hadoop分布式計算架構、Spark計算架構、Storm計算架構,實現分析數據的有效分配、儲存,為高效率的數據分析處理奠定了基礎[5]。在網絡信息數據處理方面,針對數據的實時化分析,大數據技術能夠在利用Spark、Storm、Hadoop計算架構的基礎上,整合complexeventprocessing技術,實現對非結構化數據的關聯性分析,發現計算機網絡在運作過程中存在的異常狀況。

3大數據技術和計算機網絡安全技術整合分析平臺

大數據技術在分析、儲存、檢索方面有著傳統技術方法所不具備的優勢,能夠有效提高數據的分析效率,并具備從海量信息數據中挖掘安全問題、安全隱患的能力。以一種大數據技術和計算機網絡安全技術整合的分析平臺為例,可以更清楚地理解大數據技術的優勢。

3.1基于大數據技術的網絡安全分析平臺架構

如圖1所示,基于大數據技術的網絡安全分析平臺,架構從上而下分別為數據采集層、數據儲存層、數據挖掘層、數據呈現層。從數據的類型上來看,平臺幾乎涵蓋了計算機網絡在運行過程中可能會產生的所有信息,如DNS流量信息數據、Netflow流量信息數據、用戶行為信息、網絡配置信息、Web應用信息等。數據儲存層通過分布式儲存,能夠實現對多樣化非結構數據的長期儲存。在分析平臺上,數據采集、數據儲存、數據挖掘分析、數據呈現可構成一個完善的整體。

3.2關鍵技術方法

數據挖掘技術:主要實現對網絡數據的在線分析以及對日志信息、流量信息的離線統計,信息數據的統計主要借助于Hive實現。從圖1可看到,為統一在線信息的采集以及離線信息的采集,平臺整合了Strom、Kafka計算架構。在整合在線信息數據、離線信息數據時,實現分布式、非結構、可靠、高效率的海量信息聚合、采集,對數據經過整合處理后,將數據發送至相應的分布儲存點[6]。和一般數據挖掘方法不同,平臺利用Kafka來保證對流式數據的有效處理,Strom則能夠對各種實時消息進行分布式處理,使得計算機網絡在運作的過程中不間斷進行數據讀取、發送、儲存。數據儲存技術:挖掘出的網絡信息數據主要儲存在HDFS中,HDFS是目前較為成熟的分布式文件儲存技術,能夠在不同的數據節點儲存不同種類的非結構化數據,對于海量的信息數據,HDFS還支持數據的相互導入。數據分析技術:平臺數據分析利用MapReduce實現,MapReduce本身是一種較為成熟的編程模型,多用于對大于1TB數據集的并行運算,提供了一個龐大的數據計算框架,在這個框架下,數據分布存儲、數據通信、容錯處理均能夠實現。平臺還應用了Hive對數據進行統計,并利用HDFS對非結構化數據進行快速的檢測、查詢。

4結語

信息安全問題在大數據時代已經轉變為一個數據分析問題。當前網絡信息數據的規模不斷增長,數據的類型越來越繁多,現有的網絡安全技術難以實現精細化的高效分析。大數據技術所具有的特征能夠滿足當下計算機網絡的安全保障需求。

參考文獻:

[1]趙亮.淺談基于大數據時代的計算機網絡安全技術應用[J].信息技術與信息化,2019,(09):135-137.

[2]尹智.網絡安全探討大數據技術及其在計算機信息系統中的運用[J].數碼世界,2019,(09):262.

[3]李瑋.探索大數據時代計算機網絡安全的影響因素與預防措施[J].網絡安全技術與應用,2019,(09):9-10.

[4]劉昕林.一種基于大數據的網絡安全防御系統研究與設計探討[J].科學技術創新,2019,(26):96-97.

[5]黨會博.借助大數據對網絡安全事件自動分析與深度挖掘研究[J].無線互聯科技,2019,16(14):17-18.

[6]秦婭,申國偉,余紅星.基于Hadoop的大規模網絡安全實體識別方法[J].智能系統學報,2019,14(05):1017-1025.

作者:唐明雙 單位:長春工程學院

亚洲精品一二三区-久久