前言:尋找寫作靈感?中文期刊網用心挑選的大數據時代下信息安全論文,希望能為您的閱讀和創作帶來靈感,歡迎大家閱讀并分享。
1“大數據”的內涵
1.1“大數據”定義
所謂大數據(bigdata),或稱巨量資料,通常情況下,是指涉及的資料規模龐大,在現有的技術條件的基礎上,難以通過主流軟件,在合理時間內對其進行擷取、管理、處理。對于“大數據”來說,其特征主要表現為:一是數據量(volumes)大,在實際應用中,把多個數據集放在一起,形成PB級的數據量。根據IDC(國際數據公司)的監測統計,2011年全球數據總量已經達到1.8ZB;二是數據類別(variety)大,數據來自多個數據源,無論是種類,還是格式,數據日趨豐富,以前所限定的結構化數據范疇等,已經被沖破,半結構化和非結構化數據早已囊括其中;三是數據處理速度(Velocity)快,在數據量非常龐大的情況下,能夠對數據進行實時的處理;四是數據具有較高的真實性(Veracity),隨著社交數據、物聯計算、交易與應用數據等新數據源的興起,沖破了傳統數據源的局限,在這種情況下需要有效的技術,進一步確保數據的真實性、安全性。
1.2“大數據”技術
“大數據”的價值不只在于其數據量之大,更大的意義在于通過數據采集、處理、分析、挖掘等技術對“大數據”的屬性,包括數量、速度、多樣性等等進行分析,能獲取很多智能的、深入的、有價值的信息。而這些信息提取過程可大致分為以下三個階段。
1.2.1數據輸入
將分布的、異構數據源中的關系數據、平面數據等數據進行采集抽取,然后對其進行清洗、轉換、集成等,最后將數據加載到數據倉中,進而為數據聯機分析、挖掘等處理奠定基礎。其特點主要表現為并發數高,因為成千上萬的用戶有可能同時訪問、操作數據,比較典型的就是火車票售票網站、淘寶等,在峰值時,它們并發的訪問量能達到上百萬,在這種情況下,在采集端需要部署大量數據庫。
1.2.2數據處理
“大數據”技術核心就是數據挖掘算法,基于不同的數據類型和格式的各種數據挖掘的算法深入數據內部,快速地挖掘出公認的價值,科學地呈現出數據本身具備的特點。并根據用戶的統計需求,對存儲于其內的海量數據利用分布式數據庫或分布式計算集群進行普通的分析和分類匯總等。其特點主要表現為用于挖掘的算法比較復雜,并且計算涉及的數據量和計算量都很大,常用數據挖掘算法都以單線程為主。
1.2.3數據輸出
從“大數據”中挖掘出特點,科學的建立模型,通過導入數據,以得到用戶需要的結果。這已在能源、醫療、通信、零售等行業有了廣泛應用。
2“大數據”安全隱患
“大數據”時代,數據量是非線性增長的,隨著數據價值的不斷提高,黑客對于數據的覬覦已經由原來的破壞轉變成竊取和利用,病毒或黑客繞過傳統的防火墻、殺毒軟件、預警系統等防護設備直接進入數據層,一些高級持續性攻擊已經難以用傳統安全防御措施檢測防護。“大數據”的安全風險主要可以分為以下兩個方面。
2.1從基礎技術角度看
NoSQL(非關系型數據庫)是“大數據”依托的基礎技術。當前,應用較為廣泛的SQL(關系型數據庫)技術,經過長期的改進和完善,通過設置嚴格的訪問控制和隱私管理工具,進一步維護數據安全。在NoSQL技術中,沒有這樣的要求。而且,對于“大數據”來說,無論是來源,還是承載方式都比較豐富,例如物聯網、移動互聯網、車聯網,以及遍布各個角落的傳感器等,通常情況下,數據都是處于分散存在的狀態,難以對這些數據進行定位,同時難以對所有的機密信息進行保護。
2.2從核心價值角度來看
“大數據”技術關鍵在于數據分析和利用,但數據分析技術的發展,對用戶隱私產生極大的威脅。在“大數據”時代,已經無法保證個人信息不被其他組織挖掘利用。目前,各網站均不同程度地開放其用戶所產生的實時數據,一些監測數據的市場分析機構可通過人們在社交網站中寫入的信息、智能手機顯示的位置信息等多種數據組合,高精度鎖定個人,挖掘出個人信息體系,用戶隱私安全問題堪憂。
3“大數據”安全防范
由于“大數據”的安全機制是一個非常龐大而復雜的課題,幾乎沒有機構能一手包攬所有細節,因此業界也缺乏一個統一的思路來指導安全建設。在傳統安全防御技術的基礎上,通過對“大數據”攻擊事件模式、時間空間特征等進行提煉和總結,從網絡安全、數據安全、應用安全、終端安全等各個管理角度加強防范,建設適應“大數據”時代的安全防御方案,可以從一定程度上提高“大數據”環境的可靠度。
3.1網絡安全
網絡是輸送“大數據”資源的主要途徑,強化網絡基礎設施安全保障,一是通過訪問控制,以用戶身份認證為前提,實施各種策略來控制和規范用戶在系統中的行為,從而達到維護系統安全和保護網絡資源的目的;二是通過鏈路加密,建立虛擬專用網絡,隔離公用網絡上的其他數據,防止數據被截?。蝗峭ㄟ^隔離技術,對數據中心內、外網絡區域之間的數據流量進行分析、檢測、管理和控制,從而保護目標數據源免受外部非法用戶的侵入訪問;四是通過網絡審計,監聽捕獲并分析網絡數據包,準確記錄網絡訪問的關鍵信息;通過統一的策略設置的規則,智能地判斷出網絡異常行為,并對異常行為進行記錄、報警和阻斷,保護業務的正常運行。
3.2虛擬化安全
虛擬機技術是大數據概念的一個基礎組成部分,它加強了基礎設施、軟件平臺、業務系統的擴展能力,同時也使得傳統物理安全邊界逐漸缺失。加強虛擬環境中的安全機制與傳統物理環境中的安全措施,才能更好地保障在其之上提供的各類應用和服務。一是在虛擬化軟件層面建立必要的安全控制措施,限制對虛擬化軟件的物理和邏輯訪問控制;二是在虛擬化硬件方面建立基于虛擬主機的專業的防火墻系統、殺毒軟件、日志系統和恢復系統,同時對于每臺虛擬化服務器設置獨立的硬盤分區,用以系統和日常數據的備份。
3.3數據安全
基于數據層的保護最直接的安全技術,數據安全防護技術包括:一是數據加密,深入數據層保護數據安全,針對不同的數據采用不同的加密算法,實施不同等級的加密控制策略,有效地杜絕機密信息泄漏和竊取事件;二是數據備份,將系統中的數據進行復制,當數據存儲系統由于系統崩潰、黑客人侵以及管理員的誤操作等導致數據丟失和損壞時,能夠方便且及時地恢復系統中的有效數據,以保證系統正常運行。
3.4應用安全
由于大數據環境的靈活性、開放性以及公眾可用性等特性,部署應用程序時應提高安全意識,充分考慮可能引發的安全風險。加強各類程序接口在功能設計、開發、測試、上線等覆蓋生命周期過程的安全實踐,廣泛采用更加全面的安全測試用例。在處理敏感數據的應用程序與服務器之間通信時采用加密技術,以確保其機密性。
3.5終端安全
隨著云計算、移動互聯網等技術的發展,用戶終端種類不斷增加,很多應用程序被攻擊者利用收集隱私和重要數據。用戶終端上應部署安全軟件,包括反惡意軟件、防病毒、個人防火墻以及IPS類型的軟件,并及時完成應用安全更新。同時注重自身賬號密碼的安全保護,盡量不在陌生的計算機終端上使用公共服務。同時還應采用屏蔽、抗干擾等技術為防止電磁泄漏,可從一定程度上降低數據失竊的風險。
4“大數據”安全展望
“大數據”時代的信息安全已經成為不可阻擋的趨勢,如何采用更加主動的安全防御手段,更好地保護“大數據”資源將是一個廣泛而持久的研究課題。
4.1重視“大數據”及建設信息安全體系
在對“大數據”發展進行規劃的同時,在“大數據”發展過程中,需要明確信息安全的重要性,對“大數據”安全形式加大宣傳的力度,對“大數據”的重點保障對象進行明確,對敏感、重要數據加大監管力度,研究開發面向“大數據”的信息安全技術,引進“大數據”安全的人才,建立“大數據”信息安全體系。
4.2對重點領域重要數據加強監管
海量數據的匯集在一定程度上可能會暴露隱私信息,廣泛使用“大數據”增加了信息泄露的風險。政府層面,需要對重點領域數據范圍進行明確,制定完善的管理制度和操作制度,對重點領域數據庫加大日常監管力度。用戶層面,加強內部管理,建立和完善使用規程,對“大數據”的使用流程和使用權限等進行規范化處理。
4.3加快研發“大數據”安全技術
傳統信息安全技術不能完全適用于新興的“大數據”領域,云計算、物聯網、移動互聯網等新技術的快速發展,對“大數據”的收集、處理和應用提出了新的安全挑戰。加大“大數據”安全技術研發的資金投入,提高“大數據”安全技術產品水平,推動基于“大數據”的安全技術研發,將有利于“大數據”更好地推動國家和社會發展。
作者:喬書芳 趙巍 單位:河北出入境檢驗檢疫局