前言:尋找寫作靈感?中文期刊網用心挑選的群體性突發事件通信技術論文,希望能為您的閱讀和創作帶來靈感,歡迎大家閱讀并分享。
(一)信息傳播速度快
當今的信息傳播渠道豐富,傳播成本低,傳播程序高效,潛在的傳播主體多且分布面廣泛。
(二)形式與群體特殊
由于互聯網應用發展迅速,無地域限制,加之我國網絡監察管控機制起步較晚,致使無法全面的監管網絡群體,使得網民(包括手機上網用戶)成了一個人數巨多,具有很大不確定性的群體。某些境內外“利益組織”乘機發揮,肆意宣傳,夸張事實,惡意引導,最終導致群體性事件的發生。
(三)信息傳播全面且多元
群體性突發事件所包含的信息量大,新媒介的信源總量多且十分豐富。而手機、電腦等電子通訊設備除了信息,更多的是因為其超強的互動能力而帶動各類信息資訊的轉發和復制,在各種新媒介的相互交叉中會使信息的傳播量得到大幅度提高。
二、現代通信技術在群體性突發事件中的監測作用
對此我們需要積極應對,利用好現代通信技術與IT技術的結合,以計算機網絡監控技術為防范群體性突發事件的主要手段,做到事前有效預防,實時監管可控,盡量減少或制止正在發生的群體性突發事件的破壞后果。群體性突發事件所采用的網絡管控技術是對數據的進一步進行處理,其中網絡管控技術主要有兩種:一是對特征值信息檢測、審核和過濾,通過防火墻、入侵檢測等軟硬件系統保護網絡或個人PC,進行動態監控,可阻止不實信息在網絡中惡意傳播,涉及網絡協議與網絡結構的研究。第二,對敏感信息的碰撞與電子取證,可以及時保護被入侵、破壞的網絡環境,對可疑網站、服務器存儲的數據文件、安全日志進行分析和提取,依照相關法律程序固化、收集電子證據,為以后進一步的取證行動提供技術保障。這不僅涉及數據挖掘技術中的關鍵詞搜索和文本信息比對技術的研究,也相關于電子證據合法固化技術。通過大量樣本研究發現,對于群體性突發事件的網絡管控,事前做到對其進行敏感信息安全等級分類、信息特征值描述、特征值提取、特征值數據庫的建立是最為關鍵的環節。這能為群體性突發事件的發生起到了良好的管控、預防作用。對群體性突發事件網絡監控系統建模分析,應該對其模塊功能描述如下:(1)數據獲取模塊。其功能是根據初始URL,利用特征值數據庫的存儲下載頁面,可以從定位網頁中提取有效網址。(2)有效特征值提取模塊。主要是利用特定訓練,根據經驗,確定集合中物體描述、形狀、內容、顏色等向量值,自動生成相關信息特征數據庫。(3)智能分析模塊。根據上一步驟信息特征數據庫的內容,智能分析下載的網頁內容,具體判斷閥值可由訓練集合和特征數據庫手動設定。(4)人機交互界面??蔀橛脩籼峁┦褂昧己玫牟僮鹘缑?,有統一接口,可在不同系統應用實現,具體包括能夠顯示數據比對、用戶審核、歷史數據、設置監控信息、特征庫管理、網站管理、輸出監測結果、審核日志等功能。
(一)基于文本信息過濾的關鍵技術
對群體性突發事件進行監測的過程中,信息過濾技術是其關鍵。大部分信息過濾系統都是采用網絡偵聽的方法來獲取原始數據,通過設置路由器的監聽端口并利用以太網廣播數據包的特性來實現。文本信息過濾技術主要有基于規則判斷和基于概率統計兩種方法,主要應用在基于文本信息的網絡通信手段中,如QQ聊天、論壇發帖、電子郵件文本等。文本信息過濾的實現機制可以分解為三個步驟:一是首先建立需求模型,用來描述對文本信息過濾的具體要求;二是數據挖掘進行文本信息匹配,根據用戶模板與文本匹配程度進行闕值判斷。所以文本信息過濾流程描述如下:首先根據群體性突發事件的相關特征值,建立需求模型,然后在被監控的文本流中搜索符合條件的信息;三是模塊因具備自我學習、反饋優化功能,可以利用用戶的反饋信息優化需求模型。
1.漢語分詞。
漢語分詞是對中文句子進行合理分割,是中文文本最重要的預處理技術。自動分詞過程是指從用戶需求出發,按照中文語法規范,對中文語句不確定性匹配,按自然分詞單位進行劃分的信息處理過程。自動分詞是我國漢語特有的特點,西方的英法語、拉丁語等語種,詞與詞之間存在著自然的分割,分析過程中一般不需要特意進行分詞處理。對文本信息進行漢語分詞的實施效果取決于系統采用的分詞方法。目前正在研究和所采用的主流分詞技術主要有三種。機械分詞法:這是我們目前采用最為廣泛的方法,包括正向最大匹配法、逆向最大匹配法、設立標志法、逐詞匹配法、部件詞典法、詞頻統計法等。最大匹配法是在實際應用中最常見的,其中又有正向、反向之分。“正向”就指我們從左至右搜索,“最大”就是我們每次都取最大詞長進行匹配(由于中文有單字成詞的特點)。而反向最大匹配法顧名思義就是從右至左搜索。相比較而言,反向最大匹配法的切分精度略高于正向最大匹配法,遇到歧義的現象也較少。語義分詞法:它引入了語義分析,可以結合文本信息中上下文對自然語言本身包含的語言信息進行分析。包括擴充轉移網絡法、知識分詞語義分析法等。其中擴充轉移網絡法是一種在數據庫自然語言查詢中普遍應用的方法,其實現過程是對句子語義進行分析時,由一個遞歸網絡進行信息傳導;寄存器用來保存短語或單詞被監測和分析的結果,在寄存器內進行特征比對;測試條件是用來判斷是否與檢查弧上的標識匹配,通過測試條件集合完成。要實現該方法需要建立一個語法知識庫,從而進一步提高分詞的精度和深度,但是這也加大了該方法實現的難度。人工智能法:包括神經網絡、專家系統等方法。
2.過濾模型。
信息過濾系統的效率和準確度,主要依賴文本信息模型的完善程度。布爾模型、向量空間模型、概率推理模型是目前描述文本信息的主要模型。目前使用較多的是向量空間模型(VSM)。它最大優勢是知識表示方面效率較高:文本被抽象描述成多維空間中的不同向量,將文本內容的文字處理轉化為向量空間中的數學矢量運算,極大降低了問題復雜度,有效提高文本處理的效率和速度??紤]一個向量空間模型構造的信息過濾系統,可用字項向量來取代文本。比如一個包含敏感信息的文檔T可用一個n維向量組取代,其中n用來表示文檔T中分詞的總數。按照語法規定或用戶設定,可以根據每個分詞的重要性對其賦值即權重,用來表明它的重要程度。文檔T的向量數組描述為D={T1,T2...Tn},其中Tn表示第n個分詞的權重。進行文本信息過濾時,首先對發出請求的文本進行合并處理,轉換為一個由n個分項組成的向量組X,然后比較向量組T和向量組X兩者之間的權重相似度。計算兩組權重的余弦值,值越小,夾角越大,根據它們夾角度來判斷是否要過濾掉該頁面。把文本以向量的形式映射到數域空間的做法大大提高了文本信息處理速度,因此向量空間模型被廣泛采用。向量空間模型不足之處是:它忽略了特征項之間的順序,損失了大量的文本結構和本身的語義信息;此外VSM是基于所有分向量兩兩正交假設基礎之上,沒有考慮特征值向量兩兩之間關聯性,其假設過于簡單,不能很好地反映自然語言(中文)內涵的豐富語義特征。如果只是用簡單的數學運算來代替語義分析,誤差總會存在。
(二)基于圖像信息內容的識別分析技術
基于內容的圖像識別技術是目前國內外研究和應用的主要手段。其原理是把圖像中不同色彩區域分割出來,然后進行提取分析,從而判斷該色域是否為特征需求區域,最后根據識別結果進行攔截和過濾。把圖像信息的識別比對技術應用在群體性突發事件中,能夠更加有效的掌握監控圖像的內容,從而對其進行攔截和過濾,保護良好的網絡環境以及公共安全。
(三)基于視頻信息的識別分析技術
對網絡視頻進行文件結構分析,通過慢放對視頻每幀進行劃分,獲取關鍵幀,同時也可以結合視頻字幕文字和語音信息做多數據整合的分析技術,用來進行視頻內容的監測,實現網絡視頻內容的過濾和識別,重點解決網絡中視頻識別系統自適應性、實時響應和可操作性,以便對實時視頻進行有效監控,并對可疑的視頻信息進行記錄,按照可疑程度進行分級。本文對當前群體性突發事件的特點進行了歸納分析,由現代通信技術入手,對其特征值進行了歸類總結,并針對不同領域給出了研究重點和實施手段,可對群體性突發事件進行有效的監測、預防、引導,盡可能的減少群體性突發事件的發生以及降低群體性突發事件發生所帶來的損失和危害??梢灶A見的是群體性突發事件也會隨著信息化發展而有所變化,這樣導致應對群體性突發事件的解決方案也是不斷變化發展的,這需要我們不斷的改進和完善。
作者:劉蔚 歐陽偉 單位:湖南司法警官職業學院 湖南警察學院信息技術系