前言:中文期刊網精心挑選了卷積神經網絡概念范文供你參考和學習,希望我們的參考范文能激發你的文章創作靈感,歡迎閱讀。
卷積神經網絡概念范文1
中圖分類號:TP18 文獻標識碼:A 文章編號:1009-3044(2016)33-0167-04
如今在機器學習領域中,深度學習方法已經占據了相當重要的地位,通過模仿人X學習方式構造模型,在圖像、文本、語音處理方面取得了顯著成果[1]。目前應用較為廣泛的深度學習模型包含多層感知器模型(MLP)[2],卷積神經網絡模型和限制性玻爾茲曼機模型等[4]。多層感知器[2]網絡結構的神經節點一般分層排列,主要由輸入層,輸出層和一些隱層組成,同層之間的神經元節點無連接,相鄰的兩層神經元進行全連接,前一層的神經元的輸出作為后一層神經元的輸入,但本身此種算法存在著一些問題,那就是它的學習速度非常慢,其中一個原因就是由于層與層之間進行全連接,所以它所需要訓練的參數的規模是非常大的,所以對其進行改進,產生了卷積神經網絡模型。卷積神經網絡模型在圖像識別方面的應用十分廣泛[5,8,9]。從它的結構上來看,層與層之間的神經元節點采用局部連接模式,而并非MLP的全連接模型,這樣就降低了需要訓練的參數的規模。而在它卷積層中,它的每一個濾波器作為卷積核重復作用于整個輸入圖像中,對其進行卷積,而得出的結果作為輸入圖像的特征圖[6],這樣就提取出了圖像的局部特征。而由于每一個卷積濾波器共享相同的參數,這樣也就大大降低了訓練參數的時間成本。而本文,以卷積神經網絡為研究對象,在其模型的基礎上通過對其結構中卷積核也就是濾波器的大小進行調整并結合卷積核個數調整和gpu加速等已有的訓練提速方法,達到降低訓練時間并且對識別結果并無太大影響的目的。
1 卷積神經網絡
卷積神經網絡在MLP的基礎上,已經對結構進行了優化,通過層與層之間的局部連接以及權值共享等方式對要訓練的參數的進行了大幅減低。
1.1局部連接
BP神經網絡中,神經元在本層中呈線性排列狀態,層與層之間進行全連接,而在卷積神經網絡中,為了減少每層之間的可訓練參數數量,對連接方式進行了修改,相對于BP神經網絡的全連接,卷積神經網絡采取了局部連接的連接方式[7],也就是說按照某種關聯因素,本層的神經元只會與上層的部分神經元進行連接。
2.2 權值共享
在CNN中,卷積層中的卷積核也就是濾波器,重復作用在輸入圖像上,對其進行卷積,最后的輸出作為他的特征圖,由于每個濾波器共享相同的參數,所以說他們的權重矩陣以及偏置項是相同的。
我們從上圖看出,相同箭頭連線的權值是共享的,這樣在原有的局部連接的基礎上我們又降低了每層需要訓練的參數的數量。
2.3卷積過程
特征圖是通過濾波器按照特定的步長,對輸入圖像進行濾波,也就是說我們用一個線性的卷積核對輸入圖像進行卷積然后附加一個偏置項,最后對神經元進行激活。如果我們設第k層的特征圖記為[hk],權重矩陣記為[Wk],偏置項記為[bk],那么卷積過程的公式如下所示(雙曲函數tanh作為神經元的激活函數):
2.4 最大池采樣
通過了局部連接與權值共享等減少連接參數的方式卷積神經網絡中還有另外一個重要的概念那就是最大池采樣方法,它是一種非線性的采樣方法。最大池采樣法在對減少訓練參數數量的作用體現在兩個方面:
1 )它減小了來自m-1層的計算復雜度。
2 )池化的單元具有平移不變性,所以即使圖像在濾波后有小的位移,經過池化的特征依然會保持不變。
3卷積神經網絡整體構造以及減少訓練時間的方法
3.1使用GPU加速
本次論文實驗中,使用了theano庫在python環境下實現卷積神經網絡模型,在lenet手寫數字識別模型上進行改進,由于theano庫本身支持GPU加速,所以在訓練速度上實現了大幅度的提高。
3.2 數據集的預處理
本次實驗使用的兩個數據集是mnist手寫數字庫以及cifar_10庫
Mnist手寫數字庫具有60000張訓練集以及10000張測試集,圖片的像素都為28*28,而cifar_10庫是一個用于普適物體識別的數據集,它由60000張32*32像素的RGB彩色圖片構成,50000張圖片組成訓練集,10000張組成測試集。而對于cifar_10數據集來說,由于圖片都是RGB的,所以我們在進行實驗的時候,先把其轉換為灰度圖在進行存儲。由于實驗是在python環境下運行,theano函數庫進行算法支持,所以我們把數據集進行處理,此處我們對使用的數據集進行了格式化。格式化的文件包括三個list,分別是訓練數據,驗證數據和測試數據。而list中每個元素都是由圖像本身和它的相對應的標簽組成的。以mnist數據集為例,我們包含train_set,valid_set,test_set三個list,每個list中包含兩個元素,以訓練集為例,第一個元素為一個784*60000的二維矩陣,第二個元素為一個包含60000個元素的列向量,第一個元素的每一行代表一張圖片的每個像素,一共60000行,第二個元素就存儲了對相應的標簽。而我們取訓練樣本的10%作為驗證樣本,進行相同的格式化,而測試樣本為沒有經過訓練的10000張圖片。在以cifar_10數據集為實驗對象時,把其進行灰度化后,進行相同的格式化處理方式。
3.3實驗模型結構
本次實驗是在python環境下基于theano函數庫搭建好的lenet模型進行參數的調整,以達到在實驗準確度可接受情況下減少訓練時間的目的。
上圖為實驗中的基礎模型舉例說明實驗過程,首先以mnist數據集為例,我們的輸入圖像為一個28*28像素的手寫數字圖像,在第一層中我們進行了卷積處理,四個濾波器在s1層中我們得到了四張特征圖。在這里要特別的說明一下濾波器的大小問題,濾波器的大小可根據圖像像素大小和卷積神經網絡整體結構進行設置,舉例說明,假如說我們的輸入圖像為28*28像素的圖像,我們把第一層卷積層濾波器大小設置為5*5,也就是說我們用一個大小為5*5的局部滑動窗,以步長為一對整張圖像進行滑動濾波,則滑動窗會有24個不同的位置,也就是說經過卷積處理后的C1層特征圖的大小為24*24。此處的濾波器大小可進行調整,本論文希望通過對濾波器大小的調整,已達到減少訓練時間的目的,并尋找調整的理論依據。C1層的特征圖個數與卷積過程中濾波器數量相同。S1層是C1經過降采樣處理后得到的,也就是說四點經過降采樣后變為一個點,我們使用的是最大池方法,所以取這四個點的最大值,也就是說S1層圖像大小為12*12像素,具有4張特征圖。而同理S1層經過卷積處理得到C2層,此時我們濾波器的大小和個數也可以自行設置,得到的C2層有6張特征圖,C2到S2層進行降采樣處理,最后面的層由于節點個數較少,我們就用MLP方法進行全連接。
3.4實驗參數改進分析
由此可見,我們對濾波器的大小以及個數的改變,可以直接影響到卷積訓練參數的個數,從而達到減少訓練時間的目的。
從另一種角度來看,增大濾波器的大小,實際效果應該相似于縮小輸入圖像的像素大小,所以這樣我們可以預測增大濾波器的大小會減少樣本的訓練時間,但是這樣也可能會降低訓練后的分類的準確率,而濾波器的大小是如何影響訓練時間以及分類準確率的,我們通過對兩種圖片庫的實驗來進行分析。
4 實驗結果與分析
4.1以mnist手寫數字數據集作為實驗數據
我們知道卷積層可訓練參數的數字與濾波器的大小和數字有關,所以我們通過對卷積層濾波器大小的變化來尋找較為普遍的可減少訓練參數從而達到減少訓練時間的目的。在實驗記錄中,我們表格縱列記錄兩層卷積層濾波器大小,橫列分別為對已經過訓練圖像識別和對未經過訓練的驗證圖像進行識別的錯誤率,最后記錄每種濾波器大小搭配的使用時間。我們設定每次試驗都進行100次重復訓練,每次對權重矩陣進行優化。
此處我們記錄兩層濾波器大小之和作為橫坐標,比較濾波器大小與實驗之間的關系。兩層濾波器大小相加后相同的元素我們把其對應時間做平均。
4.2以cifar_10數據集作為實驗數據
同樣是以100次循環訓練進行測試,通過改變兩層中濾波器的大小來尋找減少訓練時間的設定。
此處以同樣的方法,記錄兩層濾波器大小之和作為橫坐標,比較濾波器大小與實驗之間的關系。
4.3實驗結果分析
從兩組試驗中,在不同的數據集下,我們得到了濾波器的大小與訓練時間成反比的關系,而在減少了訓練時間的同時確實增大了訓練的錯誤率。
5 總結
通過實驗結果分析表明,增大卷積層濾波器大小的方法,在此兩種數據庫的情況下,是有效減小訓練時間的方式,而在不同的數據庫對分類準確率的影響程度不同,mnist手寫數字數據庫中圖像之間的相似度非常高,所以濾波器的增大對準確率產生的負面影響較小,而ifar_10數據集中圖像之間的相似度較小,所以增大濾波器的大小對其分類結果的準確率的負面影響較大。
參考文獻:
[1]LeCun Y, Bengio Y, Hinton G. Deep learning[J]. Nature, 2015, 521(7553): 436-444.
[2] Ruck D W, Rogers S K, Kabrisky M. Feature selection using a multilayer perceptron[J]. ]Journal of Neural Network Computing, 1990, 2(2): 40-48.
[3]LeCun Y, Bengio Y. Convolutional networks for images, speech, and time series[J]. The handbook of brain theory and neural networks, 1995, 3361(10): 1995.
[4] Larochelle H, Bengio Y. Classification using discriminative restricted Boltzmann machines[C]//Proceedings of the 25th international conference on Machine learning. ACM, 2008: 536-543.
[5]Krizhevsky A, Sutskever I, Hinton G E. Imagenet classification with deep convolutional neural networks[C]//Advances in neural information processing systems. 2012: 1097-1105.
[6] Zeiler M D, Fergus R. Visualizing and understanding convolutional networks[C]//European Conference on Computer Vision. Springer International Publishing, 2014: 818-833.
[7] Jarrett K, Kavukcuoglu K, Lecun Y. What is the best multi-stage architecture for object recognition?[C]//2009 IEEE 12th International Conference on Computer Vision. IEEE, 2009: 2146-2153.
卷積神經網絡概念范文2
(廣東外語外貿大學 金融學院,廣東 廣州 510006)
摘 要:作為一個具有巨大應用前景研究方向,深度學習無論是在算法研究,還是在實際應用(如語音識別,自然語言處理、計算機視覺)中都表現出其強大的潛力和功能.本文主要介紹這種深度學習算法,并介紹其在金融領域的領用.
關鍵詞 :深度學習;受限波茲曼機;堆棧自編碼神經網絡;稀疏編碼;特征學習
中圖分類號:TP181 文獻標識碼:A 文章編號:1673-260X(2015)01-0037-03
1 深度學習的研究意義
深度學習是一類新興的多層神經網絡學習算法,因其緩解了傳統訓練算法的局部最小性,引起機器學習領域的廣泛關注.深度學習的特點是,通過一系列邏輯回歸的堆棧作為運算單元,對低層數據特征進行無監督的再表示(該過程稱為預學習),形成更加抽象的高層表示(屬性類別或特征),以發現數據的分布式特征表示.深度學習的這種特性由于與腦神經科學理論相一致,因此被廣泛應用于語音識別、自然語言處理和計算機視覺等領域.
生物學研究表明[1]:在生物神經元突觸的輸出變化與輸入脈沖的持續時間有關,即依賴于持續一定時間的輸入過程,輸出信號既依賴于輸入信號的空間效應和閾值作用,也依賴于時間總和效應.
傳統的深度學習方法雖然較好地模擬了生物神經元的一個重要特性——空間總和效應上的深度,卻忽視了生物神經元的另一個重要特性——時間總和效應上的寬度[2].因此,對于連續的時間變量問題(如語音識別),傳統深度學習方法只能將連續的時間函數關系轉化為空間關系,即離散化為時間序列進行處理.這樣做有幾個弊端:
(1)可能造成深度學習算法對時間采樣頻率的十分敏感,魯棒性較差.這使得,不同時間尺度下,需要使用不同的數據和算法.這無疑是十分不方便的;
(2)導致深度網絡規模過大,使得計算開銷增大、學習效果變差、泛化性能降低;
(3)難以滿足實際應用對算法的實時性的要求,更難以體現連續輸入信息的累積效應,大大降低深度學習算法的實用性.
因此,對傳統的深度學習算法進行改進,使其不但具有“深度”,亦能具有“寬度”,能夠對連續時變數據進行更好的特征提取、提高算法效率和實用性,顯得勢在必行.基于這個切入點,本項目借鑒時頻分析與小波分析中的方法,結合數學分析領域中的泛函分析技術,與堆棧自編碼神經網絡相結合,提出一種新的深度學習算法——深度泛函網絡.為了驗證算法的有效性及優越性,本項目將把新算法應用于金融時間序列的領域.
在目前國內外對于深度學習的研究中,幾乎沒有任何將深度學習技術運用于金融數據的研究.通過提出并運用得當的深度序列學習方法,我們期望從金融數據中抽取更高級的、具有經濟學意義或預測性意義的高級特征(與人工設計的“技術指標”相對應),并開發相應的量化交易策略,并與其它傳統算法進行對比,以說明所提算法的可行性和優越性.
2 國內外研究現狀
人類感知系統具有的層次結構,能夠提取高級感官特征來識別物體(聲音),因而大大降低了視覺系統處理的數據量,并保留了物體有用的結構信息.對于要提取具有潛在復雜結構規則的自然圖像、視頻、語音和音樂等結構豐富數據,人腦獨有的結構能夠獲取其本質特征[3].受大腦結構分層次啟發,神經網絡研究人員一直致力于多層神經網絡的研究.訓練多層網絡的算法以BP算法為代表,其由于局部極值、權重衰減等問題,對于多于2個隱含層的網絡的訓練就已較為困難[4],這使得實際應用中多以使用單隱含層神經網絡居多.
該問題由Hinton[5]所引入的逐層無監督訓練方法所解決.具體地,該法對深度神經網絡中的每一層貪婪地分別進行訓練:當前一層被訓練完畢后,下一層網絡的權值通過對該層的輸入(即前一層的輸出)進行編碼(Encoding,詳見下文)而得到.當所有隱含層都訓練完畢后,最后將使用有監督的方法對整個神經網絡的權值再進行精確微調.在Hinton的原始論文中,逐層貪婪訓練是通過受限波茲曼機(Restricted Boltzmann Machine,RBM)以及相對應的對比散度方法(Contrastive Divergence)完成的.與通常的神經元不同,RBM是一種概率生成模型,通常被設計為具有二元輸入-輸出(稱為Bernoulli-Bernoulli RBM).通過對每一層的受限波茲曼機進行自底向上的堆棧(如圖1),可以得到深度信念網(Deep Belief Network,DBN).
除了生成式的RBM,還有其他的深度學習結構被廣泛使用和研究.如堆棧自編碼神經網絡(Stacked Auto-Encoder Network,SAEN)[6],以及深度卷積神經網絡(Deep Convolutional Network)[7]等.前者的優勢在于可以簡單地采用通常的BP算法進行逐層預訓練,并且引入隨機化過程的抗噪聲自編碼網絡(Denoising SAEN)泛化性能甚至超過DBN[8];而后者則通過權值共享結構減少了權值的數量,使圖像可以直接作為輸入,對平移、伸縮、傾斜等的變形具有高度不變性,因此在圖像識別領域有著廣泛應用.
近年來,稀疏編碼(Sparse Encoding)和特征學習(Feature Learning)成為了深度學習領域較為熱門的研究方向.B.A.Olshausen[9]等針對人腦的視覺感知特性,提出稀疏編碼的概念.稀疏編碼算法是一種無監督學習方法,它用來尋找一組“過完備”的基向量來更高效地表示輸入數據的特征,更有效地挖掘隱含在輸入數據內部的特征與模式.針對稀疏編碼的求解問題,H.Lee等在2007年提出了一種高效的求解算法[10],該算法通過迭代地求解兩個不同的凸規劃問題以提高效率.同年,H.Lee等發現,當訓練樣本為圖像時,對DBN的訓練進行稀疏性的約束有利于算法學習到更高級的特征[11].例如,對手寫識別數據集進行訓練時,稀疏性約束下的DBN算法自主學習到了“筆畫”的概念.
基于[10,11]的研究成果,R.Raina等[12]提出了“自導師學習(Self-Taught Learning)”的概念.與無監督學習(Unsupervised Learning)和半監督學習(Semi-supervised Learning)不同,自導師學習利用大量易獲得的無標簽數據(可以來自不同類別甚至是未知類別),通過稀疏編碼算法來構建特征的高級結構,并通過支持向量機(Support Vector Machine,SVM)作為最終層分類器對少數有標簽數據進行分類.這種更接近人類學習方式的模式極大提高了有標簽數據的分類準確度.與之類似,H.Lee,R.Grosse等[13]提出了一種具有層次結構的特征學習算法.該算法將卷積神經網絡與DBN結合,并通過稀疏正則化(Sparsity Regularization)的手段無監督地學習層次化的特征表征.圖像識別實驗表明,該算法能夠自主學習得出“物體(Object Parts)”的概念,較好體現了人腦視覺感知的層次性和抽象性.
3 發展趨勢
由于信號處理、語音識別、金融時間序列分析、視頻分析等領域的實時應用需求,研究能夠處理連續時變變量、自然體現時間聯系結構的深度學習算法(即深度序列學習,Deep Sequence Learning)成為了新的研究熱點.G.W.Taylor,G.E.Hinton等[14]提出時間受限波茲曼機(Temporal RBM,TRBM).該模型使用二值隱含元和實值可視元,并且其隱含元和可視元可以與過去一段歷史的可視元之間可以有向地被相連.同時,該模型被用于人類動作識別,并展現出了優秀的性能.針對TRBM的一些不足,一些改進算法也不斷涌現,如[15,16].然而,該類深度學習模型雖然考慮了動態的時間變量之間的聯系,但依然只能處理離散時間問題,本質上還是屬于轉化為空間變量的化歸法.同時,在自編碼網絡框架下,依然缺乏較好解決時間過程(序列)問題的方案.
4 金融時序數據中的應用
傳統金融理論認為,金融市場中的證券價格滿足伊藤過程,投資者無法通過對歷史數據的分析獲得超額利潤.然而,大量實證研究卻表明,中國股票價格波動具有長期記憶性,拒絕隨機性假設,在各種時間尺度上都存在的可以預測的空間.因此,如何建立預測模型,對于揭示金融市場的內在規律,這無論是對于理論研究,還是對于國家的經濟發展和廣大投資者,都具有重要的意義.
股票市場是一個高度復雜的非線性系統,其變化既有內在的規律性,同時也受到市場,宏觀經濟環境,以及非經濟原因等諸多因素的影響.目前國內外對證券價格進行預測的模型大致分為兩類:一是以時間序列為代表的統計預測模型;該類方法具有堅實的統計學基礎,但由于金融價格數據存在高噪聲、波動大、高度非線性等特征,使得該類傳統方法無法提供有效的工具.另一類是以神經網絡、支持向量機等模型為代表的數據挖掘模型.該類模型能夠處理高度非線性的數據,基本上從擬合的角度建模.雖然擬合精度較高,但擬合精度的微小誤差往往和市場波動互相抵消,導致無法捕捉獲利空間甚至導致損失,外推預測效果無法令人滿意.因此,建立即能夠處理非線性價格數據,又有良好泛化能力的預測模型勢在必行.
——————————
參考文獻:
〔1〕Zhang L I, Tao H W, Holt C E, et al. A critical window for cooperation and competition among developing retinotectal synapses[J]. Nature, 1998, 395(6697).
〔2〕37-44.歐陽楷,鄒睿.基于生物的神經網絡的理論框架——神經元模型[J].北京生物醫學工程,1997,16(2):93-101.
〔3〕Rossi A F, Desimone R, Ungerleider L G. Contextual modulation in primary visual cortex of macaques[J]. the Journal of Neuroscience, 2001, 21(5): 1698-1709.
〔4〕Bengio Y. Learning deep architectures for AI[J]. Foundations and trends? in Machine Learning, 2009, 2(1):1-127.
〔5〕Hinton G E, Osindero S, Teh Y W. A fast learning algorithm for deep belief nets[J]. Neural computation, 2006, 18(7): 1527-1554.
〔6〕Vincent P, Larochelle H, Bengio Y, et al. Extracting and composing robust features with denoising autoencoders[C]//Proceedings of the 25th international conference on Machine learning. ACM, 2008: 1096-1103.
〔7〕Lee H, Grosse R, Ranganath R, et al. Convolutional deep belief networks for scalable unsupervised learning of hierarchical representations[C]//Proceedings of the 26th Annual International Conference on Machine Learning. ACM, 2009: 609-616.
〔8〕Vincent P, Larochelle H, Lajoie I, et al. Stacked denoising autoencoders: Learning useful representations in a deep network with a local denoising criterion[J]. The Journal of Machine Learning Research, 2010, 9999: 3371-3408.
〔9〕Olshausen B A, Field D J. Sparse coding with an overcomplete basis set: A strategy employed by V1?[J]. Vision research, 1997, 37(23): 3311-3325.
〔10〕Lee H, Battle A, Raina R, et al. Efficient sparse coding algorithms[J]. Advances in neural information processing systems, 2007, 19: 801.
〔11〕Lee H, Ekanadham C, Ng A Y. Sparse deep belief net model for visual area V2[C]//NIPS. 2007, 7: 873-880.
〔12〕Raina R, Battle A, Lee H, et al. Self-taught learning: transfer learning from unlabeled data[C]//Proceedings of the 24th international conference on Machine learning. ACM, 2007: 759-766.
〔13〕Lee H, Grosse R, Ranganath R, et al. Convolutional deep belief networks for scalable unsupervised learning of hierarchical representations[C]//Proceedings of the 26th Annual International Conference on Machine Learning. ACM, 2009: 609-616.
〔14〕Taylor G W, Hinton G E, Roweis S T. Modeling human motion using binary latent variables[J]. Advances in neural information processing systems, 2007, 19: 1345.
卷積神經網絡概念范文3
【關鍵詞】人臉識別;人臉檢測;方法
Abstract:Face recognition system is one of the most popular current scientific research,In this paper,the process and prospects of face recognition system to do a simple review.The application of the system to do a simple analysis and the main method of face recognition for the corresponding category.For the future development of face recognition systems were mainly discussed.
Key words:Face Recognition;Face Detection;Methods
一、引言
隨著科學技術的突飛猛進,計算機及網絡的高速發展,信息的安全性、隱蔽性越來越重要,如何有效、方便的進行身份驗證和識別,已經成為人們日益關心的問題。生物認證的方法,即利用人類自身的特征來進行身份認證,具有傳統方法沒有的有點,也解決了身份認證技術所面臨的一大難題。其具有方便、強化安全、不會丟失、遺忘或轉讓等優點?,F在人體生物識別技術的研究主要針對人臉、指紋、虹膜、手型、聲音等物理或行為特征來進行。本文主要對人臉識別技術的介紹。
人臉識別是指給定一個靜止或動態圖像,利用已有的人臉數據庫來確認圖像中的一個或多個人。如同人的指紋一樣,人臉也具有唯一性,也可用來鑒別一個人的身份?,F在己有實用的計算機自動指紋識別系統面世,并在安檢等部門得到應用,但還沒有通用成熟的人臉自動識別系統出現。人臉圖像的自動識別系統較之指紋識別系統、DNA鑒定等更具方便性,因為它取樣方便,可以不接觸目標就進行識別,從而開發研究的實際意義更大。另一方面,人臉表情的多樣性;以及外在的成像過程中的光照,圖像尺寸,旋轉,姿勢變化等給識別帶來很大難度。因此在各種干擾條件下實現人臉圖像的識別,也就更具有挑戰性。
二、人臉識別系統流程
(1)人臉圖像的獲?。簣D像的獲取都是通過攝像頭攝取,但攝取的圖像可以是真人,也可以是人臉的圖片或者為了相對簡單,可以不考慮通過攝像頭來攝取頭像,而是直接給定要識別的圖像。
(2)人臉的檢測:人臉檢測的任務是判斷靜態圖像中是否存在人臉。若存在人臉,給出其在圖像中的坐標位置、人臉區域大小等信息。而人臉跟蹤則需要進一步輸出所檢測到的人臉位置、大小等狀態隨時間的連續變化情況。
圖1 人臉識別框架
(3)特征提?。和ㄟ^人臉特征點的檢測與標定可以確定人臉圖像中顯著特征點的位置(如眼睛、眉毛、鼻子、嘴巴等器官),同時還可以得到這些器官及其面部輪廓的形狀信息的描述。根據人臉特征點檢測與標定的結果,通過某些運算得到人臉特征的描述(這些特征包括:全局特征和局部特征,顯式特征和統計特征等)。
(4)基于人臉圖像比對的身份識別:即人臉識別問題。通過將輸入人臉圖像與人臉數據庫中的所有已知原型人臉圖像計算相似度并對其排序來給出輸入人臉的身份信息。
(5)基于人臉圖像比對的身份驗證:即人臉確認問題。系統在輸入人臉圖像的同時輸入一個用戶宣稱的該人臉的身份信息,系統要對該輸入人臉圖像的身份與宣稱的身份是否相符作出判斷。
三、人臉識別技術現狀及發展前景
自1995年以來,國外一些公司看準了人臉識別系統廣闊的應用前景,動用了大量人力和物力,自己獨立研發或與高校合作,開發了多個實用的人臉識別系統,例如:加拿大Imagis公司的ID-2000面部識別軟件,美國Identix公司1的FaceIt人臉識別系統,德國Human Scan公司的BioID身份識別系統,德國Cognitec Systems公司的Face VACS人臉識別系統等;美國A4vision公司的3D人臉識別產品;等等。
國內相關領域較為出名的公司有上海銀晨智能識別科技有限公司(IS'vision),他們與中科院計算所聯合開發了會議代表身份認證/識別系統、嫌疑人面像比對系統、面像識別考勤/門禁系統、出人口黑名單監控系統等多種自動人臉識別應用系統。2008年,北京奧運會開幕式正式使用了中國自主知識產權的人臉識別比對系統;2010年4月1日起,國際民航組織(ICAO)已確定其118個成員國家和地區必須使用機讀護照,人臉識別技術是首推識別模式,該規定已經成為國際標準;2011年,Face book初次引入人臉識別技術,登陸人員可以免信息驗證而激活頁面;2012年3月6日,江蘇省公安廳與南京理工大學日前簽約共建“社會公共安全重點實驗室”,開展“人臉識別”技術相關領域項目攻關。
到目前為止,雖然有關自動人臉識別的研究已經取得了一些可喜的成果,但在實際應用環境下仍面臨著許多難以解決的問題:人臉的非剛體,表情、姿態、發型和化妝的多樣性以及環境光照的復雜性都給正確的人臉識別帶來了很大的困難。即使在大量來自模式識別、計算機視覺、生理學、心理學、神經認知科學等領域的研究人員對自動人臉識別艱苦工作40余年之后,其中不少問題至今仍然困繞著研究人員,始終找不到完善的解決辦法。
在人臉識別市場,特別是在中國的市場,正經歷著迅速的發展,而且發展的腳步也將越來越快。主要有三大原因:
1.是科技界和社會各個領域都認識到人臉識別技術的重要性,國家政策對人臉識別技術研究給予了很大支持,使得我國人臉識別技術取得了很大進展。國際上,美國國家標準技術局(NIST)舉辦的Face Recognition Vendor Test 2006(FRVT2006)通過大規模的人臉數據測試表明,當今世界上人臉識別方法的識別精度比2002年的FRVT2002至少提高了一個數量級(10倍)。其中一些方法的識別精度已經超過人類的平均水平。而對于高清晰、高質量人臉圖像識別,機器的識別精度幾乎達到100%。
2.各種應用需求不斷出現。人臉識別市場的快速發展一方面歸功于生物識別需求的多元化,另一方面則是由于人臉識別技術的進步。從需求上來說,除了傳統的公司考勤、門禁等應用外,視頻監控環境下的身份識別正成為一種迫切的需求,即在一個較復雜的場景中,在較遠的距離上識別出特定人的身份,這顯然是指紋識別的方法不能滿足的,而人臉識別卻是一個極佳的選擇。
3.人口基數因素。人臉識別系統的市場大小,很大程度上是和人口的數量大小相關的。而我國有13億人口,這從本質上說明了我國是世界上規模最大的生物識別市場。
四、常用的人臉識別方法
人臉識別技術和方法可分為兩大類:基于幾何特征的方法和基于模板匹配的方法。基于幾何特征方法的思想是首先檢測出嘴巴,鼻子,眼睛,眉毛等臉部主要部分的位置和大小,然后利用這些部件的總體幾何分布關系以及相互之間的參數比例來識別人臉?;谀0宓姆椒ㄊ抢媚0搴驼麄€人臉圖像的像素值之間的自相關性進行識別,這種方法也叫做基于表象的方法。
本文主要分析了常用的人臉識別方法為:幾何特征的方法、模型的方法、神經網絡的方法和多分類器集成方法。
1.幾何特征的方法
最早的人臉識別方法就是Bledsoe提出的基于幾何特征的方法,這種方法以面部特征點之間的距離和比率作為特征通過最近鄰方法來識別人臉。該方法建立的人臉識別系統是一個半自動系統,其面部特征點必須由人手工定位,也正是由于人工的參與,該系統對光照變化和姿態變化不敏感。
Kanade首先計算眼角、鼻孔、嘴巴、下巴等面部特征之間的距離和它們之間的角度以及其它幾何關系然后通過這些幾何關系進行人臉的識別工作在一個20人的數據庫上識別率為45%一75%。
Brunelli和Poggio通過計算鼻子的寬度和長度、嘴巴位置和下巴形狀等進行識別,在一個47人的人臉庫上的識別率為90%.然而,簡單模板匹配方法在同一人臉庫上的識別率為100%。
基于幾何特征的方法比較直觀,識別速度快,內存要求較少,提取的特征在一定程度上對光照變化不太敏感。但是,當人臉具有一定的表情或者姿態變化時,特征提取不精確,而且由于忽略了整個圖像的很多細節信息且識別率較低,所以近年來已經很少有新的發展。
2.模型的方法
隱馬爾可夫模型,是一種常用的模型,原HMM的方法首先被用于聲音識別等身份識別上,之后被Nefian和Hayrs引人到人臉識別領域。它是用于描述信號統計特性的一組統計模型。
在人臉識別過程中,首先抽取人臉特征,得到后觀察向量,構建HMM人臉模型,然后用EM算法訓練利用該模型就可以算出每個待識別人臉觀察向量的概率,從而完成識別,HMM方法的魯棒性較好,對表情、姿態變化不太敏感,識別率高。
3.神經網絡的方法
神經網絡在人臉識別領域有很長的應用歷史,1994年就出現了神經網絡用于人臉處理的綜述性文章。
動態鏈接結構(DLA)是用于人臉識別系統中最有影響的神經網絡方法。DLA試圖解決傳統的神經網絡中一些概念性問題,其中最突出的是網絡中語法關系的表達。DLA利用突觸的可塑性將神經元集合劃分成若干個結構,同時保留了神經網絡的優點。
自組織映射神經網絡(SOM)與卷積神經網絡相結合的混合神經網絡方法進行人臉識別。SOM實現對圖像的采樣向量降維,且對圖像樣本的小幅度變形不敏感。卷積網絡用來實現相鄰像素間的相關性知識,在一定程度對圖象的平移、旋轉、尺度和局部變形也都不敏感。
神經網絡方法較其他人臉識別方法有著特有的優勢,通過對神經網絡的訓練可以獲得其他方法難以實現的關于人臉圖像的規則和特征的隱性表示,避免了復雜的特征抽取工作,并有利于硬件的實現。缺點主要在于其方法的可解釋性較弱,且要求多張人臉圖像作為訓練集,所以只適合于小型人臉庫。
4.多分類器集成方法
人臉的表象會因為光照方向、姿態、表情變化而產生較大的變化,每種特定的識別器只對其中一部分變化比較敏感,因此,將可以整合互補信息的多個分類器集成能夠提高整個系統的分類準確率。
Gutta等人提出將集成的RBF與決策樹結合起來進行人臉識別。結合了全局的模板匹配和離散特征的優點,在一個350人的人臉庫上測試,取得了較好的實驗結果。
五、總結及展望
隨著圖像處理、模式識別、人工智能以及生物心理學的研究進展,人臉識別技術也將會獲得更大的發展。面對這種高新技術,人臉識別技術有著不可代替的優點。近幾年對三維模型的人臉識別研究以成為一個熱點。從二維模型到三維模型是一個階躍性的發展,中間必須克服三維模型的開銷大,所占空間大等因素。因此如何增強這類系統的保密性將是人臉識別系統要考慮的問題,它將是這種識別系統投入使用后人們最關心的問題,同時也是人臉識別領域需要研究的新課題。我們期待在不久的將來,人們將告別鑰匙,迎來人臉開門的新時代。
參考文獻
[1]李武軍,王崇駿,張煒,等.人臉識別研究綜述[J].模擬識別與人工智能,2006,19(1):58-65.
[2]李子青.人臉識別技術應用及市場分析[J].中國安防,2007,8:42-46.
[3]柴秀娟,山世光,卿來云,等.基于3D人臉重建的光照、姿態不變人臉識別[J] .軟件學報,2006,17(3):525-534.
卷積神經網絡概念范文4
獨立分量分析(independentcomponentanalysis,ICA)是基于信號高階統計量的信號處理方法,其基本含義是將多道觀測信號按照統計獨立的原則通過優化算法分解為若干獨立成分,前提是各源信號為彼此統計獨立的非高斯信號。與主分量分析(prin-cipalcomponentanalysis,PCA)相比,ICA不僅實現了信號的去相關,而且要求各高階統計量獨立。1994年,Comon[1]系統地分析了瞬時混迭信號盲源分離問題,提出了ICA的概念與基本假設條件,并基于累積量直接構造了目標函數,進而指出ICA是PCA的擴展和推廣。20世紀90年代中期,Bell和Sejnowski[2]提出隨機梯度下降學習算法,即最大熵ICA算法(Infomax-ICA)。近年ICA在眾多領域得到廣泛應用,主要得益于Lee等提出的擴展ICA算法[3]、Hyvarinen的定點ICA算法[4]與Cardoso的JADE算法[5]。
2ICA模型
設有m個未知的源信號si(t),i=1~m,構成一個列向量s(t)=[s1(t),s2(t),…,sm(t)]T,設A是一個n×m維矩陣,一般稱為混合矩陣(mixingmatrix)。設x(t)=[x1(t),x2(t),…,xn(t)]T是由n個觀測信號xi(t),i=1~n構成的列向量,n(t)為n維附加噪聲,其瞬時線性混合模型(圖1)表示為下式:x(t)=As(t)+n(t),n≥m(1)一般情況下,噪聲可以忽略不計。則ICA模型可以簡化為:x(t)=As(t),n≥m(2)ICA的命題是:對任何t,根據已知的x(t)在A生物醫學工程研究JournalofBiomedicalEngineeringResearch未知的條件下求解未知的s(t)。這就構成一個無噪聲的盲分離問題。ICA的思路是設置一個解混矩陣W(W∈Rm×n),使得x經過W變換后得到n維輸出列向量y(t),即y(t)=Wx(t)=WAs(t)(3)如果通過學習實現了WA=I(I為單位陣),則y(t)=s(t),從而達到分離源信號的目的。根據概率論中心極限定理,兩個獨立隨機變量和的高斯性通常比原來任何一個的高斯性都要強。信號分離的過程,就是神經網絡輸出的各分量非高斯性(即獨立性)增強的過程。由于沒有任何參照目標,學習只能是自組織的。學習過程的第一步是建立以W為變量的目標函數L(W),如果某個W能使L(W)達到極值,該W即為所需的解;第二步是用一種有效的算法求解W。按照L(W)定義的不同和求W的算法不同,可以構成各種ICA算法。目標函數的定義可以分為基于高階統計和基于信息論的方法。
3ICA判據與算法
用ICA解決BSS問題,一般基于以下假設:①各源信號si(t)統計獨立;②觀測信號數n≥源信號數m;③各源信號si(t)中至多允許有一個高斯分布的信號源;④各傳感器引入的噪聲很小。ICA理論及分離算法的關鍵在于如何度量分離結果的獨立性。
3.1基于非高斯最大化的ICA
直觀的說,非高斯性是ICA模型估計的關鍵。采用峭度(kurtosis)和負熵(negentropy)可以度量非高斯性的大小。
3.1.1基于峭度高階統計量的判據隨機變量y(t)沒有歸一化的峭度,也稱作四階累積量,定義為:kurt(y)=E{y4}-3(E{y2})2=C4[y4](4)對高斯信號變量來說,它的kurtosis等于零;但對大多數非高斯隨機變量而言,它們的kurtosis有正也有負。聲音信號等具有正kurtosis值的信號稱為超高斯信號,生物醫學信號、圖像信號、通信信號等具有負kurtosis值的信號稱作亞高斯信號。由于該度量方法在理論和計算上都非常簡單,因此廣泛用于ICA和相關領域。
3.1.2基于負熵的ICA目標函數由信息論理論可知,在所有具有等方差的隨機變量中,高斯分布的隨機變量的信息熵最大,非高斯性越強,其信息熵越小。這表明熵能用于非高斯性的測量。負熵定義如下:J(y)∝H(ygauss)-H(y)(5)其中,H(y)=∫f(y)logf(y)dy,ygauss是一與y具有相同協方差的高斯隨機變量。負熵總是非負的,并只有當y是高斯分布時為零。實際應用中為簡化計算,通常要對負熵加以近似[6]:J(y)∝[E{G(y)}-E{G(ν)}]2(6)其中,ν為零均值單位方差的高斯向量,y的均值為零,且是單位方差;G(•)可取為G1(u)=1a1log-cosha1u(1≤a1≤2)或G2(u)=-exp(-u2/2)等非二次函數。這種近似得到的負熵,給出了古典的kurto-sis和負熵在非高斯性測量上的一種很好的折衷,其近似概念簡單,計算快速,具有較好的魯棒性。
3.2基于信息論的ICA
3.2.1基于極大似然(ML)估計的ICA在ICA模型中可以直接定義似然函數(對數形式)如下:logL=∑Tt=1∑ni=1logfi(wWix(t))+Tlog|detW|(7)其中,fi為獨立分量si的密度函數(假設pdf已知),x(t)(t=1,2,…,T)是x的實現,該式也可表示為:1TlogL=E{∑ni=1logfi(wTix)}+log|detW|(8)在實際的ML估計中,獨立分量的pdf也不必精確的估計出來。事實上,只要能夠確定獨立分量的超高斯或亞高斯性即可。但是,對獨立分量先驗知識的錯誤認知,會導致完全錯誤的結果。
3.2.2基于信息最大化的ICAInfomax算法充分利用神經網絡的知識,其原理是最大化一個具有非線性輸出神經網絡的輸出熵(或信息流)。假設x是一個輸出形式為Φi(wiTx)的神經網絡輸入,這里Φi是一些非線性標量函數,wi是神經網絡的權向量,得到最大化輸出的熵為:H(Φ1,…,Φn)=H(x)+E{log│detF/W(x)│}(9)式中F(x)=(Φ1(w1Tx),…,Φn(wnTx))。57第4期趙浩等•獨立分量分析在生物醫學信號處理中的應用E{log│detF/W(x)│}=∑Ni=1E{logΦ′i(wiTx)}+log│detW│(10)比較式(8)與式(10),可以看出輸出熵同似然函數的期望值有相同的形式。在此處,獨立分量的pdf被函數Φ′i代替。如果此處的非線性函數Φ′i采用相應于累計的分布函數,比如說Φ′I(•)=fi(•),那么輸出熵則等于似然值。所以Infomax和MLE是等價的。
3.2.3基于最小互信息(MMI)的ICA根據信息論中互信息的定義,考慮到線性關系y(t)=Wx(t),可得基于最小互信息的目標函數I(y1,y2,…yn)=∑iH(yi)-H(x)-log|detW|(11)最小化該式即可得到分離矩陣W,使yi(t)趨于相互獨立。
3.3ICA的學習算法
ICA的學習算法可分為兩類,一類是求取相關目標函數的極值,另一類是基于隨機梯度方法的自適應算法。一種好的學習算法應保證解的正確性,并且算法簡單,收斂速度快。近年Lee等提出了擴展ICA算法[3],該算法在迭代過程中不需要計算信號的高階統計量,收斂速度快,可實現亞高斯和超高斯信號的同步分離。FastICA算法是一種基于負熵或極大似然估計等獨立性判決準則的分離算法[4],該算法是基于定點遞推算法得到的。FastICA收斂速度快,不需要選擇步長,獨立成分可以逐個估計,并具有很多神經算法的優點,如計算簡單,需求的內存小,是并行的?;谪撿氐囊痪SFastICA算法能估計其中的一個獨立分量,或者說是一個投影,其步驟如下:(1)中心化觀測數據,使其均值為零;并對觀測數據進行白化預處理,初始權值向量W;(2)利用定點準則計算下一個ICA基本向量的估計:W(k)=E{xg(W(k-1)Tx)}-E{g′(WT(k-1)x)}W(12)式中g(•)為g1(u)=tanh(a1u)(1<a1<2,經常置a1=1)或g2(u)=uexp(-u2/2);(3)將W(k)標準化,即W(k)除以它的范數,W(k)=W(k)/W(k);(4)如果不收斂,則返回第2步。
4ICA在生物醫學信號處理中的應用
生物醫學信號的采集設備一般由各類傳感器、運算放大器、濾波器、AD/DA轉換、預處理等模塊構成,生物醫學信號比較微弱,一般處在微伏級,暴露于大量的背景噪聲和傳感器噪聲中,并且電路可能存在不同的內部時鐘和傳輸轉換時延,各通道間存在串擾和迭加,干擾信號的幅度可能比有用信號的幅度還要強,具有較強的非平穩性和隨機性等普遍特征。如何在保證信號特征基本不變的前提下,對其進行去噪提純,繼而進行信號的特征提取和壓縮,改善其存儲、檢索及模式自動識別等問題,是醫療自動化和信息化的重要課題。由于ICA是根據觀測信號和源信號的概率分布來估計各源信號,考慮信號的高階統計特性,因而能有效的提升信號的信噪比,是一種非常有效的處理方法。眾多的科技工作者已經把ICA用于生物醫學信號的研究。其中,Lee等把擴展ICA用于EEG和fM-RI數據的處理[3];Common提出的基于高階累計量的算法也被用于分離胎兒和母體的ECG[7];FastICA固定點算法也被用于EEG和MEG數據———腦的電子和電磁活動行為[8],等等。但是,各算法的最優結果和各算法的魯棒性還有待進一步確定,這也正是我們當前的研究方向。
4.1分離生物醫學信號中干擾或噪聲
醫學信號中常用的腦電信號是利用放置在頭皮不同位置的導聯紀錄的一組數據,極易受一些干擾成分的影響,如眼球運動偽跡、眨眼、心電偽跡和工頻干擾,這些干擾成分會對腦電信號的分析處理產生很多不良的影響。作為研究和臨床使用的EEG信號,如何在有非自然信號污染的EEG信號中提取神經元基本特征是研究人員面臨的問題[9,10]。文獻[11]將小波分析和ICA相結合,用小波軟門限法提高腦電的信噪比,再利用ICA分離出源信號,有效地去除了腦電中的噪聲和心電干擾。應用ICA分離這些信號和噪聲的根據是:腦活動與其他信號(如眼電、心電等)是不同的生理過程,即它們相互之間是統計獨立的,符合ICA模型的假設條件。在噪聲干擾確定并可人為生成(如腦電中的工頻干擾)時[12],或干擾具有明確生理意義時,即干擾信號和有用生理信號可被看作是由相對獨立的不同的源產生的情況下,可將噪聲或干擾分離成獨立的源信號。我們利用MATLAB進行如下試驗:圖3為3路同步測量的腦電和眼動信號,從原信號及其功率譜可見,腦電信號中含有眼動干擾和60Hz的工頻干擾。由于腦電數據庫沒有提供同步測量的工頻信號,我們構造兩個60Hz工頻干擾源P1=sin(2*pi*60*t);P2=cos(2*pi*60*t),與3路源信號構成5路信號,然后采用FastICA算法分離這5路信號。將分離后的眼電、工頻干擾信號置零后,再重構源信號。圖4為不含眼動和工頻干擾的腦電信號,從重構結果及其頻譜可見,腦電信號在100點和700點附近的眼動干擾明顯消除,60Hz的工頻干擾也得到了很好的抑制,試驗取得了良好效果。
4.2特征提取
在生物醫學信號和圖像處理中,常需要提取信號的狀態特征,作為診斷和識別的依據,通常提取特征都是基于信號的低階統計特性,而ICA充分利用了信號的高階相關性,能有效的提取信號在生理意義上的本質特征,分離出與待分析信號相對穩定的獨立分量模式,進而可以用作信號的特征提取或分類[13,6]。郭曉靜,等[13]分析處理不同心理作業的思維腦電信號,初步發現了與心理作業相對應的腦電獨立分量的特征,并用于心理作業的分類,為腦機接口技術提供了新的方法。
卷積神經網絡概念范文5
獨立分量分析(ICA)是統計信號處理近年來的一項發展。顧名思義,這是一種分解技術,其特點是把信號分解成若干相互獨立的成分。主分量分析(PCA)和奇異值分解(SVD)是人們較熟悉的分解信號的線性代數方法,ICA與它們的主要不同之處表現在:
(1)后者只要求分解出來的各分量互相正交(不相關),但并不要求它們互相獨立。用統計信號處理的語言來表達,即:后者只考慮二階統計特性,而前者則要更全面考慮其概率密度函數的統計獨立性。
(2)后者按能量大小排序來考慮被分解分量的重要性。這樣的分解雖然在數據壓縮和去除弱噪聲方面有其優點,但分解結果往往缺乏明確的生理意義。前者雖然分解出的分量其能量大小存在不確定性,但當測量值確實是由若干獨立信源混合而成時,分解結果往往具有更好的生理解釋。由于測得的生理信號往往是若干獨立成分的加權迭加(例如,誘發腦電總是被自發腦電所淹沒,而且常伴隨有心電、眼動、頭皮肌電等干擾),此ICA是一項值得注意的分解方法。
此外,神經生理研究認為,人類對認知、感知信息的前期處理有“去冗余”的特點。ICA在這方面也表現出類似特性,因為互相獨立的分量之間互信息是最少的。ICA是伴隨著盲信號處理,特別是盲信源分離發展起來。其研究熱潮方興未艾,也正在引起生物醫學工程界的注意,IEEETransBME正在組織出版以它為重點的專輯。就國際范圍看,以下幾個研究單位目前工作比較領先:(1)美國加州大學生物系計算神經生物學實驗室,(2)日本Riken腦科學研究所腦信息研究室,(3)芬蘭赫爾辛基工業大學計算機及信息科學實驗室,目前發表有關文獻較多的刊物有IEEETrans的SP和NN以及NeuralComputation等。本文目的是對ICA的原理、算法及應用作一簡述,以引起國內同行對它的關注。將側重于概念說明,而不追求數學上的嚴謹性。
2原理
2.1問題的提法,s-(n)是一組互相獨立的信源,A是混合矩陣,x-(n)是觀察記錄,即x-(n)=As-(n)。問題的任務是:在A陣未知且對s-(n)除獨立性外無其它先驗知識的情況下,求解混矩陣B,使得處理結果y-(n)=Bx-(n)中各分量盡可能互相獨立,且逼近s(n)。容易理解,解答不是唯一的,它至少受以下條件的限制:(1)比例不定性:s-(n)中某一分量大K倍時,只要使相應的A陣系數減小K倍,x-(n)便保持不變。
因此,求解時往往把s-(n)假設成具有單位協方差陣,即s-中各分量均值為零,方差為1,且互相獨立。(2)排序不定性:y-與s-中各分量排序可以不同。因為只要對調B陣中任意兩行,y-中相應元素的位置也便對調。(3)s-(n)中至多只能有一個高斯型信源:這是因為高斯信源的線性組合仍是高斯型的,因此混合后便無法再區別。(4)信源數目N只能小于或等于觀測通道數M。N>M情況目前尚未解決。以下討論設M=N。因此,y-(n)只是在上述條件下對s-(n)的逼近。換名話說,任務的實質是優化問題,它包括兩個主要方面:優化判據(目標函數)和尋優算法。
2.2目標函數
這一領域的研究者已經從不同角度提出了多種判據。其中以互信息極小判據(MinimizationofMutualInformation,簡記MMI)和信息或熵極大判據(Informax或MaximizationofEntropy,簡記ME)應用最廣。由于最基本的獨立性判據應由概率密度函數(probabilitydensityfunction,簡記pdf)引出,而工作時pdf一般是未知的,估計它又比較困難,因此通常采用一些途徑繞過這一困難。
常用的方法有兩類:①把pdf作級數展開,從而把對pdf的估計轉化為對高階統計量的估計;②在圖1的輸出端引入非線性環節來建立優化判據。后一作法實際上隱含地引入了高階統計量。(1)互信息極小判據:統計獨立性的最基本判據如下:令p(y-)是y-的聯合概率密度函數,pi(yi)是y-中各分量的邊際概率密度函數。當且僅當y-中各分量獨立時有:p(y-)=∏Ni=1pi(yi)因此用p(y-)與∏i=1pi(yi)間的Kullback-Leibler散度作為獨立程度的定量度量:I(y-)=KL[p(y-),∏Ni=1pi(yi)]=∫p(y-)log[p(y-)∏Ni=1pi(yi)]dy-(1)顯然,I(y-)0,當且僅當各分量獨立時I(y-)=0。因此,互信息極小判據的直接形式是:在y-=Bx-條件下尋找B,使(1)式的I(y-)極小為了使判據實際可用,需要把I(y-)中有關的pdf展成級數。
由于在協方差相等的概率分布中高斯分布的熵值最大,因此展開時常用同協方差的高斯分布作為參考標準。例如,采用Gram-Charlier展開時有:P(yi)PG(yi)=1+13!k2yih3(y-i)+14!k4yih4(yi)+…式中PG(yi)是與P(yi)具有同樣方差(σ2=1)和均值(μ=0)的高斯分布。k3yi、k4yi是yi的三、四階累計量(cumulant),hn(yi)是n階Hermit多項式。此外還有許多其他展開辦法,如Edgeworth展開,利用負熵(Negentropy)等。不論采用何種展開方式,經推導后總可把式(1)近似改成k3、k4的函數:I(y)=F(k3y-,k4y-,B)(1)’F(·)的具體形式多種多樣,視推導時的假設而異。
這樣就得到互信息判據的實用近似形式:在y-=Bx-條件下尋找B,使式(1)的I(y-)極小(2)Infomax判據:這一判據的特點是在輸出端逐分量地引入一個合適的非線性環節把yi轉成ri(如圖2)??梢宰C明,如果gi(·)取為對應信源的累積分布函數cdf(它也就是概率密度函數的積分),則使r-=(r1…rN)T的熵極大等效于使I(y-)極小,因此也可達使y-中各分量獨立的要求。從而得到Infomax判據:在選定適當gi(·)后,尋找B使熵H(r-)極大需要指出的是,雖然理論上gi(·)應取為各信源的cdf,但實踐證明此要求并不很嚴格,有些取值在0~1之間的單調升函數也可以被采用,如sigmoid函數、tanh(·)等。估計H(r-)固然也涉及pdf,但由于其作用已通過gi(·)引入,所以可以不必再作級數展開而直接用自適應選代尋優步驟求解。文獻中還提出了一些其他判據,如極大似然、非線性PCA等,但它們本質上都可統一在信息論的框架下,所以不再一一列舉[1]。
3處理算法優化算法
可大致分為兩類,即批處理與自適應處理。
3.1批處理批處理比較成熟的方法有兩類。較早提出的是成對旋轉法[2],其特點是把優化過程分解成兩步。先把x-(n)經W陣加以“球化”得z-(n),使z-(n)T=IN,即:各分量不相關且方差為1,然后再尋找合適的正交歸一陣U達到使y-各分量獨立的目的。前一步類似于PCA,后一步則可利用Givens旋轉,根據目標函數,將z-中各分量兩兩成對反復旋轉直到收斂。這種方法計算量較大。1999年,Gadoso提出幾種方法對它作了進一步改進[3],其中包括:Maxkurt法、JADE法、SHIBBS法等,限于篇幅,本文不再敘述。近年來,提出的另一類方法是所謂“固定點”法(FixedPointMethod)[4,5],其思路雖來源于自適應處理,但最終算法屬于批處理。
簡單地說,通過隨機梯度法調節B陣來達到優化目標時,有:B(k+1)=B(k)+ΔB(k)ΔB(k)=-μεkB(k)式中k是選代序號,εk是瞬時目標函數。當到達穩態時必有[E是總集均值算子]:E[ΔB(k)]=0(2)如果ΔB(k)與B(k)有關,就可由(2)式解出B的穩態值。不過由于(2)式總是非線性方程,因此求解時仍需要采用數值方法(如牛頓法、共軛梯度法等)迭代求解。實踐證明,不論是收斂速度還是計算量,此法均優于前一種方法,而且它還可以根據需要逐次提取最關心的yi,因此是一類值得注意的方法。
3.2結合神經網絡的自適應處理結合神經網絡的自適應處理算法的框圖。1994年Cichocki提出的調節算法是:B(k+1)=B(k)+ΔB(k)ΔB(k)=μk[I-Ψ(y-k)ΦT(y-k)]B(k)式中Ψ、Φ都是N維矢量,其各元素都是單調升的非線性函數:Ψ(yk)=sgnyk·y2k,ΦTy-k=3tanh(10yk)所得結果雖令人鼓舞,但是方法是經驗性的。其后學者們從理論上沿著這一方向作了更深入的討論,并發展出多種算法。概括地說,主要發展有以下幾點:
(1)引入自然梯度(或相對梯度)。按照最陡下降的隨機梯度法推導出的系數調節公式往往具有如下一般形式:ΔB(k)=μk[B-T(k)-Ψ(y-k)x-Tk]式中的Ψ(y-k)視具體算法而異。Infomax法中Ψ(·)由所選用的g(·)決定;MMI法中則與yk的三、四階矩有關。B-T(k)是矩陣求逆再轉置,它的計算量很大。Amari[7]在1998年提出將最陡下降梯度改為“自然梯度”,兩者間關系是:[自然梯度]=[最陡下降梯度]·BT(k)B(k)于是有:ΔB(k)=μk[B-T(k)-Ψ(y-k)x-Tk]BT(k)B(k)=μk[I-Ψ(y-k)y-Tk]B(k)由于此式避免了矩陣求逆,因此計算量明顯降低且收斂加快。目前,這一作法已被普遍接受。
(2)引入自然梯度后,采用不同的優化判據得出的調節公式雖各有千秋,但大致都可表示為如下的“串行更新”形式:B(k+1)=B(k)+ΔB(k)=[I+H(y-k)]B(k)只是H(y-k)的具體形式各不相同。串行矩陣更新的算法還具有一些理論上值得注意的性質,如均勻特性(uniformproperty)和等變性(equivariant)等[8,9]。
(3)四階累計量k4>0的超高斯信號和k4<0的欠高斯信號,其處理過程應當予以區別。采用同一算法效果往往不好。目前的辦法多是在調節公式中引入一個開關。根據估計得k4的符號來切換不同算法,如擴展的Infomax法就是一例[10]。此法的系數調節公式是:ΔB(k)=μk[I-Ktanh(y-k)·y-Tk-y-ky-Tk]B(k)其中K是對角陣,其對角元素之值為+1或-1,視該信號分量k4>0或<0而定。為了實時應用,估計K4也可采用遞歸算法。總之,自適應算法是目前采用較廣的方法。
4應用舉例
4.1仿真計算為檢驗經ICA算法分解信源的能力,左圖是一組源信號,它們對系統來說是未知的。這一組信號經混合后的觀察信號作為(中圖所示)ICA算法的輸入,分解后的結果如右圖所示??梢钥吹?除了波形的次序、極性和波幅發生變化之外,源信號的波形被很好地分解出來。一般情況下,臨床腦電信號中既有超高斯成分(如誘發電位),也有亞高斯成分(如肌電和工頻干擾)。為了檢驗擴展Infomax算法處理這類情況的能力,我們又用此法進行了如圖6所示仿真實驗。左圖第一行是一段自發腦電信號,第二行是仿真的視覺誘發電位,第三行是肌電干擾?;旌虾蟮男盘?圖中第二列所示)經ICA分解得到如右圖所示的結果。這一結果表明擴展ICA算法在同時存在超高斯和亞高斯信號的情況下,仍然能夠很好地實現盲分解。但應指出:這一仿真結果并不說明通過ICA分解就能直接得到視覺誘發電位,因為還沒有涉及頭皮上的多導數據。
4.2實驗VEP分析(1)多導腦電觀察中VEP的增強:需要強調,把多導腦電作ICA分解后直接取出其中與VEP有關的成分,得到的并不是頭皮電極處的VEP分量,因為它們只是分解出來的信源,而這些信源的位置并不在頭皮上,為了得到電極處測量值中的VEP成分,需按下述步驟處理:用訓練得的W陣直接對頭皮上取得的多導腦電數據進行ICA分解,得到各獨立分量組成的矩恥y=Bx(見圖7a);再根據各分量的波形特征及產生時段,選擇與VEP有關的一部分分量(例如在前300ms中具有較大幅度的分量),并將其余分量置0,得到新的獨立分量矩陣y’;再反變換回頭皮各電極處得x’=B-1-y’。這樣才能得到去除噪聲和干擾后各電極處的VEP。
采用這樣的方法可顯著地減少提取VEP所需要的累加次數。左圖是經3次累加所得VEP,中圖是經50次累加所得結果,右圖則是用左圖經圖7中ICA處理后提取的VEP。比較中、右兩圖,兩者波形趨勢基本相同,但后者比前者其主要峰、谷顯然更清楚,而累加次數由50減到3。(2)ICA分量的空間模式:把某一個ICA分量的瞬時值經B-1逆推回頭皮各電極處得x-’后,就可以按斷層圖的插補方法得到該時該分量在頭皮上的空間分布模式。這個空間分布模式也可以用更簡單辦法得到:只要把逆矩陣B-1中相應于某ICA分量的列中各元素的值賦與頭皮各電極處,再作斷層圖插值,就可以表現該ICA分量在任意時刻的空間分布模式。也就是:x’i(t)=b’ijy’j(t),i=1~N式中b’ij是B-1的第i行第j列元素。
可見ICA分量y’j(t)在頭皮各電極處的對應值等于用逆陣B-1第j列各元素來對y’j(t)加權。因此,列矢量b’j=[b’1,…,b’Nj]可以用來統一地表現任意時刻y’j的空間模式。
5總結與展望
本文粗略介紹了ICA的原理、算法和應用,可以看到ICA確是一個值得注意的研究方向,但其理論體系尚未完整,實際采用的處理方法多少還帶有經驗性。例如為什么對非線性特性gi的要求不甚嚴格就沒有明確解釋;又如算法的穩定性、收斂性在實踐中是經常遇到的問題。從應用方面看也還有許多待開發的領域,例如如何應用于生理信號的模式識別與系統建模等。從生物醫學信號分析的角度看,還有一些亟待深入的問題。例如:
(1)在以上分析中混合陣A被假設為恒定。這對靜態的圖像分析或固定信源是合理的;但在生理實際中,等效信源一般在空間并不固定,因而混合陣A應視為時變的,而且傳導過程中還會引入容積導體的卷積及遲作用。這可能是實際生理信號分解結果不夠理想的原因之一。
(2)一般公認,生理信號的非平穩性較強,而以上分析并沒有考慮信號的非平穩性。
卷積神經網絡概念范文6
【關鍵詞】電力行業;熱工自動化;發展前景
1. 當前電力行業熱工自動化技術的發展
隨著世界高科技的飛速發展和我國機組容量的快速提高,電廠熱工自動化技術不斷地從相關學科中吸取最新成果而迅速發展和完善,近幾年更是日新月異,一方面作為機組主要控制系統的DCS,已在控制結構和控制范圍上發生了巨大的變化;另一方面隨著廠級監控和管理信息系統(SIS)、現場總線技術和基于現代控制理論的控制技術的應用,給熱工自動化系統注入了新的活力。
1.1DCS的應用與發展。
火電廠熱工自動化系統的發展變化,在二十世紀給人耳目一新的是DCS的應用,而當今則是DCS的應用范圍和功能的迅速擴展。
1.1.1DCS應用范圍的迅速擴展。
20世紀末,DCS在國內燃煤機組上應用時,其監控功能覆蓋范圍還僅限DAS、MCS、FSSS和SCS四項。即使在2004年的Q/DG1-K401-2004《火力發電廠分散控制系統(DCS)技術規范書》中,DCS應用的主要功能子系統仍然還是以上四項,但實際上近幾年DCS的應用范圍迅速擴展,除了一大批高參數、大容量、不同控制結構的燃煤火電機組的各個控制子系統全面應用外,脫硫系統、脫硝系統、空冷系統、大型循環流化床(CFB)鍋爐等新工藝上都成功應用??梢哉f只要工藝上能夠實現的系統,DCS都能實現對其進行可靠控制。
1.1.2單元機組控制系統一體化的崛起。
(1)隨著一些電廠將電氣發變組和廠用電系統的控制(ECS)功能納入DCS的SCS控制功能范圍,ETS控制功能改由DCS模件構成,DEH與DCS的軟硬件合二為一,以及一些機組的煙氣濕法脫硫控制直接進入單元機組DCS控制的成功運行,標志著控制系統一體化,在DCS技術的發展推動下而走向成熟。
(2)由于一體化減少了信號間的連接接口以及因接口及線路異常帶來的傳遞過程故障,減少了備品備件的品種和數量,降低了維護的工作量及費用,所以近幾年一體化控制系統在不同容量的新建機組中逐漸得到應用。
(3)控制系統一體化的實現,是電力行業DCS應用功能快速發展的體現。排除人為因素外,控制系統一體化將為越來越多的電廠所采用。
1.1.3DCS結構變化,應用技術得到快速發展。
(1)隨著電子技術的發展,近年來DCS系統在結構上發生變化。過去強調的是控制功能盡可能分散,由此帶來的是使用過多的控制器和接口間連接。但過多的控制器和接口間連接,不一定能提高系統運行可靠性,相反到有可能導致故障停機的概率增加。何況單元機組各個控制系統間的信號聯系千絲萬縷,互相牽連,一對控制器故障就可能導致機組停機,即使沒有直接導致停機,也會影響其它控制器因失去正確的信號而不能正常工作。因此隨著控制器功能與容量的成倍增加、更多安全措施(包括采用安全性控制器)、冗余技術的采用(有的DCS的核心部件CPU,采用2×2冗余方式)以及速度與可靠性的提高,目前DCS正在轉向適度集中,將相互聯系密切的多個控制系統和非常復雜的控制功能集中在一對控制器中,以及上述所說的單元機組采用一體化控制系統,正成為DCS應用技術發展的新方向,這不但減少了故障環節,還因內部信息交換方便和信息傳遞途徑的減少而提高了可靠性。
(2)此外,隨著近幾年DCS應用技術的發展,如采用通用化的硬件平臺,獨立的應用軟件體系,標準化的通訊協議,PLC控制器的融入,FCS功能的實現,一鍵啟動技術的成功應用等,都為DCS增添了新的活力,功能進一步提高,應用范圍更加寬廣。
1.2全廠輔控系統走向集中監控。
(1)一個火電廠有10多個輔助車間,國內過去通常都是由PLC和上位機構成各自的網絡,在各車間控制室內單獨控制,因此得配備大量的運行人員。為了提高設備控制水平和勞動生產率,達到減員增效的目的,隨著DCS技術和網絡通訊功能的提高,目前各個輔助車間的控制已趨向適度集中,整合成一個輔控網(簡稱BOP 即Balance Of Plant的縮寫)方向發展,即將相互獨立的各個輔助系統,利用計算機及網絡技術進行集成,在全廠IT系統上進行運行狀況監控,實現控制少人值班或無人值班。
(2)近幾年新建工程迅速向這個方向發展。如國華浙能寧海電廠一期工程(4×600MW)燃煤機組BOP覆蓋了水、煤、灰等共13個輔助車間子系統的監控,下設水、煤、灰三個監控點,集中監控點設在四機一控室里,打破了傳統的全廠輔助車間運行管理模式,不但比常規減員30%,還提升了全廠運行管理水平。整個輔控網的硬件和軟件的統一,減少了庫存備品備件及日常管理維護費用[1]。由于取消了多個就地控制室,使得基建費用和今后的維護費用都減少。一些老廠的輔助車間也在進行BOP改造。
1.3變頻技術的普及應用與發展。
(1)變頻器作為控制系統的一個重要功率變換部件,以提供高性能變壓變頻可控的交流電源的特點,前些年在火電廠小型電機(如給粉機、凝泵)等控制上的應用,得到了迅猛的發展。由于變頻調速不但在調速范圍和精度,動態響應速度,低速轉動力矩,工作效率,方便使用方面表現出優越性,更重要的是節能效果在經濟及社會效益上產生的顯著效應,因此繼一些中小型電機上普遍應用后,近年來交流變頻調速技術,擴展到一些高壓電機的控制上試用,如送、引風機和給水泵電機轉速的控制等。
(2)因為蘊藏著巨大的節能潛力,可以預見隨著高壓變頻器可靠性的提高、一次性投資降低和對電網的諧波干擾減少,更多機組的風機、水泵上的大電機會走向變頻調速控制,在一段時間內,變頻技術將繼續在火電廠節能工作中,扮演重要角色。
1.4局部系統應用現場總線。
(1)自動化技術的發展,帶來新型自動化儀表的涌現,現場總線系統(FCS)是其中一種,它和DCS緊密結合,是提高控制信號傳輸的準確性、實時性、快速性和機組運行的安全可靠性,解決現場設備的現代化管理,以及降低工程投資等的一項先進的和有效的組合。目前在西方發達國家,現場總線已應用到各個行業,其中電力行業最典型的是德國尼德豪森電廠2×950MW機組的控制系統,采用的就是PROFIBUS現場總線。
(2)我國政府從“九五”起,開始投資支持現場總線的開發,取得階段性成果,HART儀表、FF儀表開始生產。但電廠控制由于其高可靠性的要求,目前缺乏大型示范工程,缺乏現場總線對電廠的設計、安裝、調試、生產和管理等方面影響的研究,因此現場總線在電廠的應用仍處于探討摸索階段,近二年我國有十多個工程應用了現場總線,但都是在局部系統上,其中: 某電廠,在單元機組的開、閉式水系統中的電動門控制采用Profibus DP總線技術,電動執行機構采用原裝進口德國歐瑪公司的一體化智能型產品Puma Matic,帶有雙通道Profibus-DP冗余總線接口作為DP從站掛在總線上。為了提高安全性可靠性,總線光纖、作為總線上的第一類DP主站的AP和相應的光電轉換裝置都采用了冗余結構,這是國內首家在過程控制中采用現場總線技術的火力發電廠。
(3)某電廠的補給水處理系統和廢水系統[2],采用了二層通訊網絡結構的現場總線控制系統,其鏈路設備和主站級網絡采用冗余配置??刂葡到y人機終端與主控制器之間采用工業以太網通訊,以太網交換機采用ITP形式接口,四臺交換機構成光纖高速路網?,F場設備層之間采用Profibus-DP現場總線通訊。主環網采用光纜,分支現場總線通訊選用總線電纜。配置二套冗余的主控制器,分別用于鍋爐補給水系統和廢水系統,且各自有兩條由光電耦合器組成的現場總線環形光纜網構成冗余配置,所有現場儀表和氣動閥門定位器(均采用帶PA總線接口),通過DP/PA耦合器連接到現場總線上。中低壓電器設備(MCC)采用具有現場總線通信接口功能的智能電機控制器。加藥泵的電動機采用帶總線的變頻器。鍋爐補給水的陰陽離子床氣動隔膜閥的電磁控制閥,采用具有總線接口的閥島來控制,閥島與現場總線連接。這是國內在局部過程控制中全面采用現場總線技術的首個火電廠,其應用實踐表明,輔控網全面采用現場總線技術已成熟。
1.5熱工控制優化技術的應用發展。
(1)隨著過程生產領域對控制系統要求的不斷提高,傳統控制方法越來越難以滿足火電廠熱力流程對系統穩定性和性能最優化方面的要求,汽溫超標已經成為制約機組負荷變化響應能力和安全穩定運行的主要障礙之一(燃燒優化主要是鍋爐專業在進行,本文不作討論)。由此基于現代控制理論的一些現代控制系統逐步在火電廠過程控制領域中得到應用。如基于過程模型并在線動態求解優化問題的模型預測控制(簡稱MPC)法、讓自動裝置模擬人工操作的經驗和規律來實現復雜被控對象自動控制的模糊控制法、利用熟練操作員手動成功操作的經驗數據,在常規的串級PID調節系統的基礎上建立基于神經網絡技術的前饋控制作用等,在提高熱工控制系統(尤其是汽溫控制系統)品質過程中取得較好效果。
(2)如某電廠使用的西門子公司PROFI系統,充分使用了基于模型的現代控制理論,其中汽溫控制原理示意圖如圖1所示。
(3) 圖1中,用基于狀態空間算法的狀態觀測器解決汽溫這種大滯后對象的延遲造成的控制滯后,焓值變增益控制器解決蒸汽壓力的變化對溫度控制的影響,基于模型的Smith預估器對導前溫度的變化進行提前控制;通過自學習功能塊實時補償減溫水閥門特性的變化;而對再熱汽溫控制,盡量以煙道擋板作為調節手段,不采用或少采用減溫水作為控制手段,以提高機組效率;在機組協調控制模塊中,采用非最小化形式描述的離散卷積和模型,提高系統的魯棒性;根據控制品質的二次型性能指標連續對預測輸出進行優化計算,實時對模型失配、時變和干擾等引起的不確定性因素進行補償,提高系統的控制效果;PROFI投入后,AGC狀態下以2% Pe /min負荷率變化時的響應時間為57秒,壓力最大偏差0.208MPa,汽包水位變化最高和最低之差為-38.86mm,爐膛負壓變化曲線最高值和最低值差-145Pa,主蒸汽溫度偏差穩態基本控制在2℃以內,動態基本控制在5℃以內。
1.6SIS系統的應用發展。
(1)SIS系統是實現電廠管理信息系統與各種分散控制系統之間數據交換、實時信息共享的橋梁,其功能包括廠級實時數據采集與監視,廠級性能計算與分析。在電網明確調度方式有非直調方式且應用軟件成熟的前提下,可以設置負荷調度分配功能。設備故障診斷功能、壽命管理功能、系統優化功能以及其它功能(根據電廠實際情況確定是否設置)[3]。自從國家電力公司電力規劃總院在2000年提出這一概念和規劃后,至今估計有200家多電廠建立了SIS系統,可謂發展相當迅速。
(2)但是自從SIS系統投運以來,其所起的作用只是數據的采集、存儲、顯示和可打印各類生產報表,能夠真正把SIS的應用功能盡情發揮出來的很少,其面向統計/生產管理的數據分析工具,基于熱經濟性分析的運行優化,以品質經濟性為目標的控制優化,以提高可靠性為目的的設備故障診斷等功能基本多數都未能付緒實施。其原因主要有設計不夠完善,多數SIS廠家并沒有完全吃透專業性極強的后臺程序及算法,使其在生產實際中未能發揮作用,加上與現場生產脫節,因此SIS商所能做的只是利用網絡技術,邊搭建一個基本的SIS 架構邊進行摸索。此外SIS應涵蓋哪些內容沒有統一的標準也緩慢了其功能的應用。
(3)但從大的方向上看,SIS系統的建設符合技術發展的需要和中國電力市場發展的趨勢,將給發電廠特別是大型的現代化發電廠帶來良好的經濟效益。
2. 電力行業熱工自動化系統的未來發展動向及前景
隨著國家法律對環保日益嚴格的要求和計算機網絡技術的進步,未來熱工系統將圍繞 “節能增效,可持續發展”的主題,向智能化、網絡化、透明化,保護、控制、測量和數據通信一體化發展,新的測量控制原理和方法不斷得以應用,將使機組的運行操作和故障處理,象操作普通計算機一樣方便。
2.1單元機組監控智能化是熱工自動化系統發展方向。
(1)單元機組DCS的普及應用,使得機組的監控面貌煥然一新,但是它的監控智能化程度在電力行業卻沒有多大提高。雖然許多智能化的監視、控制軟件在國內化工、冶金行業中都有較好的應用并取得效益,可在我國電力行業直到近幾年才開始有所起步。隨著技術的進步,火電廠單元機組自動化系統的智能化將是一種趨勢,因此未來數年里,實現信息智能化的儀表與軟件將會在火電廠得到發展與應用。
(2)如:儀表智能管理軟件,將對現場智能傳感器進行在線遠程組態和參數設置、對因安裝位置和高靜壓造成的零位飄移進行遠程修正,精度自動進行標定,計算各類誤差, 并生成標定曲線和報告;自動跟蹤并記錄儀表運行過程中綜合的狀態變化,如掉電、高低限報警、取壓管路是否有堵或零位是否有飄移等。
(3)閥門智能管理軟件將對智能化閥門進行在線組態、調試、自動標定和開度階躍測試,判斷閥門閥桿是否卡澀, 閥芯是否有磨損等,通過閥門性能狀況的全面評估,為實現預測性維護提供決策。
(4)重要轉動設備的狀態智能管理軟件將對重要轉動設備的狀態如送風機,引風機,給水泵等,綜合采用基于可靠性的狀態監測多種技術,通過振動、油的分析以及電機診斷,快速分析(是否存在平衡不好,基礎松動, 沖擊負荷,軸承磨損)等現象和識別故障隱患, 在隱患尚未擴展之前發出報警,為停機檢修提供指導和幫助。
(5)智能化報警軟件將對報警信號進行匯類統計、分析和預測,對機組運行趨勢和狀態作出分析、判斷,用以指導運行人員的操作;故障預測、故障診斷以及狀態維修等專用軟件,將在提高機組運行的安全性,最大限度地挖掘機組潛力中發揮作用。單元機組監控智能化將帶來機組檢修方式的轉變,以往定期的、被動式維護將向預測性、主動式為主的維護方式過渡,檢修計劃將根據機組實際狀況安排。
2.2過程控制優化軟件將得到進一步應用。
(1)進一步提高模擬量控制系統的調節范圍和品質指標,是火電廠熱工自動化控制技術研究的一個方向。雖然目前有關自適應、狀態預測、模糊控制及人工神經網絡等技術,在電廠控制系統優化應用的報道有不少,但據筆者了解真正運行效果好的不多。隨著電力行業競爭的加劇,安全、經濟效益方面取得明顯效果、通用性強、安裝調試方便的優化控制專用軟件(尤其是燃燒和蒸汽溫度優化、性能分析軟件、)將會在電廠得到親睞、進一步發展與應用。
(2)目前機組的AGC均為單機方式(由調度直接把負荷指令發給投入AGC的機組)。由于電網負荷變化頻繁,使投入AGC的機組始終處于相應的變負荷狀態,鍋爐的蒸汽壓力和溫度波動幅度大,輔機、閥門、擋板等設備動作頻繁,這種方式對機組和設備的壽命都會產生一定的負面影響。隨著發電成本的提高,發電企業需從各個角度考慮如何切實降低電廠運行成本,延長機組的使用壽命。因此配置全廠負荷分配系統(即電網調度向電廠發一個全廠負荷指令,由電廠的全廠負荷分配系統,以機組的煤耗成本特性為基礎,在機組允許的變化范圍內,經濟合理地選擇安排機組的負荷或變負荷任務,使全廠發電的煤耗成本最低,降低電廠的發電成本)將是發電企業必然的要求,相信不久的將來,單機AGC方式將會向全廠負荷分配方式轉變。
(3)SIS系統將結合生產實際進行二次開發,促進自身應用技術走向成熟,在確?;痣姀S安全、環保、高效益及深化信息化技術應用中發揮作用。
2.3現場總線與DCS相互依存發展。
未來一段時間里,現場總線將與DCS、PLC相互依存發展,現場總線借助于DCS和PLC平臺發展自身的應用空間,DCS和PLC則借助于現場總線完善自身的功能。
2.3.1現場總線與DCS的關系。
現場總線作為一個完整的現場總線控制系統,目前還難以迅速應用到整個電廠中,而DCS雖然是電廠目前在線運行機組的主流控制系統,但由于其檢測和執行等現場儀表信號仍采用模擬量信號,無法滿足工程師站上對現場儀表進行診斷、維護和管理的要求,限制了控制過程視野,因此DCS通過容入通信協議國際標準化的現場總線和適合現場總線連接的智能化儀表、閥門,并將自身的輸出驅動功能分離移到現場或由現場智能驅動器代替,功能簡單且相對集中的控制系統下放到采用FCS控制和處理功能的現場智能儀表中,然后由少量的幾根同軸電纜(或光纜)和緊急停爐停機控制用電纜,通過全數字化通信與控制室連接。將有助于降低電廠造價,提高自身的可靠性,拓寬各自的功能,推動各自的發展。除新建電廠將會更多的采用現場總線的智能設備外,也會成為運行多年的機組下一步的改造計劃。
2.3.2現場總線與PLC的關系。
(1)現場總線在電廠的應用將借助于PLC,這不但因為PLC已廣泛應用于電廠輔助設備的控制,將現場總線技術和產品溶合到PLC系統中,成為PLC系統中的一部分或者成為PLC系統的延伸部分,在輔助設備的控制中將直接明顯地體現其經濟效益。還因為現場總線和PLC的制造商間關系密切,如、ProfiBus等本身就是由PLC的主要生產供貨商支持開發。
(2)由于電廠現場的環境惡劣,溫度高、灰塵多、濕度變化大,因此現場總線在電廠應用,首先要解決的是自身質量。
2.4輔助車間(系統)集控將得到全面推廣。
隨著發電廠對減員增效的要求和運行人員整體素質的提高,輔助車間(系統)通過輔控網集控將會得到進一步全面推廣。但在實施過程中,目前要解決好以下問題:
(1)輔控系統I/O點數量大,各輔助車間物理位置分散,存在遠距離通信、信號衰減和網絡干擾問題,因此監控系統主干通信網宜采用多模光纜以確保通信信號的可靠性。
(2)各輔助控制系統采用不同的控制設備,控制系統的通信接口協議不同,甚至不同的物理接口,因此須解決網絡通信協議的轉換問題,選型時應事先規定好各系統間的接口連接協議。
(3)各個輔助車間的控制系統為不同的廠商供貨,由于使用的軟件不同,其操作員站的人機界面很有可能不一致。因此選型時應注意上位機軟件,設計統一的人機界面,采用統一的風格及操作方式,以便方便各系統畫面接入BOP網絡。
輔助車間集控系統能否實現設計目標,除了自身的技術以外,很大程度上取決于輔助系統本身的自動投入情況。因此高可靠性的執行機構、動作靈活可靠的限位開關、智能化的變送器將會得到應用。
2.5單元機組監控系統的物理配置趨向集中布置。
過去一個集控室的概念,通常為一臺單元機組獨用或為二臺機組合用,電子室分成若干個小型的電子設備間,分別布置在鍋爐、汽輪機房或其它主設備附近。其優點是節省了電纜。但隨著機組容量的提高、計算機技術的發展和管理水平的深化,近幾年集控室的概念擴大,出現了全廠單元機組集中于一個控制室,單元機組的電子設備間集中,現場一般的監視信號大量采用遠程I/O柜的配置方式趨勢。
2.6APS技術應用。
(1)APS是機組級順序控制系統的代名詞。在機組啟動中,僅需按下一個啟動控制鍵,整個機組就將按照設計的先后順序、規定的時間和各控制子系統的工作情況,自動啟停過程中的相關設備,協調機爐電各系統的控制,在少量人工干預甚至完全不用人工干預的情況下,自動地完成整臺機組的啟停。但由于設備自身的可控性和可用率不滿足自動化要求,加上一些工藝和技術上還存在問題,需要深入地分析研究和改進,所以目前燃煤機組實施APS系統的還不多見。
(2)由于APS系統的實質是電廠運行規程的程序化,其優勢在于可以大大減輕運行人員的工作強度,避免人為操作中的各種不穩定因素,縮短機組啟停時間。作為提高生產效率和機組整體自動化水平,增強在電力企業的市場競爭能力行之有效的方法,將會成為未來機組控制發展的方向之一,引導設計、控制系統廠商和電廠人員更多地去深入研究,設計和完善功能,并付緒實施。
2.7無線測量技術應用。
無線測量技術能監視和控制運行過程中發生的更多情況,獲得關鍵的工藝信息,整合進入DCS。除節省大量安裝成本以外,還將推動基本過程和自動化技術的改善。如供熱、供油和煤計量,酸堿、污水區域測量等,都可能通過無線測量技術實現遠程監控。
2.8提高熱工自動化系統可靠性研究將深入。
由于熱控系統硬軟件的性能與質量、控制邏輯的完善性和合理性、保護信號的取信方式和配置、保護連鎖信號的定值和延遲時間設置,以及熱控人員的檢修和維護水平方面,都還存在一些不足之處,由此使得熱控保護系統誤動作引起機組跳閘事件還時有發生。在電力生產企業面臨安全考核風險增加和市場競爭加劇的環境下,本著電力生產“安全第一,預防為主”的方針,以及效益優先原則,從提高熱工自動化系統的可靠性著手,深入開展技術研究,是熱工自動化系統近期的一項急需進行的工作。提高熱工自動化系統的可靠性技術研究工作,包括控制軟硬件的合理配置,采集信號的可靠性、干擾信號的抑制,控制邏輯的優化、控制系統故障應急預案的完善等。隨著機組控制可靠性要求的提高,重要控制子系統的硬件配置中,將會采用安全型控制器、安全型PLC系統或者它們的整合,保護采集信號將會更多的采用三選二判斷邏輯。獨立的測量裝置需要設計干擾信號抑制功能。此外基建機組一味以最低價中標的招標模式也應得到扭轉(最低價中標,迫使廠商通過減少配置來降低投標價,導致控制系統可靠性下降)。
2.9火電廠機組檢修運行維護方式將改變。
(1)隨著電力市場的競爭,發電企業將趨向集約化經營和管理結構扁平化,為提高經濟效益,發電企業在多發電,以提高機組利用小時的同時,將會通過減少生產人員的配備,密切與外包檢修企業之間的聯系,讓專業檢修隊伍取替本廠檢修隊伍的方式來提高勞動生產率。因此檢修維修工作社會化將是一種趨勢。此外DCS的一體化及其向各功能領域滲透,提高電廠整體協調和信息化、自動化水平的同時,也將會使電廠原專業間及專業內的分工重新調整,比如熱工與電氣二次回路的專業劃分打通。為了降低成本,電廠不再保持大批的檢修維修人員,因此檢修維護方式也將因此而改變,比如讓生產廠家和公司承擔DCS和相關設備的檢修工作。