神經網絡卷積層的作用范例6篇

前言:中文期刊網精心挑選了神經網絡卷積層的作用范文供你參考和學習,希望我們的參考范文能激發你的文章創作靈感,歡迎閱讀。

神經網絡卷積層的作用

神經網絡卷積層的作用范文1

關鍵詞關鍵詞:深度學習;卷積神經網絡;古玩圖片;圖像識別

DOIDOI:10.11907/rjdk.162768

中圖分類號:TP317.4

文獻標識碼:A文章編號文章編號:16727800(2017)005017405

0引言

隨著電子商務的發展,大批藝術品交易網站隨之興起,藏品交易規模也越來越大。而當前的古玩網上交易平臺還不能夠實現對現有藏品圖片的自動分類,客戶在尋找目標藏品時不得不在眾多圖片中一一瀏覽。因此需要一種有效的方法來完成面向圖像內容的分類。

在基于內容的圖像檢索領域,常使用人工設計的特征-如根據花瓶、碗、盤子的不同形態特征:目標輪廓的圓度、質心、寬高比等[1],繼而使用BP神經網絡、SVM分類器等對特征進行學習分類。文獻[2]基于植物葉片的形狀特征,如葉片形狀的狹長度、矩形度、球狀性、圓形度、偏心率、周長直徑比等,利用BP神經網絡實現對植物葉片進行分類。文獻[3]研究印品圖像的各類形狀缺陷,利用圖像缺陷形狀的輪廓長度、面積和圓形度等幾何特征,導入SVM分類器進行訓練,得到分類器模型實現分類。文獻[4]提出了一種基于Zernike矩的水果形狀分類方法,通過提取圖像中具有旋轉不變性的Zernike矩特征,并運用PCA方法確定分類需要的特征數目,最后將這些特征輸入到SVM分類器中,完成水果形狀的分類。上述方法都要求對目標形狀分割的準確性,而分割過程中由于存在目標陰影、目標分割不完整問題,會影響到人工特征的準確選取。除了上述人工特征外,最常用的特征是HOG[5,6]、SIFT[7,8]等。HOG的核心思想是所檢測的局部物體外形能夠被光強梯度或邊緣方向的分布所描述。HOG表示的是邊緣結構特征,因此可以描述局部形狀信息。SIFT在圖像的空間尺度中尋找極值點,并提取出其位置、尺度、旋轉不變量。SIFT特征對于旋轉、尺度縮放、亮度變化保持不變。但是,這兩種特征在實際應用中,描述子生成過程冗長、計算量太大。而且在上述方法征設計需要啟發式的方法和專業知識,很大程度上依靠個人經驗。

卷積神經網絡不需要手動設計提取特征,可以直接將圖片作為輸入,隱式地學習多層次特征,進而實現分類[9]。相比目前常用的人工設計特征然后利用各分類器,具有明顯的優勢。近年來,卷積神經網絡已成為語音、圖像識別領域研究熱點。它的權值共享特點使得網絡復雜度降低,權值數量減少。而且,卷積神經網絡直接將圖片作為輸入,避免了復雜的特征設計和提取,具有一定的平移、縮放和扭曲不變性[10]。本文采用卷積神經網絡對古玩圖片進行分類。首先,將背景分離后的圖片作為網絡的輸入,相比原圖作為輸入,此方法的網絡結構更加簡單。然后,卷積層通過不同的卷積核對輸入圖片進行卷積得到不同特征圖,采樣層進一步對特征圖進行二次提取,最終提取到合適的特征輸入分類器進行分類,而在卷積層、采樣層征圖的大小、數目都會影響到網絡的分類能力。因此,本文通過優化網絡參數,使網絡達到較好的分類效果。

1卷積神經網絡

1989年,LECUN等[11]提出了卷積神經網絡(Convolution Neural Networks,CNN),CNN是一種帶有卷積結構的深度神經網絡,一般至少有2個非線性可訓練的卷積層、2個非線性的固定采樣層和1個全連接層,一共至少5個隱含層[12]。百度于2012年底將深度學習技術成功應用于自然圖像OCR識別和人臉識別,此后深度學習模型被成功應用于一般圖片的識別和理解。從百度經驗來看,深度學習應用于圖像識別不但大大提升了準確性,而且避免了人工特征抽取的時間消耗,從而大大提高了在線計算效率[13]。

卷積神經網絡作為一種高效的深度學習方法[14],在許多圖像識別方面取得了很好的成效[1519]。該網絡作為一種多隱層神經網絡,可以提取圖像的多層次特征進行識別。

卷積神經網絡主要包括卷積層和采樣層,卷積層通過可學習的卷積核對輸入圖片進行卷積得到特征圖,卷積操作即加強了輸入圖片的某種特征,并且降低噪聲。卷積之后的結果通過激活函數(通常選擇Sigmoid函數或Tanh函數)作用輸出構成該層的特征圖。特征圖上的每一個神經元只與輸入圖片的一個局部區域連接,每個神經元提取的是該局部區域的特征,所有神經元綜合起來就得到了全局特征,與神經元相連接的局部區域即為局部感受野[20]。而在卷積層中一般存在多張特征圖,同一張特征圖使用相同的卷積核,不同特征圖使用不同的卷積核[21],此特點稱為權值共享,即同一張特征圖上的所有神經元通過相同的卷積核連接局部感受野。卷積神經網絡的局部感受野和嘀倒蠶硤氐憒蟠蠹跎倭送絡訓練的參數個數,降低了網絡模型的復雜度。

采樣層對卷積層提取到的特征圖進行局部非重疊采樣,即把特征圖分為互不重疊的N×N個子區域,對每個子區域進行采樣。卷積神經網絡的采樣方式一般有兩種:最大值采樣和均值采樣。最大值采樣即選取區域內所有神經元的最大值作為采樣值,均值采樣為區域內所有神經元的平均值作為采樣值。最大值采樣偏向于提取目標的特征信息,而均值采樣偏向于提取背景的特征信息[22]。采樣后的特征平面在保留了區分度高特征的同時大大減少了數據量,它對一定程度的平移、比例縮放和扭曲具有不變性。

卷積神經網絡通過卷積層和采樣層的循環往復提取到圖像由低層次到高層次的特征,最后一般通過全連接層將所有特征圖展開得到一維向量,然后輸入到分類器進行分類。

卷積神經網絡在處理二維圖像時,卷積層中每個神經元的輸入與上一層的局部感受野相連接,并提取該局部的特征,權值共享特點又使得各神經元保持了原來的空間關系,將這些感受不同局部區域的神經元綜合起來就得到了全局信息。采樣層對特征圖進行局部特征提取,不會改變神經元之間的空間關系,即二維圖像經過卷積層、采樣層仍然保持二維形式。因此,卷積神經網絡有利于提取形狀方面的特征。雖然卷積神經網絡的局部感受野、權值共享和子采樣使網絡大大減少了需要訓練參數的個數,但是該網絡作為多隱層神經網絡還是十分復雜的。對于不同的數據庫,為了達到比較好的分類效果,網絡的層數、卷積層特征圖個數以及其它參數的設置都需要探究。

2基于卷積神經網絡的古玩圖片分類

2.1特征提取及傳遞

不同古玩的主要區別在于形狀不同,而花瓶、盤子和碗在古玩中最常見,因此將這3類圖片作為實驗對象,對于其它種類的古玩圖片的分類,該網絡同樣適用。卷積神經網絡采用如下圖所示的5層網絡結構,并對網絡各層的特征圖數目、大小均作了修改。對于網絡的輸入,先將原圖像進行目標與背景分割,然后進行灰度化、統一分辨率的處理,最后輸入到卷積神經網絡。由于訓練卷積神經網絡的根本目的是提取不同古玩的特征,而背景不是目標的一部分,對古玩識別來說并不提供任何有用的信息,反而對特征的提取造成干擾,所以去除背景噪聲后,網絡結構會更加簡單,同時也利于網絡對特征的學習。但是因為進行了去背景的預處理,網絡也失去了對復雜背景下圖片的識別能力,所以使用該網絡進行古玩圖片分類前都要進行目標分割的預處理過程。

卷積神經網絡對古玩圖片的特征提取過程如下:

(1)輸入網絡的圖片為100×100大小的預處理圖,卷積神經網絡的輸入層之后為卷積層,卷積層通過卷積核與輸入圖像進行卷積得到特征平面,卷積核大小為5×5。如圖2所示,特征平面上每個神經元與原圖像5×5大小的局部感受野連接。卷積核移動步長為1個像素,因此卷積層C1的特征平面大小為96×96。這種卷積操作在提取到輸入圖像的某一方面特征時,必然會損失掉圖像的其他特征,而采取多個卷積核卷積圖像得到多個特征平面則會一定程度上彌補這個缺陷。因此,在卷積層C1中使用了6個不同的卷積核與輸入圖像進行卷積,得到6種不同的特征平面圖。如圖3所示,同一張特征圖上的所有神經元共享一個卷積核(權值共享),圖中連接到同一個特征圖的連接線表示同一個卷積核,6個不同的卷積核卷積輸入圖片得到6張不同的特征平面圖。卷積之后的結果并非直接儲存到C1層特征圖中,而是通過激活函數將神經元非線性化,從而使網絡具有更強的特征表達能力。激活函數選擇Sigmoid函數。

卷積層中所使用的卷積核尺寸若過小,就無法提取有效表達的特征,過大則提取到的特征過于復雜。對于卷積層征圖個數的設置,在一定范圍內,特征圖的個數越多,卷積層提取到越多有效表達原目標信息的特征,但是特征圖個數如果過多,會使提取到的特征產生冗余,最終使分類效果變差。卷積層的各平面由式(1)決定: Xlj=f(∑i∈MjXl-1j*klij+blj)(1)

式(1)中,Mj表示選擇輸入的特征圖集合,l是當前層數,f是激活函數,klij表示不同輸入特征圖對應的卷積核,blj為輸出特征圖對應的加性偏置。

(2)卷積層C1后的采樣層S1由6個特征平面組成,采樣層對上一層特征圖進行局部平均和二次特征提取。采樣過程如圖4所示,特征平面上的每個神經元與上一層4×4大小的互不重合的鄰域連接進行均值采樣,最終每個平面的大小為24×24。采樣層的各平面由式(2)決定:

Xlj=f(βljdown(Xl-1j)+blj)(2)

式(2)中,down(.)表示一個下采樣函數,l是當前層數,f是激活函數,βlj表示輸出特征圖對應的乘性偏置,blj為輸出特征圖對應的加性偏置。

(3)卷積層C2與C1層操作方式一樣,唯一區別的是C2層每個特征圖由6個不同的卷積核與上一層6個特征圖分別卷積求和得到,因此C2層一共有6×6個不同的卷積核,卷積核大小為5×5,C2層每個平面大小為20×20,共6個特征平面。

(4)采樣層S2與S1層操作一樣,對上一層4×4大小鄰域進行均值采樣,輸出6個5×5大小的特征平面。本文所用的網絡共包括2個卷積層、2個采樣層、1個全連接層,由于輸入圖片已經過背景分離的預處理,采樣層S2特征圖大小為5×5,所以圖1所示5層網絡已經有很好的表達能力。如果直接將原圖作為輸入,那么網絡的層數以及特征圖的個數將比圖1所示的網絡更加復雜。

(5)全連接層將上一層6個5×5大小的二維平面展開成為1×150大小的一維向量輸入Softmax[23]分類器,輸出層一共有3個神經元(即分類的種類數目),分類器將提取到的特征向量映射到輸出層的3個神經元上,即實現分類。

2.2網絡訓練

訓練方式為有監督地訓練,網絡對盤子、花瓶和碗共三類圖片進行分類,所以分類器輸出一個3維向量,稱為分類標簽。在分類標簽的第k維中1表示分類結果,否則為0。訓練過程主要分為兩個階段:

第一階段:向前傳播A段。

將預處理過的圖片輸入卷積神經網絡計算得到分類標簽。

第二階段:向后傳播階段。

計算輸出的分類標簽和實際分類標簽之間的誤差。根據誤差最小化的原則調整網絡中的各個權值。分類個數為3,共有N個訓練樣本。那么第n個樣本的誤差為:

En=12∑3k=1(tnk-ynk)2(3)

式(3)中,tn表示第n個樣本的網絡輸出標簽,tnk對應標簽的第k維,yn表示第n個樣本的實際分類標簽,ynk對應標簽的第k維。為了使誤差變小,利用權值更新公式(4)更新各層神經元的權值,一直訓練直到網絡誤差曲線收斂。

W(t+1)=W(t)+η?δ(t)?X(t)(4)

式(4)中,W(t)表示算第n個樣本時的權值,W(t+1)表示計算第n+1個樣本的權值,η為學習速率,選取經驗值,δ為神經元的誤差項,X表示神經元的輸入。

3實驗結果及分析

實驗在MatlabR2012a平臺上完成,CPU 2.30GHz,內存4GB,所采用的圖像由相關古玩網站提供,分辨率統一格式化為100×100。由于盤子、花瓶和碗在各種古玩種類中它們之間的形狀差別比較明顯,本文實驗對這三類古玩圖片進行分類。對古玩圖片進行了水平翻轉處理,增加圖片數據量,以加強網絡對古玩圖片分類的魯棒性。實驗數據如表1所示,圖5列出了3類圖片的部分樣本,實驗所用圖片均與圖5所示圖片類似,背景比較單一,少數圖片下方有類似陰影。

為了形象表示網絡各層提取的不同特征,圖6展示了當網絡輸入為盤子時的各層特征圖。卷積層C1中6張特征圖分別提取到了輸入圖片的不同特征,而由于權值共享,同一張特征圖中神經元的空間關系保持不變,所以6張特征圖都抓住了盤子的圓形特征。采樣層S1對C1進行均值采樣,相當于模糊濾波,所以S1層各特征圖看起來模糊了一些。卷積層C2中每張特征圖由6個不同的卷積核卷積S1層各特征圖疊加而成,S2層與S1層處理方式相同。

為了說明將背景分離后的圖片作為輸入的網絡與原圖輸入的網絡之間的差異,設計了如表3所示的兩種網絡結構,網絡CNN4只需要4層網絡層就可以達到0.19%的錯誤率,而原圖作為輸入的CNN8共6層網絡層,在網絡達到收斂的情況下,錯誤率為5.24%。由此可以說明,將背景分離后圖片作為輸入的網絡結構更加簡單。

網絡的訓練采用了批量訓練方式,即將樣本分多批,當一批樣本前向傳播完之后才進行權值更新,每批大小為100,訓練集共2 200張圖片,網絡迭代次數為1時共進行22次權值更新,所以權值更新的計算次數與迭代次數有如下關系:

計算次數=22×迭代次數(5)

圖7為網絡在訓練集上的誤差曲線圖,橫坐標為誤差反向傳播的計算次數,縱坐標為訓練集上的均方誤差??梢钥闯?,當網絡訓練次數達到270次(計算次數約6 000)時,訓練集誤差趨于平緩,網絡已經基本擬合。訓練好的網絡可以用來對測試集圖片進行分類,表4為不同迭代次數下訓練的網絡在測試集上的分類錯誤率,可以看出迭代次數在達到270次后,網絡在測試集的錯誤率收斂,此時只有2張圖片出現分類錯誤。

表5給出了圖像分類算法中常用的人工特征+BP神經網絡、人工特征+SVM分類器以及Hog特征+SVM分類器與CNN方法的性能比較。人工設計的特征包括圖片中目標輪廓的最大長寬比、質心、圓度等特征。從準確率方面來看,CNN方法的準確率高于其他方法,Hog特征方法的準確率遠遠高于人工特征的方法,說明了特征的好壞對圖像分類效果有著很大程度上的影響,CNN提取到的特征比Hog和人工設計的特征更具代表性。從測試時間來看,Hog方法與CNN方法相差不多,采用人工特征的方法時間最長。綜合兩個方面,CNN方法在測試時間和HOG方法相近的情況下,準確率最高。

4結語

針對網上古玩圖片分類問題,為了克服現有算法中人工設計特征困難以及往往依賴個人專業經驗的不足,提出一種基于卷積神經網絡的方法。將背景分離后的目標圖片作為網絡輸入,可以實現自動提取特征進行分類,背景分離后圖片作為網絡輸入使得網絡結構更加簡單,并且設置了合適的特征圖個數以使網絡在古玩圖片集上取得較好的分類準確率。實驗數據表明,該方法能夠解決網上古玩圖片的分類問題,并且分類準確率達到99%,其準確率優于常用的Hog特征以及人工特征方法。另外該方法不僅可以應用于網上古玩圖片,還可應用于鞋類、服裝等其它商品圖像的分類。

參考文獻參考文獻:

[1]K KAVITHA,M.V.SUDHAMANI.Object based image retrieval from database using combined features[C].in Signal and Image Processing (ICSIP),2014.

[2]董紅霞,郭斯羽,一種結合形狀與紋理特征的植物葉片分類方法[J].計算機工程與應用,2014,50(23):185188.

[3]舒文娉,劉全香,基于支持向量機的印品缺陷分類方法[J].包裝工程,2014,35(23):138142.

[4]應義斌,桂江生,饒秀勤,基于Zernike矩的水果形狀分類[J].江蘇大學學報:自然科學版,2007,28(1):3639.

[5]ZHU Q,YEH M C,CHENG K T,et al.Fast human detection using acascade of histograms of oriented gradients[C].Proceedings of the 2006 IEEE Computer Society Conference on Computer Vision and Pattern Recognition,2006.

[6]M VILLAMIZAR,J SCANDALIANS,A SANFELIU bining colorbased invariant gradient detector with Hog descriptors for robust image detection in scenes under cast shadows[C].In Robotics and Automation,ICRA IEEE International Conference on.Barcelona,Spain:IEEE,2009.

[7]CHEN J,LI Q,PENG Q,et al.CSIFT based localityconstrained linear coding for image classification[J].Formal Pattern Analysis & Applications,2015,18(2):441450.

[8]AHMAD YOUSEF K M,ALTABANJAH M,HUDAIB E,et al.SIFT based automatic number plate recognition[C].International Conference on Information and Communication Systems.IEEE,2015.

[9]LAWRENCE S,GLIES C L,TSOI A C,et al.Face recognition:a convolutional neuralnetwork approach[J].IEEE Transactions on Neural Networks,1997,8(1):98113.

[10]TREVOR HASTIE,ROBERT TIBSHIRANI,J FRIEDMAN.The elements of statistical learning[M].New York:Springer,2001.

[11]Y LECUN,L BOUOU,Y BENGIO.Gradientbased learning applied to document recognition[J].Proceedings of the IEEE,1998,86(11):22782324.

[12]DAHL J V,KOCH K C,KLEINHANS E,et al.Convolutional networks and applications in vision[C].International Symposium on Circuits and Systems (ISCAS 2010),2010:253256.

[13]余凱,賈磊,陳雨強,等.深度學習的昨天、今天和明天[J].計算機研究與發展,2013(09):17991804.

[14]MAIRAL J,KONIUSZ P,HARCHAOUI Z,et al.Convolutional kernel networks[DB/OL].http:///pdf/1406.3332v2.pdf.

[15]Z世杰,楊東坡與劉金環,基于卷積神經網絡的商品圖像精細分類[J].山東科技大學學報:自然科學版,2014(6):9196.

[16]程文博等,基于卷積神經網絡的注塑制品短射缺陷識別[J].塑料工業,2015(7):3134,38.

[17]鄧柳,汪子杰,基于深度卷積神經網絡的車型識別研究[J].計算機應用研究,2016(4):14.

[18]T JONATAN,S MURPHY,Y LECUN,et al.Realtime continuous pose recovery of human hands using convolutional networks[J].ACM Transaction on Graphics,2014,33(5):3842.

[19]S SKITTANON,A C SURENARAN,J C PLATT,et al.Convolutional networks for speech detection[C].Interspeech.Lisbon,Portugal:ISCA,2004.

[20]HUBEL D H,WIESEL T N.Integrative action in the cat's lateral geniculate body[J].Journal of Physiology,1961,155(2):385398.

[21]JAKE BOUVRIE.Notes on convolutional neural networks[DB/OL].http:///5869/1/cnn_tutorial.pdf.

神經網絡卷積層的作用范文2

黑匣認為,復雜神經網絡、LSTMs(長短期記憶網絡)、注意力模型(Attention Models)等十大趨勢將塑造人工智能未來的技術格局。

上述判斷來自NIPS(神經信息處理系統) 2015大會。NIPS始于1987年,是人工智能領域兩大重要學習會議之一,由于AI的爆炸式發展,近年來逐漸成為許多硅谷公司必須參加的年度會議。在蒙特利爾召開的NIPS 2015吸引了眾多AI學界與業界的頂級專家,與會人數接近4000。大會總共收錄了403篇論文,其中深度學習課題約占11%。來自Dropbox的高級軟件工程師Brad Neuberg分享了他所注意到的十大技術趨勢,黑匣將對每種趨勢做了詳細分析。

1、神經網絡的架構正變得越來越復雜

感知和翻譯等大多數神經網絡的架構正變得越來越復雜,遠非此前簡單的前饋神經網絡或卷積神經網絡所能比。特別需要注意的是,神經網絡正與不同的技術(如LSTMs、卷積、自定義目標函數等)相混合。

神經網絡是多數深度學習項目的根基。深度學習基于人腦結構,一層層互相連接的人工模擬神經元模仿大腦的行為,處理視覺和語言等復雜問題。這些人工神經網絡可以收集信息,也可以對其做出反應。它們能對事物的外形和聲音做出解釋,還可以自行學習與工作。未來的人工智能,最熱門的技術趨勢是什么?

(人工模擬神經元試圖模仿大腦行為|圖片來源:Frontiers)

但這一切都需要極高的計算能力。早在80年代初期,Geoffrey Hinton和他的同事們就開始研究深度學習。然而彼時電腦還不夠快,不足以處理有關神經網絡的這些龐大的數據。當時AI研究的普遍方向也與他們相反,人們都在尋找捷徑,直接模擬出行為而不是模仿大腦的運作。

隨著計算能力的提升和算法的改進,今天,神經網絡和深度學習已經成為人工智能領域最具吸引力的流派。這些神經網絡還在變得更復雜,當年“谷歌大腦”團隊最開始嘗試“無監督學習”時,就動用了1.6萬多臺微處理器,創建了一個有數十億連接的神經網絡,在一項實驗中觀看了千萬數量級的YouTube圖像。

2、酷的人都在用LSTMs

當你閱讀本文時,你是在理解前面詞語的基礎上來理解每個詞語的。你的思想具有連續性,你不會丟棄已知信息而從頭開始思考。傳統神經網絡的一大缺陷便是無法做到這一點,而遞歸神經網絡(RNN)能夠解決這一問題。

RNN擁有循環結構,可以持續保存信息。過去幾年里,RNN在語音識別和翻譯等許多問題上取得了難以置信的成功,而成功的關鍵在于一種特殊的RNN——長短期記憶網絡(LSTMs)。

普通的RNN可以學會預測“the clouds are in the sky”中最后一個單詞,但難以學會預測“I grew up in France…I speak fluent French?!敝凶詈笠粋€詞。相關信息(clouds、France)和預測位置(sky、French)的間隔越大,神經網絡就越加難以學習連接信息。這被稱為是“長期依賴關系”問題。未來的人工智能,最熱門的技術趨勢是什么?

(長期依賴問題|圖片來源:CSDN)

LSTMs被明確設計成能克服之一問題。LSTMs有四層神經網絡層,它們以特殊的方式相互作用。這使得“能記住信息很長一段時間”可以被視作LSTMs的“固有行為”,它們不需要額外學習這一點。對于大多數任務,LSTMs已經取得了非常好的效果。

3、是時候注意“注意力模型(attention models)了

LSTMs是人們使用RNNs的一個飛躍。還有其他飛躍嗎?研究者共同的想法是:“還有注意力(attention)!”

“注意力”是指神經網絡在執行任務時知道把焦點放在何處。我們可以讓神經網絡在每一步都從更大的信息集中挑選信息作為輸入。

例如,當神經網絡為一張圖片生成標題時,它可以挑選圖像的關鍵部分作為輸入。未來的人工智能,最熱門的技術趨勢是什么?

(擁有“注意力”的RNN在圖像識別中的成功運用|圖片來源:Github)

4、神經圖靈機依然有趣,但還無法勝任實際工作

當你翻譯一句話時,并不會逐個詞匯進行,而是會從句子的整體結構出發。機器難以做到這一點,這一挑戰被稱為“強耦合輸出的整體估計”。NIPS上很多研究者展示了對跨時間、空間進行耦合輸出的研究。

神經圖靈機(Neural Turing Machine)就是研究者們在硅片中重現人類大腦短期記憶的嘗試。它的背后是一種特殊類型的神經網絡,它們可以適應與外部存儲器共同工作,這使得神經網絡可以存儲記憶,還能在此后檢索記憶并執行一些有邏輯性的任務。未來的人工智能,最熱門的技術趨勢是什么?

(模仿人類短期工作記憶的神經圖靈機|圖片來源:arXiv)

2014年10月,Google DeepMind公布了一臺原型電腦,它可以模仿一些人類大腦短期工作記憶的特性。但直到NIPS2015,所有的神經圖靈機都過于復雜,并且只能解決一些“小玩具”問題。在未來它們或將得到極大改進。

5、深度學習讓計算機視覺和自然語言處理不再是孤島

卷積神經網絡(CNN)最早出現在計算機視覺中,但現在許多自然語言處理(NLP)系統也會使用。LSTMs與遞歸神經網絡深度學習最早出現在NLP中,但現在也被納入計算機視覺神經網絡。

此外,計算機視覺與NLP的交匯仍然擁有無限前景。想象一下程序為美劇自動嵌入中文字幕的場景吧。

6、符號微分式越來越重要

隨著神經網絡架構及其目標函數變得日益復雜和自定義,手動推導出“反向傳播”(back propagation)的梯度(gradients)也變得更加苦難而且容易出錯。谷歌的TensorFlow等最新的工具包已經可以超負荷試驗符號微分式,能夠自動計算出正確的微分,以確保訓練時誤差梯度可被反向傳播。

7、神經網絡模型壓縮的驚人成果

多個團隊以不同方法大幅壓縮了訓練一個良好模型所需的素材體量,這些方法包括二值化、固定浮點數、迭代修剪和精細調優步驟等。

這些技術潛在的應用前景廣闊,可能將會適應在移動設備上進行復雜模型的訓練。例如,不需要延遲就可以得到語音識別結果。此外,如果運算所需要的空間和時間極大降低,我們就可以極高幀率(如30 FPS)查詢一個模型,這樣,在移動設備上也可以運用復雜神經網絡模型,從而近乎實時地完成計算機視覺任務。

8、深度學習和強化學習繼續交匯

雖然NIPS 2015上沒有什么強化學習(reinforcement learning)的重要成果,但“深度強化學習”研討會還是展現了深度神經網絡和強化學習相結合的前景。

在“端對端”(end-to-end)機器人等領域出現了令人激動的進展,現在機器人已經可以一起運用深度和強化學習,從而將原始感官數據直接轉化為實際動作驅動。我們正在超越“分類”等簡單工作,嘗試將“計劃”與“行動”納入方程。還有大量工作需要完成,但早期的工作已經使人感到興奮。

9、難道你還沒有使用批標準化?

批標準化(batch normalization)現在被視作評價一個神經網絡工具包的部分標準,在NIPS 2015上被不斷提及。

神經網絡卷積層的作用范文3

關鍵詞: 積分投影; 循環神經網絡; 長短時記憶網絡; 防止過擬合技術; 精度; 留一法

中圖分類號:TP391.4 文獻標志碼:A 文章編號:1006-8228(2017)04-13-04

Abstract: The existing research on micro expression recognition is mainly based on the improved LBP (local binary patterns) algorithm and SVM (support vector machine). Recently, integral projection has been applied in the field of face recognition. The long and short memory network (LSTM), as a kind of recurrent neural network, can be used to process time series data. So LSTM-IP model, which combines integral projection with LSTM, is proposed, and experimented on the latest micro-expression database CASME II. The horizontal and vertical projection vectors obtained by integral projection are used as the input of LSTM and classified, and the over-fitting preventing method is used. The experimental results show that LSTM-IP algorithm gets better results than the previous method.

Key words: integral projection; recurrent neural network; long and short memory network; prevent over-fitting; accuracy; leave-one-subject-out cross validation

0 引言

人們表情的短時間變化,也叫微表情,心理學在這方面的研究很早就開始了。近年來,有關利用機器學習的方法來對微表情進行研究的學者越來越多,其成為當前一個熱門研究方向。微表情的研究成果可用于測謊[2-4]、臨床診斷等方面,因橐話閎思幢閌切睦硪繳也很難注意到1/25~1/5秒人表情的變化[1],而這時,機器可以很好的對微表情進行自動的識別。

最近,基于積分投影和紋理描述符的方法被用在人臉識別[5],然而,很少有研究將積分投影用于包含人臉的時間序列中進行識別。微表情與人臉識別有很大不同,特征很難單從每幀圖片中提取,這時就需要考慮時間軸。LSTM可以對時序數據進行分類,以前基本用在語音識別和自然語言處理的任務中,很少用于圖像識別,可能是因為LSTM處理的是一維的數據,而圖像是二維的數據。將圖像的二維信息積分投影到一維(水平方向和垂直方向),并以此作為LSTM的輸入并分類,這樣就能將二者很好的結合起來。

本文構造了基于積分投影和LSTM的深度學習的模型來對微表情進行識別。得到的結果不僅比以前的基于局部二值模式(LBP)的方法好,而且也略微的優于最近基于積分投影的論文中的方法。

1 CASME II微表情數據集介紹

2014年,中科院心理研究所建立了更進一步改進的自然誘發的微表情數據庫CASMEII[8]。CASMEII有26個平均年齡為22歲左右的亞洲人,9類表情(happiness, surprise, disgust, fear, sadness, anger, repression, tense, negative)組成。用來錄制的高速相機為200 fps。高速相機可以捕捉更細節的微表情。CASMEII是據我們所知目前最好的自然誘發的微表情數據庫。

2 基于差分圖像的積分投影

Mateos等人的開拓性工作[6-7]表明積分投影可以提取同一人臉圖像的共同基本特征。積分投影將人臉的特征水平和垂直投影,可以用公式⑴和⑵表示:

其中It(x,y)表示時間為t時,圖像位于(x,y)時的像素值,Ht(y)和Vt(x)表示水平和垂直積分投影。直接將積分投影應用到CASME II微表情數據集上效果如圖1所示。

然而,由于微表情的變化是十分微小的,若直接采用上面的積分投影會有很多噪聲,從圖1(c)可以看出區分不是很明顯。因此,我們采用改進的積分投影方法??梢杂霉舰呛廷缺硎荆?/p>

我們將每個視頻下的2到N幀微表情的圖像減去第1幀,將得到的差分圖像做積分投影,效果如圖2所示。

從圖2的(c)可以看出,采用基于差分圖像的水平積分投影效果更好,去掉了不必要的噪聲。

3 長短時記憶網絡

循環神經網絡(RNN)可以用來處理時序數據,但它有一個明顯的缺陷,就是不能記憶發生在較久以前的信息。長短時記憶網絡(LSTM)[9]是一種特殊的RNN,比RNN多了一些特殊的門和細胞,可以學習長期依賴信息。LSTM結構如圖3所示。

最上面橫著帶箭頭的線包含細胞單元,作用是記憶之前LSTM單元的信息。x和+表示點分的乘法與加法,表示Sigmoid激活函數(如公式⑸),tanh表示雙曲正切激活函數(如公式⑹)。

最下面圓圈中的X和最上面圓圈中的h分別表示時序輸入和輸出。

通用的LSTM結構可以參考圖4,圖4中,底層節點為輸入,頂層節點為輸出,中間層為隱藏層節點或記憶塊。(a)描述的是傳統的 感知機(MLP)網絡,即不考慮數據的時序性,認為數據是獨立的;(b)將輸入序列映射為一個定長向量(分類標簽),可用于文本、視頻分類;(c)輸入為單個數據點,輸出為序列數據,典型的代表為圖像標注;(d)這是一種結構序列到序列的任務,常被用于機器翻譯,兩個序列長度不一定相等;(e)這種結構會得到一個文本的生成模型,每詞都會預測下一時刻的字符。

4 LSTM-IP模型

因為CASME II數據集每個視頻下微表情圖像幀數是不一樣的,為了方便我們統一LSTM的輸入,所以我們提取了最能代表這個視頻微表情的10幀,同時,本文將整個數據集圖像的尺寸統一到200×200像素,將原來彩色圖像轉化為灰度圖像。通過基于差分圖像的積分投影,得到一個視頻下差分圖像每幀圖像的水平和垂直投影,一個圖像可以得到一個200維的水平向量和一個200維的垂直向量,因為差分圖像是后面9張減去了第一張圖像,所以一個視頻下共有9個水平向量和9個垂直向量,初始化兩個9×200大小的一維向量分別保存水平向量和垂直向量。

本文采用圖4(b)和圖4(e)結合的LSTM結構,如圖5所示。

頂層的X_IP表示將一個視頻下9個差分圖像的水平投影組成的9×200的一維特征向量作為輸入,經過第一層LSTM得到9×128的一維特征向量,接著經過第二層LSTM得到9×128的一維特征向量,最后經過一層LSTM得到一個128的特征向量,Y_IP也是同樣的處理過程。最后將這兩部分的128的特征向量連接起來作為一個256的特征向量輸入softmax分類器,結果輸出屬于五類微表情的哪一類。在圖5的每兩層之間加入一層Dropout層,Dropout的比率設為0.5。LSTM內部參數初始化采用了glorot_normal,相比較于其他初始化方法,glorot_normal效果最好。

Softmax和Dropout在深度學習中都是常用的技術。Softmax是邏輯斯特回歸應用于多分類的推廣。Dropout[10]這種技術的作用是減少過擬合,是一種正則化技術,通過防止由完全連接的層引起神經元的參數過多,有助于減少神經網絡的過度擬合問題。給定 dropout率p,其在我們的LSTM中被設置為0.5,50%單位將被保留,而另外50%將被放棄。簡單地說,“Dropout”只是隨機忽略一些神經元。然而在測試階段,每個神經元的輸出將通過因子1-p(保持率)加權以保持與訓練階段中產生相同的效果。如圖6所示。

我們的實驗采用基于Theano的keras框架,keras借b了Torch的搭建深度學習網絡的方式,而且使用筆者比較熟悉的Python語言(Torch使用Lua語言),keras的底層可以是Theano或者Tensorflow,可能是因為keras最先在Theano開發的,經過實驗比較單個GPU下,Theano的速度要比Tensorflow快,所以我們的底層采用Theano。

5 實驗結果與分析

現在微表情識別的算法主要是基于LBP改進的算法,例如LBP-TOP[11](Local Binary Pattern-Three Orthogonal Planes)、LBP-SIP[12](LBP-Six Intersection Points)和LOCP-TOP[13](Local ordinal contrast pattern-

TOP)等。我們將LSTM-IP算法與以前的方法做了比較,如表1所示。

實驗是在CASME II上做的,因為CASME II微表情數據集是最新最好的微表情數據集。STLBP-IP也是基于積分投影的,結合了1DLBP來提取特征。通過表1的比較我們發現,基于積分投影的算法效果好于原來基于LBP的算法,可以得出,采用提取積分投影特征的方法在微表情數據集CASME II上效果比較好。可以看出,STLBP-IP的性能優于文獻[27]的重新實現,STLBP-IP的精度提高了20.64%。從表1中可知,時間插值法(TIM)可以提高LBP-TOP的性能,其中LBP-TOP增加到39.68%。然而,與STLBP-IP相比,LBP-TOP在微表情識別上的效果上有很大的差距(19.43%)。比較兩種基于積分投影的方法,本文提出的方法略微好于STLBP-IP,但通過閱讀STLBP-IP的論文筆者發現,這種方法存在繁瑣的調參過程,比如圖像如何分塊,SVM核參數的選擇,而本文提出的LSTM-IP算法可以自動從差分圖像的積分投影中學習,調參的內容比較少,而且速度也很快。這些結果表明,LSTM-IP實現了令人滿意的效果,而不是LOCP-TOP和LBP-SIP。 這部分地解釋了LSTM-IP通過使用積分投影來保持形狀和辨識的能力。

實驗采用了留一法交叉驗證,CASME II有26個subjects,通過把每個subject作為測試,其余作為訓練,循環26次,最后把每次測試得到的正確視頻個數相加除以總的視頻數,得到識別精度,這種方法現在是微表情識別主流的驗證方法。

6 Y束語

基于差分圖像的積分投影方法,保存了我們微表情形狀的特征,然后增強微表情的辨別力。深度學習在圖像識別領域已經取得了很不錯的成績,而現在深度學習的技術還沒有應用于微表情識別。本文將差分圖像的積分投影與LSTM結合,從實驗結果上看,結果要好于以前的方法。我們認為深度學習的探索不會停止,會有越來越多新的網絡模型產生,也會有越來越多的深度學習的技術應用于微表情識別。

我們將繼續探索基于深度學習的微表情識別的方法及技術手段。卷積神經網絡在圖像識別上取得了很好的成績,但筆者也將卷積神經網絡應用于微表情上,效果并不好,可能是因為微表情在圖像上變化比較細微,卷積神經網絡不容易捕捉到特征,但如果考慮了一個視頻時間序列的特性,也許會有比較好的結果,對此還有待進一步研究。隨著技術的進步,相信微表情識別效果會越來越好,并最終能夠應用于我們的生活中。

參考文獻(References):

[1] Ekman P. Micro Expressions Training Tool[M]. Emotion-

srevealed. com,2003.

[2] Ekman P. Darwin, deception, and facial expression[J].

Annals of the New York Academy of Sciences,2003.1000(1):205-221

[3] Ekman P. Lie catching and microexpressions[J]. The

philosophy of deception,2009:118-133

[4] Ekman P, O'Sullivan M. From flawed self-assessment to

blatant whoppers: the utility of voluntary and involuntary behavior in detecting deception[J]. Behavioral sciences & the law,2006.24(5):673-686

[5] Benzaoui A, Boukrouche A. Face recognition using 1dlbp

texture analysis[J]. Proc. FCTA,2013: 14-19

[6] Mateos G G. Refining face tracking with integral projections

[C]//International Conference on Audio-and Video-Based Biometric Person Authentication. Springer Berlin Heidelberg,2003: 360-368

[7] García-Mateos G, Ruiz-Garcia A, López-de-Teruel P

E. Human face processing with 1.5 D models[C]//International Workshop on Analysis and Modeling of Faces and Gestures. Springer Berlin Heidelberg,2007:220-234

[8] Yan W J, Li X, Wang S J, et al. CASME II: An improved

spontaneous micro-expression database and the baseline evaluation[J]. PloS one, 2014.9(1):e86041

[9] Hochreiter S, Schmidhuber J. Long short-term memory[J].

Neural computation,1997.9(8):1735-1780

[10] Hinton G E, Srivastava N, Krizhevsky A, et al. Improving

neural networks by preventing co-adaptation of feature detectors[J]. Computer Science,2012.3(4):212-223

[11] Zhao G, Pietikainen M. Dynamic texture recognition

using local binary patterns with an application to facial expressions[J]. IEEE transactions on pattern analysis and machine intelligence,2007.29(6).

[12] Wang Y, See J, Phan R C W, et al. Lbp with six

intersection points: Reducing redundant information in lbp-top for micro-expression recognition[C]//Asian Conference on Computer Vision. Springer International Publishing,2014:525-537

[13] Chan C H, Goswami B, Kittler J, et al. Local ordinal

contrast pattern histograms for spatiotemporal, lip-based speaker authentication[J]. IEEE Transactions on Information Forensics and Security,2012.7(2):602-612

神經網絡卷積層的作用范文4

全球關注的人機世紀之戰

人們總是對未知領域充滿了好奇與敬畏,從計算機誕生之日起,各種有關人工智能的猜想便從終止過。人們一方面希望人工智能能夠超越人類智慧,一方面又害怕被科技超越,矛盾的心態下,每一次以智慧為焦點的人機對戰都會成為市場關注的焦點。

2016年3月9日至15日,被稱為“世紀人機大戰”的韓國棋手李世石VS谷歌圍棋機器人AlphaGo的比賽最終以AlphaGo贏得四局落下帷幕,雖然本身關注和懂得圍棋的人并不多,但這場人機世紀大戰卻通過各種渠道讓全球億萬計的人們知道了―人類智慧被人工智能打敗了!回顧以往的人機大戰,人類并非永恒的勝者,美國IBM公司的“深藍”超級計算機以2勝1負3平戰勝了當時世界排名第一的國際象棋大師卡斯帕羅夫,但絕大多數人卻不以為意,除十分接近的勝敗結果外,深藍主要是依靠運算能力窮舉所有路數來選擇最佳策略,它當時可以實現每秒兩億步的運算。很多人覺得卡斯帕羅夫的落敗與體力有關,深藍的策略多少有些“無賴”。

但AlphaGo卻在“深藍”獲勝十九年后的今天,擁有自主深度學習進化的AlphaGo以難以讓人爭議的過程和結果,在圍棋這一人類智慧競技的高地上戰勝了韓國棋手李世石。

能夠深層學習的AlphaGo

“深藍”之所以能夠有超人的絕佳表現,幾乎純粹是靠運算能力。依靠存儲的數百萬個國際象棋案例,能在眾多可能性中進行篩選,從而確定下一步棋的最佳位置。這給人感覺在用體力玩智慧游戲了,但AlphaGo卻給人們展示了一個幾乎完全靠自學,并通過觀察成功與失敗案例來掌握得勝技巧的系統。谷歌利用大數據與深度學習的技術優勢為AlphaGo構建了一套策略網絡,機器通過深度學習能力,模擬人腦的機制來學習、判斷、決策。即AlphaGo可以從大量的棋譜和對局中學習策略,形成一套落子決策判斷與數據解讀的能力體系,讓其在沖殺狀態下懂得一套試探與引導的能力,最終成功擊敗人類棋手李世石。

人類是惟一能夠將直覺(隱式的)和符號(顯式的)知識結合起來的物種,人類具有這樣的雙重能力,將前者轉換成后者,然后通過后者的反饋反過來改善前者,這在以往是人類擁有的特殊性和唯一性。但今天,AlphaGo無縫使用了分層的網絡(即深度卷積神經網絡)進行直覺學習,強化,評估和策略,配以強悍的計算能力,它完全不需要解決任何語義復雜性并且可從容地從現實考慮中分離,人的思維模式加上科技的理性結合,這讓AlphaGo能夠在對局結束前30分鐘就向Google技術分析團隊報告自己確信必勝。

下一步是理解

沒有人性弱點的AlphaGo讓我們看到了人工智能神經網絡的前景在于它在不斷縮小機器和人類之間的差距,而且隨著技術開發者的跟進,人工智能將會對理解人類語言,揣摩人類情感。

理解人類,這對于巨頭們的想象空間在于,基于用戶需求的商業決策會因此更加精準。人機對戰讓我們看到,推理、判斷、分析問題等功能處理之外,識別人的情感與情緒與對人的語言理解力將是未來發展的高地。

圍棋大戰,只能體現出,在封閉規則的計算領域,機器比人類聰明得多,因為我們的心算能力本身與計算器相差甚遠;但是思維、對話、情感等都是不確定的。而前面說到,機器沒有情緒,只有它懂得了人類的語言,逐漸了解人類表達的意思甚至是情緒,才意味著人工智能達到了更高的領地。AlphaGo及其背后的AI領域真的能實現,而這一切都是建立在搜索的原理與算法的未來改進上。

小知識:它不是一條狗

阿爾法圍棋(AlphaGo)是一款圍棋人工智能程序,由位于英國倫敦的谷歌(Google)旗下DeepMind公司的戴維 西爾弗、艾佳 黃和戴密斯 哈薩比斯與他們的團隊開發,這個程序利用“價值網絡”去計算局面,用“策略網絡”去選擇下子。2015年10月阿爾法圍棋以5:0完勝歐洲圍棋冠軍、職業二段選手樊麾;2016年3月對戰世界圍棋冠軍、職業九段選手李世石,并以4:1的總比分獲勝。

四位一體的AlphaGo系統

歸根到底,AlphaGo系統目前還是一件科技產物,其本身由走棋網絡、快速走子、估值網絡和蒙特卡羅樹搜索四個部分組成,正是這四個部分的協同與融合,讓AlphaGo擁有能夠學習的智慧,最終戰勝李世石。走棋網絡(Policy Network),給定當前局面,預測/采樣下一步的走棋??焖僮咦樱‵ast rollout),目標和1一樣,但在適當犧牲走棋質量的條件下,速度要比1快1000倍。 估值網絡(Value Network),給定當前局面,估計是白勝還是黑勝。蒙特卡羅樹搜索(Monte Carlo Tree Search,MCTS),把以上這三個部分連起來,形成一個完整的系統。

讓電腦擁有棋感的走棋網絡

走棋網絡把當前局面作為輸入,預測/采樣下一步的走棋。它的預測不只給出最強的一手,而是對棋盤上所有可能的下一著給一個分數。棋盤上有361個點,它就給出361個數,好招的分數比壞招要高。以往的科技只是單純基于規則或者基于局部形狀,利用簡單的線性分類器訓練完成走子,整個過程是不可能形成類似人類圍棋選手的棋感。

AlphaGo去利用更高效的、寬度為192的網絡(正常棋盤上有361個點,電腦給出361個數,好招的分數比壞招要高。),下出有最高置信度的落子。這樣的做法一點也沒有做搜索,但是大局觀非常強,不會陷入局部戰斗中,說它建模了“棋感”一點也沒有錯。但是走棋網絡會不顧大小無謂爭劫,會無謂脫先,不顧局部死活,對殺出錯等等,更多像是高手憑借“自覺”在下棋,因而需要加入搜索功能,讓電腦做出有價值的判斷。

追求效率的快速走子

作為人類智慧競技的高地,圍棋用用天文數字般的局面數,走棋網絡能讓AlphaGo達到3毫秒的下子速度,但想要進一步提高AlphaGo的“反應”及“思考”能力,就需要快速走子系統的幫助了。

利用傳統的局部特征匹配(local pattern matching)加線性回歸(logisticregression)的方法,AlphaGo在吸納了眾多高手對局之后就具備了用梯度下降法自動調參的能力,從而實現了2微秒的走子速度和24.2%的走子準確率。24.2%的意思是說它的最好預測和圍棋高手的下子有0.242的概率是重合的,相比之下,走棋網絡在GPU上用2毫秒能達到57%的準確率。在AlphaGo有了快速走子之后,不需要走棋網絡和估值網絡,不借助任何深度學習和GPU的幫助,不使用增強學習,在單機上就已經達到非常高的水平了。

錦上添花的估值網絡

估值網絡對盤面的評估應用上同快速走子有些重疊,都是通過模擬落子得分評估當前及后面布局的優劣,但通過估值網絡和快速走子的互補,在復雜的死活或對殺時,也就是進行到中盤階段的時候,估值網絡的重要性就會得到提升。前面提到AlphaGo能夠提前30分鐘知道自己必勝,估值網絡就起到了很大的作用。

盡量選擇更好的蒙特卡羅樹搜索

“蒙特卡洛樹搜索”是一種啟發式的搜索策略,能夠基于對搜索空間的隨機抽樣來擴大搜索樹,從而分析圍棋這類游戲中每一步棋應該怎么走才能夠創造最好機會。

一位名叫蘇椰的知乎用戶舉了這樣一個例子,以通俗的語言進行了解釋:假如筐里有100個蘋果,讓我每次閉眼拿1個,挑出最大的。于是我隨機拿1個,再隨機拿1個跟它比,留下大的,再隨機拿1個……我每拿一次,留下的蘋果都至少不比上次的小。拿的次數越多,挑出的蘋果就越大,但我除非拿100次,否則無法肯定挑出了最大的。這個挑蘋果的算法,就屬于蒙特卡羅算法:盡量找好的,但不保證是最好的。

擁有兩個大腦的AlphaGo

AlphaGo是通過兩個不同神經網絡“大腦”合作來改進下棋。這些大腦是多層神經網絡跟那些Google圖片搜索引擎識別圖片在結構上是相似的。它們從多層啟發式二維過濾器開始,去處理圍棋棋盤的定位,就像圖片分類器網絡處理圖片一樣。經過過濾,13個完全連接的神經網絡層產生對它們看到的局面判斷。這些層能夠做分類和邏輯推理。

AlphaGo的第一個神經網絡大腦科學全稱應該是“監督學習的策略網絡(Policy Network)”,觀察棋盤布局企圖找到最佳的下一步。團隊通過在KGS(網絡圍棋對戰平臺)上最強人類對手,百萬級的對弈落子去訓練大腦。這就是AlphaGo最像人的地方,目標是去學習那些頂尖高手的妙手。這個不是為了去下贏,而是去找一個跟人類高手同樣的下一步落子。AlphaGo這個大腦的出色之處在于不單要模仿學習,更要追求速度,不斷模擬計算圍棋局面變化,最終選擇正確率最高的落子。

價值評估則可看做AlphaGo的第二個大腦,通過整體局面判斷來輔助落子選擇器。AlphaGo能夠決定是否通過特殊變種去深入閱局面和落子,如果局面評估器說這個特殊變種不行,那么AI就跳過閱讀在這一條線上的任何更多落子。

深度神經網絡的運用

人類在下圍棋時,通常會經歷常識-棋感-計算-判斷四個過程,AlphaGo的常識源于其“監督學習的策略網絡(Policy Network)”帶來的深層學習能力,而棋感和計算則需要深度神經網絡同蒙特卡洛算法的融合,兩者的融合讓AlphaGo整個運作方式更接近人類。通過對比使用蠻力計算的“深藍”眼中的國際象棋落子思路和AlphaGo眼中的圍棋落子思路會發現,圍棋的復雜度需要更“聰明”的AI才能完成了。

兩個大腦加上深度神經網絡,AlphaGo以Value networks來評估大量的選點,而以Policy networks來選擇落子,并且開發了一種新式算法來結合蒙特卡洛算法和以上兩個神經網絡。在這種結合下,研究者們結合參考人類職業對局的監督式學習,和AI大量積累自對弈實現的深度學習,來訓練和提高AI的圍棋實力。

AI的進步與期望

圍棋代表了很多人工智能所面臨的困難:具有挑戰性的決策制定任務、難以破解的查找空間問題和優化解決方案如此復雜以至于用一個策略或價值函數幾乎無法直接得出。通過將策略和價值網絡與樹搜索結合起來,AlphaGo終于達到了專業圍棋水準,讓我們看到了希望:在其他看起來無法完成的領域中,AI也可以達到人類級別的表現。

當然,這一切都是建立在人類千年來在圍棋領域積累上的,沒有積累就不會圍棋AI的今天。AlphaGo讓世人看到了AI領域的巨大進步,但想要真正理解人類和語言,其還有一段很長的路要走。相比圍棋,人類在生活上的行為習慣,需要AlphaGo們擁有更出色的學習能力以及判斷能力,無論是存儲容量還是搜索算法,都需要幾何倍數的遞增,從這個角度看,現在擔心AlphaGo們擁有自己的意識或情感,都太早了一些。

滲透進入人們生后的AI

AlphaGo不是DeepMind惟一項目,也不是最大的項目。DeepMind的最終目標是智能助手、醫療和機器人。另外,盡管AlphaGo只是針對圍棋開發的系統,但其原理可以被應用到現實問題中。以醫療為例,IBM已經依靠認知學習平臺“Watson”進入了醫療領域,Watson在泰國和印度的兩家醫院協助醫生診斷乳腺癌、肺癌和結腸直腸癌。盡管Watson自身不會診斷疾病,但它能夠找到醫生應該進一步認真檢查的地方,并提出治療方案。

而無人駕駛汽車其實也可以看做具備了身軀的AI,家喻戶曉的特斯拉汽車便使用了基于深度學習的現有計算機視覺技術。當然,工業或者服務用機器人都是AI滲透進入人們生活的表現。AI公司們正在努力晚上其產品,爭取能夠無縫進入人們生活的各個領域,當AI設備在可靠性、適應性和靈活性等方面都有長足進步時,人們未來的生活也將變得更美好。

谷歌改變人類的野心

AlphaGo很強大很厲害,但對于近年來谷歌的謀劃而言,AlphaGo無非是其在人工智能領域的小玩具而已。改組Alphabet的谷歌,瘋狂地在全球收購各個尖端前沿領域的頂尖公司,把觸角伸到了生命科學、人工智能、無人駕駛、虛擬現實等等許多的領域。AlphaGo背后的英國Deepmind公司,只是他們收購的許許多多家公司中的一個而已。

除了傳統Youtube、Gmail和地圖等等互聯網業務,生命科學、人工智能、無人駕駛、虛擬現實等新領域其實谷歌并沒有賺到什么錢,更多是對未來的投資和布局,但今天,AlphaGo的表現已經讓我們看到了谷歌的投入回報,再加上眾多具有顛覆性或者劃時代意義的谷歌黑科技,讓我們清楚看到了谷歌改變人類未來的野心。相比之下,國內BAT三大巨頭在技術積淀和領域格局方面,就顯得有些小氣了。

人工智能的競賽

在2010年到2015年期間,企業對人工智能創業公司的投資增長了15倍。BBC預測,人工智能市場將繼續保持高速增長,2020年全球市場規模將達到183億美元,約合人民幣1190億元。龐大的數據和潛力,足以讓企業們瘋狂。

在硅谷,截至2015年初就有超過1700家創業公司加入人工智能浪潮―這一數字過去1年還在不斷增加之中。谷歌、Facebook、亞馬遜等科技巨頭們的巨大投入都推動AI整個領域取得巨大進步。圖像識別、語音識別已經成為蘋果、微軟、Google、IBM等科技大公司激烈競爭的焦點,而在醫療識別、模擬大腦圖像等細分領域中,也涌現出不少初創的科技企業??梢哉f,一場席卷全球的AI競賽正在展開,誰能讓科技變得更聰明,誰就有望在未來的競爭中占據有利位置。

神經網絡卷積層的作用范文5

在為人們提供便捷服務的同時,互聯網應用也存在很多安全問題及威脅,如計算機病毒、變異木馬等,利用大規?;ヂ摼W集成在一起產生的漏洞攻擊網絡,導致數據泄露或被篡改,甚至使整個網絡系統無法正常運行。隨著網絡接入用戶的增多,互聯網接入的軟硬件資源也更多,因此對網絡安全處理速度就會有更高的要求,以便能夠提高木馬或病毒處理速度,降低網絡病毒的感染范圍,積極的響應應用軟件,具有重要的作用和意義。

2網絡安全防御技術應用發展現狀

目前,人們已經進入到了“互聯網+”時代,面臨的安全威脅也更多,比如木馬病毒、DDOS攻擊和數據盜竊等?;ヂ摼W受到的攻擊也會給人們帶來嚴重的損失,比如勒索病毒攻擊了許多的大型跨國公司、證券銀行等,到這這些政企單位的辦公電腦全都發生了藍屏現象,用戶無法進入到操作系統進行文件處理,勒索病毒要求這些單位支付一定額度的贖金才可以正常使用系統,導致許多公司損失了很多的資金。分布式服務器攻擊(DDOS)也非常嚴重,模擬大量的用戶并發訪問網絡服務器,導致正常用戶無法登陸服務器。因此,為了提高信息安全,人們提出了防火墻、殺毒軟件或訪問控制列表等安全防御技術

2.1防火墻

防火墻是一種比較先進的網絡安全防御軟件,這種軟件可以設計很多先進的規則,這些規則不屬于互聯網的傳輸層或網絡層,可以運行于互聯網TCP/IP傳輸協議棧,使用循環枚舉的基本原則,逐個檢查每一個通過網絡的數據包,如果發現某個數據包的包頭IP地址和目的地IP地址及包內容等存在威脅,就可以及時的將其清除,不允許通過網絡。

2.2殺毒軟件

殺毒軟件是一種非常先進的程序代碼,其可以查殺網絡中存在的安全威脅,利用病毒庫中一些收錄的病毒或木馬特征,判斷互聯網中是否存在這些類似的病毒或木馬。殺毒軟件采用了很多技術,如主動防御、啟發技術、特征碼技術、脫殼技術、行為分析等,這些都可以實時的監控訪問互聯網的運行狀態,確保網絡正常使用。目前,許多大中型企業都開發了殺毒軟件,比如360安全衛士、江民殺毒、騰訊衛士、卡巴斯基等,取得了顯著的應用成效。

3基于人工智能的網絡安全防御系統設計

3.1系統功能分析

基于人工智能的網絡安全防御系統利用機器學習或模式識別技術,從互聯網中采集流量數據,將這些數據發送給人工智能模型進行分析,發現網絡中是否存在網絡病毒。具體的網絡安全防御系統的功能包括以下幾個方面:

3.1.1自動感知功能

自動感知是人工還能應用的一個重要亮點,這也是網絡安全系統最為關鍵的功能,自動感知可以主動的分析互聯網中是否存在安全隱患,比如病毒、木馬等數據片段,利用這些片段特征實現網絡病毒的判斷。

3.1.2智能響應功能

人工智能在網絡安全系統中可以實現智能響應,如果一旦發現某一個病毒或木馬侵入網絡,此時就需要按照實際影響范圍進行智能度量,影響范圍大、造成的損失較多就可以啟用全面殺毒;影響范圍小、造成的損失較少就可以啟動局部殺毒,這樣既可以清除網絡中的病毒或木馬,還可以降低網絡的負載,實現按需殺毒服務。

3.2人工智能應用設計

人工智能在網絡安全防御中的應用流程如下所述:目前互聯網接入的設備非常多,來源于網絡的數據攻擊也非常多,比如DDOS攻擊、網站篡改、設備漏洞等,因此可以利用人工智能技術,從根本上發現、分析、挖掘異常流量中的問題,基于人工智能的網絡安全系統具有一個顯著的特征,這個特征就是利用先進的機器學習技術構建一個主動化防御模型,這個模型可以清楚網絡中的木馬或病毒,能夠有效的避免互聯網受到攻擊,也可以將這些病毒或木馬牽引到一些備用服務器,在備用服務器上進行識別、追蹤,判斷網絡病毒的來源,從而可以徹底根除后患。人工智能在網絡安全防御中引入很多先進的殺毒技術,比如自我保護技術、實時監控技術,基于卷積神經網絡、機器學習、自動審計等,可以自動化快速識別網絡中的病毒及其變異模式,將其從互聯網中清除,同時還可以自我升級服務。

4結束語

目前,互聯網承載的應用軟件非常多,運行積累了海量的數據資源,因此安全防御系統可以引入數據挖掘構建智能分析系統,可以利用人工智能等方法分析網絡中是否存在一些病毒特征,即使這些病毒特征發生了變異,人工智能處理方法也可以利用先進的機器學習技術發現這些病毒的蹤跡,從而可以更加準確的判斷病毒或木馬,及時的啟動智能響應模塊,將這些病毒或木馬清除。人工智能在查殺的時候還可以按需提供服務,不需要時刻占據所有的負載,提高了網絡利用率。

參考文獻

[1]于成麗,安青邦,周麗麗.人工智能在網絡安全領域的應用和發展新趨勢[J].保密科學技術,2017(11):10-14.

[2]王海濤.基于大數據和人工智能技術的信息安全態勢感知系統研究[J].網絡安全技術與應用,2018(03):114-115.

神經網絡卷積層的作用范文6

【關鍵詞】電力行業;熱工自動化;發展前景

1. 當前電力行業熱工自動化技術的發展

隨著世界高科技的飛速發展和我國機組容量的快速提高,電廠熱工自動化技術不斷地從相關學科中吸取最新成果而迅速發展和完善,近幾年更是日新月異,一方面作為機組主要控制系統的DCS,已在控制結構和控制范圍上發生了巨大的變化;另一方面隨著廠級監控和管理信息系統(SIS)、現場總線技術和基于現代控制理論的控制技術的應用,給熱工自動化系統注入了新的活力。

1.1DCS的應用與發展。

火電廠熱工自動化系統的發展變化,在二十世紀給人耳目一新的是DCS的應用,而當今則是DCS的應用范圍和功能的迅速擴展。

1.1.1DCS應用范圍的迅速擴展。

20世紀末,DCS在國內燃煤機組上應用時,其監控功能覆蓋范圍還僅限DAS、MCS、FSSS和SCS四項。即使在2004年的Q/DG1-K401-2004《火力發電廠分散控制系統(DCS)技術規范書》中,DCS應用的主要功能子系統仍然還是以上四項,但實際上近幾年DCS的應用范圍迅速擴展,除了一大批高參數、大容量、不同控制結構的燃煤火電機組的各個控制子系統全面應用外,脫硫系統、脫硝系統、空冷系統、大型循環流化床(CFB)鍋爐等新工藝上都成功應用。可以說只要工藝上能夠實現的系統,DCS都能實現對其進行可靠控制。

1.1.2單元機組控制系統一體化的崛起。

(1)隨著一些電廠將電氣發變組和廠用電系統的控制(ECS)功能納入DCS的SCS控制功能范圍,ETS控制功能改由DCS模件構成,DEH與DCS的軟硬件合二為一,以及一些機組的煙氣濕法脫硫控制直接進入單元機組DCS控制的成功運行,標志著控制系統一體化,在DCS技術的發展推動下而走向成熟。

(2)由于一體化減少了信號間的連接接口以及因接口及線路異常帶來的傳遞過程故障,減少了備品備件的品種和數量,降低了維護的工作量及費用,所以近幾年一體化控制系統在不同容量的新建機組中逐漸得到應用。

(3)控制系統一體化的實現,是電力行業DCS應用功能快速發展的體現。排除人為因素外,控制系統一體化將為越來越多的電廠所采用。

1.1.3DCS結構變化,應用技術得到快速發展。

(1)隨著電子技術的發展,近年來DCS系統在結構上發生變化。過去強調的是控制功能盡可能分散,由此帶來的是使用過多的控制器和接口間連接。但過多的控制器和接口間連接,不一定能提高系統運行可靠性,相反到有可能導致故障停機的概率增加。何況單元機組各個控制系統間的信號聯系千絲萬縷,互相牽連,一對控制器故障就可能導致機組停機,即使沒有直接導致停機,也會影響其它控制器因失去正確的信號而不能正常工作。因此隨著控制器功能與容量的成倍增加、更多安全措施(包括采用安全性控制器)、冗余技術的采用(有的DCS的核心部件CPU,采用2×2冗余方式)以及速度與可靠性的提高,目前DCS正在轉向適度集中,將相互聯系密切的多個控制系統和非常復雜的控制功能集中在一對控制器中,以及上述所說的單元機組采用一體化控制系統,正成為DCS應用技術發展的新方向,這不但減少了故障環節,還因內部信息交換方便和信息傳遞途徑的減少而提高了可靠性。

(2)此外,隨著近幾年DCS應用技術的發展,如采用通用化的硬件平臺,獨立的應用軟件體系,標準化的通訊協議,PLC控制器的融入,FCS功能的實現,一鍵啟動技術的成功應用等,都為DCS增添了新的活力,功能進一步提高,應用范圍更加寬廣。

1.2全廠輔控系統走向集中監控。

(1)一個火電廠有10多個輔助車間,國內過去通常都是由PLC和上位機構成各自的網絡,在各車間控制室內單獨控制,因此得配備大量的運行人員。為了提高設備控制水平和勞動生產率,達到減員增效的目的,隨著DCS技術和網絡通訊功能的提高,目前各個輔助車間的控制已趨向適度集中,整合成一個輔控網(簡稱BOP 即Balance Of Plant的縮寫)方向發展,即將相互獨立的各個輔助系統,利用計算機及網絡技術進行集成,在全廠IT系統上進行運行狀況監控,實現控制少人值班或無人值班。

(2)近幾年新建工程迅速向這個方向發展。如國華浙能寧海電廠一期工程(4×600MW)燃煤機組BOP覆蓋了水、煤、灰等共13個輔助車間子系統的監控,下設水、煤、灰三個監控點,集中監控點設在四機一控室里,打破了傳統的全廠輔助車間運行管理模式,不但比常規減員30%,還提升了全廠運行管理水平。整個輔控網的硬件和軟件的統一,減少了庫存備品備件及日常管理維護費用[1]。由于取消了多個就地控制室,使得基建費用和今后的維護費用都減少。一些老廠的輔助車間也在進行BOP改造。

1.3變頻技術的普及應用與發展。

(1)變頻器作為控制系統的一個重要功率變換部件,以提供高性能變壓變頻可控的交流電源的特點,前些年在火電廠小型電機(如給粉機、凝泵)等控制上的應用,得到了迅猛的發展。由于變頻調速不但在調速范圍和精度,動態響應速度,低速轉動力矩,工作效率,方便使用方面表現出優越性,更重要的是節能效果在經濟及社會效益上產生的顯著效應,因此繼一些中小型電機上普遍應用后,近年來交流變頻調速技術,擴展到一些高壓電機的控制上試用,如送、引風機和給水泵電機轉速的控制等。

(2)因為蘊藏著巨大的節能潛力,可以預見隨著高壓變頻器可靠性的提高、一次性投資降低和對電網的諧波干擾減少,更多機組的風機、水泵上的大電機會走向變頻調速控制,在一段時間內,變頻技術將繼續在火電廠節能工作中,扮演重要角色。

1.4局部系統應用現場總線。

(1)自動化技術的發展,帶來新型自動化儀表的涌現,現場總線系統(FCS)是其中一種,它和DCS緊密結合,是提高控制信號傳輸的準確性、實時性、快速性和機組運行的安全可靠性,解決現場設備的現代化管理,以及降低工程投資等的一項先進的和有效的組合。目前在西方發達國家,現場總線已應用到各個行業,其中電力行業最典型的是德國尼德豪森電廠2×950MW機組的控制系統,采用的就是PROFIBUS現場總線。

(2)我國政府從“九五”起,開始投資支持現場總線的開發,取得階段性成果,HART儀表、FF儀表開始生產。但電廠控制由于其高可靠性的要求,目前缺乏大型示范工程,缺乏現場總線對電廠的設計、安裝、調試、生產和管理等方面影響的研究,因此現場總線在電廠的應用仍處于探討摸索階段,近二年我國有十多個工程應用了現場總線,但都是在局部系統上,其中: 某電廠,在單元機組的開、閉式水系統中的電動門控制采用Profibus DP總線技術,電動執行機構采用原裝進口德國歐瑪公司的一體化智能型產品Puma Matic,帶有雙通道Profibus-DP冗余總線接口作為DP從站掛在總線上。為了提高安全性可靠性,總線光纖、作為總線上的第一類DP主站的AP和相應的光電轉換裝置都采用了冗余結構,這是國內首家在過程控制中采用現場總線技術的火力發電廠。

(3)某電廠的補給水處理系統和廢水系統[2],采用了二層通訊網絡結構的現場總線控制系統,其鏈路設備和主站級網絡采用冗余配置??刂葡到y人機終端與主控制器之間采用工業以太網通訊,以太網交換機采用ITP形式接口,四臺交換機構成光纖高速路網?,F場設備層之間采用Profibus-DP現場總線通訊。主環網采用光纜,分支現場總線通訊選用總線電纜。配置二套冗余的主控制器,分別用于鍋爐補給水系統和廢水系統,且各自有兩條由光電耦合器組成的現場總線環形光纜網構成冗余配置,所有現場儀表和氣動閥門定位器(均采用帶PA總線接口),通過DP/PA耦合器連接到現場總線上。中低壓電器設備(MCC)采用具有現場總線通信接口功能的智能電機控制器。加藥泵的電動機采用帶總線的變頻器。鍋爐補給水的陰陽離子床氣動隔膜閥的電磁控制閥,采用具有總線接口的閥島來控制,閥島與現場總線連接。這是國內在局部過程控制中全面采用現場總線技術的首個火電廠,其應用實踐表明,輔控網全面采用現場總線技術已成熟。

1.5熱工控制優化技術的應用發展。

(1)隨著過程生產領域對控制系統要求的不斷提高,傳統控制方法越來越難以滿足火電廠熱力流程對系統穩定性和性能最優化方面的要求,汽溫超標已經成為制約機組負荷變化響應能力和安全穩定運行的主要障礙之一(燃燒優化主要是鍋爐專業在進行,本文不作討論)。由此基于現代控制理論的一些現代控制系統逐步在火電廠過程控制領域中得到應用。如基于過程模型并在線動態求解優化問題的模型預測控制(簡稱MPC)法、讓自動裝置模擬人工操作的經驗和規律來實現復雜被控對象自動控制的模糊控制法、利用熟練操作員手動成功操作的經驗數據,在常規的串級PID調節系統的基礎上建立基于神經網絡技術的前饋控制作用等,在提高熱工控制系統(尤其是汽溫控制系統)品質過程中取得較好效果。

(2)如某電廠使用的西門子公司PROFI系統,充分使用了基于模型的現代控制理論,其中汽溫控制原理示意圖如圖1所示。

(3) 圖1中,用基于狀態空間算法的狀態觀測器解決汽溫這種大滯后對象的延遲造成的控制滯后,焓值變增益控制器解決蒸汽壓力的變化對溫度控制的影響,基于模型的Smith預估器對導前溫度的變化進行提前控制;通過自學習功能塊實時補償減溫水閥門特性的變化;而對再熱汽溫控制,盡量以煙道擋板作為調節手段,不采用或少采用減溫水作為控制手段,以提高機組效率;在機組協調控制模塊中,采用非最小化形式描述的離散卷積和模型,提高系統的魯棒性;根據控制品質的二次型性能指標連續對預測輸出進行優化計算,實時對模型失配、時變和干擾等引起的不確定性因素進行補償,提高系統的控制效果;PROFI投入后,AGC狀態下以2% Pe /min負荷率變化時的響應時間為57秒,壓力最大偏差0.208MPa,汽包水位變化最高和最低之差為-38.86mm,爐膛負壓變化曲線最高值和最低值差-145Pa,主蒸汽溫度偏差穩態基本控制在2℃以內,動態基本控制在5℃以內。

1.6SIS系統的應用發展。

(1)SIS系統是實現電廠管理信息系統與各種分散控制系統之間數據交換、實時信息共享的橋梁,其功能包括廠級實時數據采集與監視,廠級性能計算與分析。在電網明確調度方式有非直調方式且應用軟件成熟的前提下,可以設置負荷調度分配功能。設備故障診斷功能、壽命管理功能、系統優化功能以及其它功能(根據電廠實際情況確定是否設置)[3]。自從國家電力公司電力規劃總院在2000年提出這一概念和規劃后,至今估計有200家多電廠建立了SIS系統,可謂發展相當迅速。

(2)但是自從SIS系統投運以來,其所起的作用只是數據的采集、存儲、顯示和可打印各類生產報表,能夠真正把SIS的應用功能盡情發揮出來的很少,其面向統計/生產管理的數據分析工具,基于熱經濟性分析的運行優化,以品質經濟性為目標的控制優化,以提高可靠性為目的的設備故障診斷等功能基本多數都未能付緒實施。其原因主要有設計不夠完善,多數SIS廠家并沒有完全吃透專業性極強的后臺程序及算法,使其在生產實際中未能發揮作用,加上與現場生產脫節,因此SIS商所能做的只是利用網絡技術,邊搭建一個基本的SIS 架構邊進行摸索。此外SIS應涵蓋哪些內容沒有統一的標準也緩慢了其功能的應用。

(3)但從大的方向上看,SIS系統的建設符合技術發展的需要和中國電力市場發展的趨勢,將給發電廠特別是大型的現代化發電廠帶來良好的經濟效益。

2. 電力行業熱工自動化系統的未來發展動向及前景

隨著國家法律對環保日益嚴格的要求和計算機網絡技術的進步,未來熱工系統將圍繞 “節能增效,可持續發展”的主題,向智能化、網絡化、透明化,保護、控制、測量和數據通信一體化發展,新的測量控制原理和方法不斷得以應用,將使機組的運行操作和故障處理,象操作普通計算機一樣方便。

2.1單元機組監控智能化是熱工自動化系統發展方向。

(1)單元機組DCS的普及應用,使得機組的監控面貌煥然一新,但是它的監控智能化程度在電力行業卻沒有多大提高。雖然許多智能化的監視、控制軟件在國內化工、冶金行業中都有較好的應用并取得效益,可在我國電力行業直到近幾年才開始有所起步。隨著技術的進步,火電廠單元機組自動化系統的智能化將是一種趨勢,因此未來數年里,實現信息智能化的儀表與軟件將會在火電廠得到發展與應用。

(2)如:儀表智能管理軟件,將對現場智能傳感器進行在線遠程組態和參數設置、對因安裝位置和高靜壓造成的零位飄移進行遠程修正,精度自動進行標定,計算各類誤差, 并生成標定曲線和報告;自動跟蹤并記錄儀表運行過程中綜合的狀態變化,如掉電、高低限報警、取壓管路是否有堵或零位是否有飄移等。

(3)閥門智能管理軟件將對智能化閥門進行在線組態、調試、自動標定和開度階躍測試,判斷閥門閥桿是否卡澀, 閥芯是否有磨損等,通過閥門性能狀況的全面評估,為實現預測性維護提供決策。

(4)重要轉動設備的狀態智能管理軟件將對重要轉動設備的狀態如送風機,引風機,給水泵等,綜合采用基于可靠性的狀態監測多種技術,通過振動、油的分析以及電機診斷,快速分析(是否存在平衡不好,基礎松動, 沖擊負荷,軸承磨損)等現象和識別故障隱患, 在隱患尚未擴展之前發出報警,為停機檢修提供指導和幫助。

(5)智能化報警軟件將對報警信號進行匯類統計、分析和預測,對機組運行趨勢和狀態作出分析、判斷,用以指導運行人員的操作;故障預測、故障診斷以及狀態維修等專用軟件,將在提高機組運行的安全性,最大限度地挖掘機組潛力中發揮作用。單元機組監控智能化將帶來機組檢修方式的轉變,以往定期的、被動式維護將向預測性、主動式為主的維護方式過渡,檢修計劃將根據機組實際狀況安排。

2.2過程控制優化軟件將得到進一步應用。

(1)進一步提高模擬量控制系統的調節范圍和品質指標,是火電廠熱工自動化控制技術研究的一個方向。雖然目前有關自適應、狀態預測、模糊控制及人工神經網絡等技術,在電廠控制系統優化應用的報道有不少,但據筆者了解真正運行效果好的不多。隨著電力行業競爭的加劇,安全、經濟效益方面取得明顯效果、通用性強、安裝調試方便的優化控制專用軟件(尤其是燃燒和蒸汽溫度優化、性能分析軟件、)將會在電廠得到親睞、進一步發展與應用。

(2)目前機組的AGC均為單機方式(由調度直接把負荷指令發給投入AGC的機組)。由于電網負荷變化頻繁,使投入AGC的機組始終處于相應的變負荷狀態,鍋爐的蒸汽壓力和溫度波動幅度大,輔機、閥門、擋板等設備動作頻繁,這種方式對機組和設備的壽命都會產生一定的負面影響。隨著發電成本的提高,發電企業需從各個角度考慮如何切實降低電廠運行成本,延長機組的使用壽命。因此配置全廠負荷分配系統(即電網調度向電廠發一個全廠負荷指令,由電廠的全廠負荷分配系統,以機組的煤耗成本特性為基礎,在機組允許的變化范圍內,經濟合理地選擇安排機組的負荷或變負荷任務,使全廠發電的煤耗成本最低,降低電廠的發電成本)將是發電企業必然的要求,相信不久的將來,單機AGC方式將會向全廠負荷分配方式轉變。

(3)SIS系統將結合生產實際進行二次開發,促進自身應用技術走向成熟,在確?;痣姀S安全、環保、高效益及深化信息化技術應用中發揮作用。

2.3現場總線與DCS相互依存發展。

未來一段時間里,現場總線將與DCS、PLC相互依存發展,現場總線借助于DCS和PLC平臺發展自身的應用空間,DCS和PLC則借助于現場總線完善自身的功能。

2.3.1現場總線與DCS的關系。

現場總線作為一個完整的現場總線控制系統,目前還難以迅速應用到整個電廠中,而DCS雖然是電廠目前在線運行機組的主流控制系統,但由于其檢測和執行等現場儀表信號仍采用模擬量信號,無法滿足工程師站上對現場儀表進行診斷、維護和管理的要求,限制了控制過程視野,因此DCS通過容入通信協議國際標準化的現場總線和適合現場總線連接的智能化儀表、閥門,并將自身的輸出驅動功能分離移到現場或由現場智能驅動器代替,功能簡單且相對集中的控制系統下放到采用FCS控制和處理功能的現場智能儀表中,然后由少量的幾根同軸電纜(或光纜)和緊急停爐停機控制用電纜,通過全數字化通信與控制室連接。將有助于降低電廠造價,提高自身的可靠性,拓寬各自的功能,推動各自的發展。除新建電廠將會更多的采用現場總線的智能設備外,也會成為運行多年的機組下一步的改造計劃。

2.3.2現場總線與PLC的關系。

(1)現場總線在電廠的應用將借助于PLC,這不但因為PLC已廣泛應用于電廠輔助設備的控制,將現場總線技術和產品溶合到PLC系統中,成為PLC系統中的一部分或者成為PLC系統的延伸部分,在輔助設備的控制中將直接明顯地體現其經濟效益。還因為現場總線和PLC的制造商間關系密切,如、ProfiBus等本身就是由PLC的主要生產供貨商支持開發。

(2)由于電廠現場的環境惡劣,溫度高、灰塵多、濕度變化大,因此現場總線在電廠應用,首先要解決的是自身質量。

2.4輔助車間(系統)集控將得到全面推廣。

隨著發電廠對減員增效的要求和運行人員整體素質的提高,輔助車間(系統)通過輔控網集控將會得到進一步全面推廣。但在實施過程中,目前要解決好以下問題:

(1)輔控系統I/O點數量大,各輔助車間物理位置分散,存在遠距離通信、信號衰減和網絡干擾問題,因此監控系統主干通信網宜采用多模光纜以確保通信信號的可靠性。

(2)各輔助控制系統采用不同的控制設備,控制系統的通信接口協議不同,甚至不同的物理接口,因此須解決網絡通信協議的轉換問題,選型時應事先規定好各系統間的接口連接協議。

(3)各個輔助車間的控制系統為不同的廠商供貨,由于使用的軟件不同,其操作員站的人機界面很有可能不一致。因此選型時應注意上位機軟件,設計統一的人機界面,采用統一的風格及操作方式,以便方便各系統畫面接入BOP網絡。

輔助車間集控系統能否實現設計目標,除了自身的技術以外,很大程度上取決于輔助系統本身的自動投入情況。因此高可靠性的執行機構、動作靈活可靠的限位開關、智能化的變送器將會得到應用。

2.5單元機組監控系統的物理配置趨向集中布置。

過去一個集控室的概念,通常為一臺單元機組獨用或為二臺機組合用,電子室分成若干個小型的電子設備間,分別布置在鍋爐、汽輪機房或其它主設備附近。其優點是節省了電纜。但隨著機組容量的提高、計算機技術的發展和管理水平的深化,近幾年集控室的概念擴大,出現了全廠單元機組集中于一個控制室,單元機組的電子設備間集中,現場一般的監視信號大量采用遠程I/O柜的配置方式趨勢。

2.6APS技術應用。

(1)APS是機組級順序控制系統的代名詞。在機組啟動中,僅需按下一個啟動控制鍵,整個機組就將按照設計的先后順序、規定的時間和各控制子系統的工作情況,自動啟停過程中的相關設備,協調機爐電各系統的控制,在少量人工干預甚至完全不用人工干預的情況下,自動地完成整臺機組的啟停。但由于設備自身的可控性和可用率不滿足自動化要求,加上一些工藝和技術上還存在問題,需要深入地分析研究和改進,所以目前燃煤機組實施APS系統的還不多見。

(2)由于APS系統的實質是電廠運行規程的程序化,其優勢在于可以大大減輕運行人員的工作強度,避免人為操作中的各種不穩定因素,縮短機組啟停時間。作為提高生產效率和機組整體自動化水平,增強在電力企業的市場競爭能力行之有效的方法,將會成為未來機組控制發展的方向之一,引導設計、控制系統廠商和電廠人員更多地去深入研究,設計和完善功能,并付緒實施。

2.7無線測量技術應用。

無線測量技術能監視和控制運行過程中發生的更多情況,獲得關鍵的工藝信息,整合進入DCS。除節省大量安裝成本以外,還將推動基本過程和自動化技術的改善。如供熱、供油和煤計量,酸堿、污水區域測量等,都可能通過無線測量技術實現遠程監控。

2.8提高熱工自動化系統可靠性研究將深入。

由于熱控系統硬軟件的性能與質量、控制邏輯的完善性和合理性、保護信號的取信方式和配置、保護連鎖信號的定值和延遲時間設置,以及熱控人員的檢修和維護水平方面,都還存在一些不足之處,由此使得熱控保護系統誤動作引起機組跳閘事件還時有發生。在電力生產企業面臨安全考核風險增加和市場競爭加劇的環境下,本著電力生產“安全第一,預防為主”的方針,以及效益優先原則,從提高熱工自動化系統的可靠性著手,深入開展技術研究,是熱工自動化系統近期的一項急需進行的工作。提高熱工自動化系統的可靠性技術研究工作,包括控制軟硬件的合理配置,采集信號的可靠性、干擾信號的抑制,控制邏輯的優化、控制系統故障應急預案的完善等。隨著機組控制可靠性要求的提高,重要控制子系統的硬件配置中,將會采用安全型控制器、安全型PLC系統或者它們的整合,保護采集信號將會更多的采用三選二判斷邏輯。獨立的測量裝置需要設計干擾信號抑制功能。此外基建機組一味以最低價中標的招標模式也應得到扭轉(最低價中標,迫使廠商通過減少配置來降低投標價,導致控制系統可靠性下降)。

2.9火電廠機組檢修運行維護方式將改變。

(1)隨著電力市場的競爭,發電企業將趨向集約化經營和管理結構扁平化,為提高經濟效益,發電企業在多發電,以提高機組利用小時的同時,將會通過減少生產人員的配備,密切與外包檢修企業之間的聯系,讓專業檢修隊伍取替本廠檢修隊伍的方式來提高勞動生產率。因此檢修維修工作社會化將是一種趨勢。此外DCS的一體化及其向各功能領域滲透,提高電廠整體協調和信息化、自動化水平的同時,也將會使電廠原專業間及專業內的分工重新調整,比如熱工與電氣二次回路的專業劃分打通。為了降低成本,電廠不再保持大批的檢修維修人員,因此檢修維護方式也將因此而改變,比如讓生產廠家和公司承擔DCS和相關設備的檢修工作。

亚洲精品一二三区-久久