前言:中文期刊網精心挑選了人工神經網絡范文供你參考和學習,希望我們的參考范文能激發你的文章創作靈感,歡迎閱讀。
人工神經網絡范文1
在上世紀九十年代初期,利用數學知識將感知器模型的弊病全面提出,致使社會各界對于人工神經網絡的探究非常少。另一方面,針對邏輯運算的人工神經網絡研究存在一定的弊端,一直沒有被大家發現,因此,致使人工神經網絡探究工程進入嚴重的低谷期。
關于人工神經網絡技術飛速發展時期,九十年代初期,對于人工神經網絡技術的弊端予以充分解決,尤其是Hopefield的人工神經網絡技術模型的提出,致使對于互聯網的穩定性以及收斂性的探究有了充分的理論依據。而且將人工神經網絡模型全面應用到具體的實踐中,并且得到全面推廣,同時,將科學技術和人工神經網絡進行有機結合,使人工神經網絡技術更加具有可研究性。
2關于人工神經技術的構造以及典型模型
互聯網人工神經技術的構造的組成包括以神經元件為主,同時,這項包含多種神經元結構的互聯網信息處理技術是可以并行存在的。每一個具體的人工神經元件可以單一輸出,還可以和其他的神經元件相結合,并且具有非常多的連接輸出方法,每一種連接措施都會有相應的權系數。具體的人工神經網絡技術的特點有:(1)針對每一個節點i,都會有相應的狀態變量Xi存在;(2)節點j到節點i之間,是相應的權系數Wij存在;(3)在每一個節點i的后面,具體存在相應的閾值θi;(4)在每一個節點i的后面,存在變換函數fi(Xi,Wijθi),但是,通常情況來說,這個函數取fi(∑,WijXi-θi)的情況。
3將人工神經網絡技術進行全面使用
互聯網的人工神經網絡技術具有獨特的結構和處理措施,具體包括在:自動控制處理和網絡技術模式識別、模型圖像處理和相應的傳感器信號處理技術。信號處理技術和機器人控制處理技術、地理領域和焊接、在電力系統應用和相關數據挖掘、軍事和交通行業、農業和氣象行業等多個領域紛紛體現出其卓越的貢獻。
ART人工神經網絡技術的運用。人工神經網絡技術ART在網絡語音和網絡圖像、文字處理和具體識別等方面,得到廣泛的應用;同時,在工業處理系統中也有相應的應用,例如,在工業系統中的故障診斷和故障檢測以及事故警報等情況的控制;人工神經網絡ART技術還應用在數據挖掘方面,在相關數據中挖掘最穩定和最有意義的模式。具體的神經網絡技術ART的優勢為:網絡技術處理能力高、穩定性強以及聚類效果非常好。
4結束語
人工神經網絡范文2
關鍵詞:人工神經網絡;信息處理;風險評估
中圖分類號:TP18 文獻標識碼:A 文章編號:1009-3044(2014)06-1285-02
Research on the Application of Artificial Neural Network
LI Hong-chao
(China University of Petroleum (East China), Qingdao 266580,China)
Abstract: Artificial neural networks are part of an integrated artificial intelligence, it is proposed is based on research of modern neuroscience. With the continuous development of artificial neural networks, and their use more widely. This article first analyzes the basic concepts and features of artificial neural networks, from six aspects of information, medicine, psychology and other details of the application of artificial neural networks.
Key words: artificial neural network; information processing; risk assessment
1 人工神經網絡
人工神經網絡,英文名為“Artificial Neural Network”,簡稱ANN,它充分分析大腦神經突觸聯接的結構特點,對其進行模擬,然后進行信息處理。簡單來說,人工神經網絡就是對人腦結構、人腦功能的模仿。它的特點有很多,比如非線性、非局限性、非常定性、非凸性等。這些特點鑄就了人工神經網絡的各種功能,促進了它的應用。
2 人工神經網絡的應用
隨著人們對人工神經網絡的不斷研究,人工神經網絡的作用越來越大,給人們提供了更好的服務,下面就以人工神經網絡在信息領域、醫學、經濟領域、控制領域、交通運輸、心理學六個方面分別介紹其應用。
2.1 信息領域
人工神經網絡在信息領域的應用分為兩個方面,一個是信息處理,一個是信息識別。
1)信息處理
由于現代信息的多樣化和多變性的特點,信息處理就變得復雜起來,人工神經網絡可以對人的一部分思維能力進行模仿甚至代替,解決傳統信息處理的困難。在通常情況下,人工神經網絡可以自動診斷問題,開啟問題求解模式。另外,人工神經網絡系統的容錯性能高,當其連接線遭到破壞,自身的組織功能還是可以保持它的優化工作狀態。因此,軍事系統充分利用這一優勢,在其電子設備廣泛應用人工網絡信息系統。
2)模式識別
這項功能的理論基礎有兩個,一個是貝葉斯的概率論,另一個是申農提出的信息論。模式識別主要是分析和處理存在于目標體上的各種形式的信息,然后在處理和分析的基礎上對目標體進行描述、辨認等過程。隨著人工神經網絡在模式識別中的應用,傳統的模式識別逐漸被取代。隨著模式識別的發展,已經逐漸應用到語音識別、人臉識別、文字識別等各個方面。
2.2 醫學領域
人體是非常復雜的,在醫學中,想要弄清楚疾病的類型、疾病的嚴重情況等,僅僅依靠傳統的望聞問切診斷方法是遠遠不夠的,醫學的發展需要運用新技術。人工神經網絡應用于醫學中,可以分析生物信號,觀察信息的表現形式以及研究信息的變化規律,將這三者的結果進行分析和比較,從而掌握病人的病情。
1)生物信號的檢測與分析
在醫學診斷中,醫生基本上都是通過對醫學設備中呈現出來的連續波形進行分析。人工神經網絡中有一套自適應的動力學系統,該系統由一些數量龐大的簡單處理單元互相連接。因此,它具有多種功能,比如Massively Parallelism,即所謂的巨量并行,分布式存貯功能以及強大的自組織自學習功能等。用常規處理法處理生物醫學信號分析非常困難,而人工神經網絡的功能可以有效解決難題,其在生物醫學人腦檢測與處理中的應用非常廣泛,比如分析電腦信號,對心電信號進行壓縮處理,醫學圖像的識別等,在很大程度上促進了醫學的發展。
2)醫學專家系統
對于傳統的專家系統而言,其工作原理基本上就是先由專家根據自己多年的醫學經歷,總結自己的經驗和所掌握的知識,以某種規則的形式將這些經驗和知識存儲在電腦中,建立一個專家的知識庫,然后借助邏輯推理等方式開展醫療診斷工作。但是,隨著專家知識的不斷增長和經驗的日益豐富化,數據庫的規模會越來越大,極有可能產生知識“爆炸”的現象。同時,專家在獲取知識的過程中也會遇到困難,導致工作效率低下。人工神經網絡中的非線性并行處理方式解決了傳統專家系統中的困難,在知識推理、自組織等方面都有了很大的提高,醫學專家系統也開始逐漸采用人工神經網絡系統。
在醫學領域中,麻醉和危重醫學的研究過程中,存在很多的生理方面的分析與檢測工作,人工神經網絡系統有良好的信號處理能力,排除干擾信號,準確檢測臨床狀況的相關情況,有力促進了醫學的發展。
2.3 經濟領域
經濟的快速有效增長是基于人們對市場規律良好的掌握和運用以及對經濟活動中的風險評估,及時應對和解決,這樣才能保障經濟活動的快速發展。人工神經網絡應用于經濟領域,主要有預測市場價格和評估經濟風險兩個方面。
1)預測市場價格的波動情況
商品的價格主要是由市場的供求關系和國家宏觀調控來變化的。國家的宏觀調控是客觀存在的,我們可以在遵循國家宏觀調控的前提之下分析市場的供求關系,從而預測商品的市場價格。在傳統的統計學方法中,在預測價格波動時因其自身的局限性,難以做出科學的判斷。人工神經網絡可以有效處理不完整數據和規律性不強的數據,它是傳統統計方法所不能達到的。人工神經網絡系統基于市場價格的確定機制,綜合分析影響商品價格的因素,比如城市化水平、人均工資水平、貸款情況等,將這些復雜的因素綜合起來,建立一個模型,通過模型中的數據顯示,科學預測商品的市場價格波動情況,有效利用商品的價格優勢。
2)評估經濟風險
經濟風險,即Economic Exposure,它指的是由于經濟前景的一些不確定因素,導致經濟實體出現重大的經濟損失。在處理經濟風險的時候,做好的措施就是防患于未然,做好評估和預測,將經濟風險扼殺在萌芽時期。人為的主觀判斷經濟風險具有一定的可靠性,但是也存在很多的不足。將人工神經網絡系統應用于評估經濟風險,可以有效彌補人為判斷風險的不足。人工神經網絡先提取具體風險來源,然后在此基礎上構建出一個模型,這個模型一般要符合實際情況,通過對模型的研究,得出風險評價系數,最終確定有效的解決方案。
2.4 控制領域
隨著人工神經網絡的不斷發展,人們開始研究其在控制領域的應用。比如現在的機器人的攝像機控制、飛機控制等。它主要是通過控制圖像傳感器,再結合圖像表面的非線性關系,進行計算和分析,另外,它還可以將圖像傳感器瞄準到處于運動狀態中的目標物上。
2.5 交通運輸
交通問題具有高度的非線性特點,它的數據處理是非常龐大和復雜的,這與人工神經網絡有很大的吻合性。就目前來講,人工神經網絡應用到交通領域有模擬駕駛員的行為、分析交通的模式等等。
2.6 心理學
人工神經網絡是對人腦神經元的信息處理能力的模擬,本身就帶有一定的抽象性,它可以訓練很多的認知過程,比如感覺、記憶、情緒等。人們通過對人工神經系統的不斷研究,多個角度分析了其認知功能。就目前來看,人工神經網絡可以分析人的認知,同時對認知方面有缺陷的病人進行模擬,取得了很大的進步。當然,人工神經網絡應用于心理學領域也存在很多的問題,比如結果精確度不高、模擬算法的速度不夠等,這些都需要人們持之以恒的研究。突破這些難題,促使人工神經網絡有效應用于心理學領域。
3 結束語
綜上所述,隨著人工神經網絡的不斷發展,它特有的非線性適應能力和自身的模擬結構都有效推動了其應用范圍。我們應該不斷運用新技術,不斷完善人工神經網絡的功能,拓寬其應用范圍,促進其智能化、功能化方向發展。
參考文獻:
[1] 毛健,趙紅東,姚婧婧.人工神經網絡的發展及應用[J].電子設計工程,2011(12).
[2] 林和平,張秉正,喬幸娟.回歸分析人工神經網絡[J].吉林大學學報:信息科學版,2010(3).
[3] 李雷雷.人工神經網絡在建筑工程估算中的應用研究[D].華北電力大學,2012.
人工神經網絡范文3
關鍵詞 人工神經網絡模型,人工語法學習,自動聯系者,序列學習,簡單循環網絡。
分類號 B842
1 引言
人工神經網絡模型(Artificial Neural Network Model,簡稱ANN),顧名思義,就是用人造的程序、機械或設備來模擬人腦神經網絡的模型。人工神經網絡模型的用途有二:(1)發明基于神經網絡的人工智能系統,來模擬人的學習、記憶、推理等智能活動,以服務于人類的現實生活;(2)構建各種心理活動和心理過程的模型,以為各種心理學理論提供支持。前者是自動化、通信、制造、經濟領域關注的,我們平時所見的語音識別、經濟領域使用的股票走勢預測等智能系統大多是基于人工神經網絡模型研制出來的。而后者則是心理學家所關注的領域。至今,人工神經網絡模型已被用來模擬諸如知覺、記憶、學習、判斷等各種心理活動,以解釋矛盾的實驗數據,為有關的心理學理論提供豐富的證據。
和其他領域的研究者們一樣,內隱學習領域的研究者們也注意到了這一行之有效的工具。Cleeremans(1993)指出根據已有的內隱學習理論構造人工神經網絡模型,將模型的輸出數據與人類被試的實驗數據進行比較,能為原有的理論觀點提供證據[1]。Dienes和Perner(1996)也有類似的看法[2]。然而,在發揮人工神經網絡模型在內隱學習研究上的功效之前,必須解決如下問題:人工神經網絡模型是否正如Cleeremans等所言適用于內隱學習研究?如果是,用哪類人工神經網絡模型來模擬內隱學習?
2 人工神經網絡模型的工作原理及其研究內隱學習的適用性
人工神經網絡模型之所以適用于內隱學習,是因為它的基本工作原理和內隱學習的兩個本質特征有著驚人的相似。
2.1 人工神經網絡模型的工作原理
早在20世紀40年代,便有研究者對人工神經網絡模型的工作原理做了最初的嘗試。1943年,McCulloch和Pitts用類似“開關”的閾限邏輯單元(Threshold Logic Unit)**來模擬神經元,并將多個這樣的單元以相等的強度(權重)連接起來,形成網絡,這就是著名的MP模型[3]。1949年,Hebb在論述條件反射的形成時,無意間提到了神經元間連接強度更新的重要法則,即兩個彼此相連的神經元同時激活或同時抑制,都能增加神經元間的連接強度,后人稱此為Hebb法則[4]。然而,MP模型和Hebb法則都不能構成真正意義**上的神經網絡模型,雖然,MP模型已經具備將多個神經元連接起來,形成網絡的雛形,但是由于不同單元間的連接強度相等,且恒定不可變化,MP模型不具備人工神經網絡的基本特征――學習性;而Hebb雖然提出了權重變化的一條有效法則,但卻未將其應用到人工神經網絡中來。真正將神經元連接成網絡的思想與借助于權重更新使網絡具有學習性的思想綜合在一起的要屬Rosenblatt。
Rosenblatt(1958)提出了第一個真正意義上的人工神經網絡模型――感知器(Perceptron)[5]。其基本工作原理為:整個感知器由多個不同層次的加工單元組成,每個加工單元的功能類似于單個神經元或一組神經元,它能接收來自前一層的幾個加工單元的激活,并綜合這些激活,對此進行簡單運算(例如:判斷總激活量是否達到某一閾限),然后將運算的結果傳遞給下一層的加工單元。第一層單元的激活模式反映了外部刺激狀態,即模型的輸入,而最后一層單元的激活模式則為模型的輸出反應。某個單元對下一層的另一個單元的影響取決于兩個單元之間連接的強度(權重)。為了在給定輸入的情況下,使模型獲得類似于人類被試的輸出反應,必須不停地調節單元與單元間的連接權重。所以,在構建合適的人工神經網絡模型時,研究者往往會先設置一系列初始權重,然后不斷地給予模型不同的輸入模式,在每個特定輸入后,比較模型輸出與正確輸出間的差異,并據此調整單元間的連接權重,這一過程不斷進行,直到模型輸出和正確輸出間的差異達到最小值,此時,模型便完成了整個學習過程。圖1為一個典型感知器的例子,它旨在判斷呈現于視網膜的光條是垂直的還是水平的。整個感知器由3個加工單元層組成,第一層為網膜層,即將整個視網膜分割為10×10的網格,用每個網膜單元對應于一個網格,共100個單元,當光條落
圖1 感知器例子(資料來源:文獻[3])
在視網膜的某幾個網格上時,這些網格所對應的網膜單元被激活。第二層為聯系層,其中的每個單元總是和某些網膜單元間存在興奮或抑制連接,不論興奮還是抑制連接,強度都是恒定的1或-1,當與聯系單元連接的網膜單元的總激活量達到聯系單元的激活閾限時,聯系單元被激活,例如圖1,Aj的接收到的總激活量為1+1+1-1=2,如果Aj的閾限為2,那么2=2,Aj被激活。第三層為反應層,其中只包括一個反應單元,它與所有的聯系單元連接,連接權重為Wj,其中,j表示第j個聯系單元。反應單元將綜合來自聯系單元的激活信息,即將每個聯系單元的激活量乘以它們之間的連接權重,然后簡單求和,得出總激活量,并判斷激活是否達到閾限,公式表示如下:
aR為反應單元的激活水平,aj為聯系單元的激活水平,θ為閾限值。如果,總激活量達到反應單元的閾限,反應單元被激活(激活量為1),感知器決定光條為垂直,否則,反應單元不被激活(激活量為0),感知器反應光條為水平。當然,感知器必須經過一個漫長的學習階段,才能完成這一簡單的判斷任務。在學習階段,感知器接受各種不同的水平和垂直光條刺激,并一一做出反應,當反應正確時,連接權重不做任何調整,一旦反應錯誤,感知器會自動調整聯系單元與反應單元間的權重,比如:當反應單元的激活量為0時,而實際光條為垂直,說明反應單元所接收到的總激活量小于閾限,此時,則應增大那些被激活的聯系單元與反應單元間的連接權重,以提高總激活量,使其更有可能達到閾限,致使在下次刺激呈現時,感知器更易做出正確反應。當然,Rosenblatt的感知器除了能調整權重外,還會調整反應單元閾限。這種通過逐步調整連接權重和閾限,以減少感知器反應和正確反應間的差距的方法就是著名的感知器收斂法則(perceptron convergence rule)。不過,調整閾限的方法對于擁有多個反應單元的模型來說過于復雜,所以未被以后的人工神經網絡模型采納。
可見,Rosenblatt的貢獻是卓越的,他給出了人工神經網絡的基本工作原理,基于感知器收斂法則發展而來的delta法則與斜率遞減(gradient descent)法已成為如今人工神經網絡最主要的算法,本文第3點中將對此做詳細介紹。然而,值得注意的一點是感知器僅在聯系層和反應層間使用了權重概念,學習過程也僅發生在這兩層之間,所以從本質上講,感知器只屬于包含一個輸入層和一個輸出層的單層網絡(single layer network),這種單層網絡在解決某些實際問題時,遇到了障礙。Minsky等(1969)指出感知器甚至無法模擬諸如XOR(異或)等簡單運算[3]。因此,在接下來的將近20年中,人工神經網絡的發展一度進入低迷期。直到80年代中期,逆向傳導法(back propagation)[6]、自動聯系者(atuoassociator)[7]、循環模型(recurrent model)[8,9]一一提出,多層網絡廣泛應用智能模擬任務中,人工神經網絡才得以迅速發展。然而,這些算法和模型的基本工作原理與最初的感知器卻并無兩樣。
2.2 人工神經網絡模型研究內隱學習的適用性
如上述,人工神經網絡的工作原理為通過調整權重逐步學會正確反應。那么,這些基于調整權重來學習正確反應的人工神經網絡模型是否適于研究內隱學習呢?內隱學習這一概念強調的是兩個特征:第一,它是學習的一種形式;第二,這種學習是內隱的、無需意識努力的。人工神經網絡的工作原理極好地匹配了這兩個特征。首先,要建立針對某一心理活動的合適的網絡模型,必須要經過長期的訓練和學習過程,即向模型呈現許多刺激,要求其做出反應,并將模型反應與要求的正確反應進行比較,據此逐步調整內部結構,使模型在以后的刺激情景中,更易做出正確反應。這種學習過程和人類的學習有著驚人的相似,人類在幼年時,雖然腦神經已發展完全,但是他們仍然不能執行各種認知任務,這時候的人腦就好比初始狀態的神經網絡模型,雖然,已對模型基本結構做了設定(比如,模型由幾個加工單元層組成,每層有幾個單元,哪些單元和哪些單元間存在聯系),但是由于所有的連接權重都是隨機設置的,模型不知道刺激與反應間的聯系,常常會給出錯誤反應,而當經過幾年的學習之后,人類嬰孩不斷地從外界接收刺激,做出反應,并接收來自外界的反饋,將之與自己的反應做比較,逐步通過內部結構的改變,來調整自己的行為,從而能夠知覺事物、理解言語、控制自身的機體運動,這就好比初始狀態的網絡模型,能夠通過調整權重,達到穩定狀態,對刺激模式做出正確反應。可見,人工神經網絡模型很好地匹配了內隱學習地第一個特征――兩者都是學習過程。其次,內隱學習強調學習是內隱地進行的。由于無法直接探索學習過程是否是內隱的,研究者往往通過驗證學習中所獲得的知識是內隱的來間接推斷學習過程是內隱的,當被試在分類或選擇任務中的表現高于隨機,卻不知道自己是依據何種知識做出正確判斷時,習得的知識被認為是內隱的,從而進一步推斷學習過程也是內隱的[10~12]。人工神經網絡模型也一樣,從根據輸出結構來調整權重的過程來看,根本無法判斷學習過程是否是內隱的,而類似的,人工神經網絡的知識表征形式顯示神經網絡模型所獲得的知識很有可能是內隱的。當人工神經網絡能做到正確反應時,指導模型該如何反應的知識似乎是存在于單元的組織結構和他們之間的連接權重上,根本無法直接從這種無序而雜亂的結構和權重上看出什么規則,例如:上述判斷光條垂直和水平的感知器,我們并無法從直觀上判斷哪些單元表征垂直光條,哪些單元表征水平光條,這種知識表征形式很有可能是內隱的。這種知識的表征形式被稱為分布式表征(distributed representation),它和傳統的局部表征(local representation)很不一樣,局部表征中,每個用不同的單元表征不同的事物,例如:單元1表征事物1,單元2表征事物2……,在知識提取時,就好比查字典一樣,根據不同的事物,找到表征的位置,便可以獲悉有關事物的各種知識。而分布表征可以將不同的事物表征在同一組單元中,比如垂直光條和水平光條,在知識提取時,往往只需輸入新刺激的內容,比如光條激活了視網膜的哪些區域,便能根據內容找到合適的反應。
3 廣泛應用于內隱學習領域的兩種人工神經網絡模型
人工神經網絡模型很好地匹配內隱學習的兩大基本特征。因此,許多研究者針對不同的內隱學習任務,選擇不同的人工神經網絡模型來擬合內隱學習過程,以探討內隱學習的本質和機制[13~17]。
縱觀近40年來的內隱學習研究,雖然不同的研究者開發了許多不同的任務形式,獲得了許多可喜的研究成果,但是這些任務都離不開兩種根本的任務形式――人工語法學習和序列學習。相應地,根據兩個任務的不同特點,研究者選擇了兩種不同的模型――自動聯系者和簡單循環網絡(simple recurrent network,簡稱SRN)――分別對之加以模擬。
3.1 人工語法學習與自動聯系者
人工語法學習任務通常是:在學習階段,要求被試在不知道內在規則的情況下記憶一大堆合法字符串,然后,在測試階段,向被試呈現一批新的合法和非法字符串,并告知前面學習的字符串是一類符合語法規則的合法字符串,要求被試根據前面的學習,判斷新的字符串是否合法[10]。從測試階段的要求、學習階段的要求和所學習的知識這三個不同的角度來看,人工語法學習具有三個主要特征:
第一,測試階段要求被試進行的是一項典型的分類任務。相應地,檢索1943年以來,人工神經網絡模型發展的這段歷史,便可以發現只有模式聯系者(pattern associator)是專門針對模式識別和分類而開發出來的模型。模式聯系者的誕生源自于條件反射的思想,即建立刺激和反應間的聯系。用模式聯系者的話說,就是對于特定的輸入刺激模式,給出相應的反應模式。有趣的是,當用一組單元表示輸入模式,另一組單元表示輸出模式,它們兩兩連接在一起(如圖2),并使用Hebb法則Wij=εαiαi更新權重時(其中,ΔWij為輸入單元j和輸出單元i之間權重的變化量,ε為學習速率,是常數,aWi為輸出單元的激活量,aWj為輸入單元的激活量),模式聯系者便能在同一個模型中存儲不同的輸入模式,將反應模式相同的輸入模式歸于同一類,并且當模式中的某些量缺失時,比如某個輸入單元損壞,模型仍能正常運行[3]??梢?,模式聯系者能夠有效地模擬分類任務,甚至是某些腦神經受損病人(相當于某些輸入或輸出單元受損)的分類活動。然而,人工語法學習并不僅是單純的分類任務,它還具有其他特征,因此,只模擬測試階段的分類任務是遠遠不夠的。
第二,人工語法學習的另一個特征是,學習階段要求被試在沒有任何指導(反饋)的情況下學習字符串,即并沒有在被試學習某一字符串的同時,告訴他們這一字符串屬于哪一類,合法還是非法。投射到模式聯系者中,就是在學習對特定刺激模式的分類時,不伴隨相應的反應模式,即沒有輸出單元。事實上,人類的許多學習過程都是在沒有外部指導的情況下進行的。比方說,當孩子看到麻雀和燕子(刺激模式)時,家長告訴他這是鳥(反應模式),但很多時候,家長并不在身邊,比如,當孩子看到鴿子時,沒有外在反應模式指導,孩子仍能反應為鳥,人類似乎能夠在沒有外在的反應模式引導教育的情況下,學會分類。人工語法學習也是一樣,雖然在學習時,沒有被告知哪些合法,哪些不合法,但是被試仍能學會分類規則。這些事實提示研究者:必須開發一種沒有外在引導者的自適應模型。于是,McClelland 和Rumelhart(1985)在對模式聯系者稍做調整的基礎上,提出了模式聯系者的一個自適應特例――自動聯系者[7]。由于沒有外部引導,任何自適應模型必須具備自我反饋的功能,自動聯系者也一樣,如圖3所示,每個單元除了接收外部輸入(e)以外,還必須接收來自其他單元的內部輸入(i),這種存在內部反饋的模型被稱為循環模型。為了達到分類的目的,自動聯系者旨在再現單元的外部輸入模式,就好像人工語法學
圖3 含有8個單元的自動聯系者(資料來源:文獻[7])
習中,記憶字符串一樣。而為了達到這一點,必須調節連接權重,使單元的內部輸入能匹配外部輸入,用公式表示為:
aWj為單元j的激活量。雖然,自動聯系者模型沒有可比對的反應模式,但是,上述算法的核心仍是用內部狀態去匹配外部狀態,盡量減少兩者間的差異,因此,上述公式仍可看成delta法則*的變式。當然,除了使用delta法則來訓練自動聯系者外,也有研究者(例如,文獻[14])使用類似模式聯系者的Hebb法則訓練該模型。和模式聯系者一樣,自動聯系者也能習得不同的外部輸入模式,并對此做出分類??梢?,自動聯系者能夠很好地模擬人工語法學習任務學習和測試階段的表面屬性――無外部引導的分類學習任務。然而,它是否能模擬語法學習這一內部屬性呢?
第三,人工語法學習的本質特征在于所獲得的是有關語法的知識。雖然,如前所述,自動聯系者獲得的是一種無法外顯的分布性表征的知識,但是,有意思的是這種表征似乎代表了某一類別的原型。而原型或許就好比語法的抽象表示方法。McClelland 和Rumelhart(1985)曾構建了一個由24個單元組成的自動聯系者,將一些有關狗的信息輸入這24個單元[7],其中前8個單元輸入的是狗的名字信息,后16個單元輸入的是狗的外貌信息,結果發現經過訓練后,模型的權重矩陣呈現出特殊的構造,即前8個單元之間及前3個單元與后16個單元間的權重處于隨機水平,而后16個單元間的權重卻出現某種固定的模式,McClelland和Rumelhart認為這種固定的模式就是狗視覺表象的原型。雖然,無法從這種固定的權重模式中,看出典型的狗應該具有哪些特征,但是至少可以認為,如果兩個單元間的連接權重比較大,那么當這兩個單元同時被激活時,模型有可能將目標判斷為狗。也就是說,原型所表征的是每個視覺特征間的聯系。這就好比,人工語法學習中的語法知識,語法或許是由字母間的聯系所表征的。所以,從這點意義上來,自動聯系者習得的原型或許就是語法知識。
3.2 序列學習和簡單循環網絡
序列學習任務要求被試對一系列規則序列進行選擇反應,其假設為:如果被試習得了序列間存在的固定規則,則他們可以依據前面呈現的序列來預測下一個項目是什么,成功的預測將會縮短被試的反應時[11]。序列學習和人工語法學習之間的本質區別在于:它是一項預測任務,而非分類任務,被試對某一項目的反應依賴于前面的項目。
1990年,Elman開發了簡單循環網絡,專門用來模擬這類預測任務[9]。簡單循環網絡的目的是根據當前輸入的項目來預測下一個項目,它的基本結構如圖4所示,由4個加工單元層組成,它們分別是輸入單元層、隱含單元層、上下文單元層和輸出單元層。輸入單元層用于表征當前輸入的項目,輸出單元層用于表征模型所預測的項目,上下文單元層用于表征在當前項目之前出現的項目序列,而隱含單元層負責在輸入、輸出和上下文單元層間的信息傳遞。簡單循環網絡的工作原理為:在接收第一
圖4 簡單循環網絡的基本結構(資料來源:文獻[16])
個項目時,輸入層中的某些單元被激活,并將激活傳遞給隱含層中的單元,隱含層除了將激活進一步傳遞給輸出層,由輸出層預測第二個項目外,還將自己的激活水平復制于上下文層,當接收第二個項目時,隱含層除了收到來自輸入層的激活外,還將收到來自上下文層的激活,因此,它向輸出層傳遞的激活則包含了第一和第二兩個項目的信息,依此類推,輸出層所做出的預測是基于包含當前項目之內的所有項目的信息。當然,和其他許多人工神經網絡模型一樣,簡單循環模型依據delta法則來調整權重的,即將模型給出的預測與真實出現的后續項目進行比較,來調整權重。不過,簡單循環網絡所使用的delta法則和自動聯系者有兩點差異:(1)權重調整是通過斜率遞減法進行的,即尋求預測反應和真實項目之間誤差方差的最小值,用公式表示為:
其中,tout為真實的正確輸出,aout為模型的預測輸出;(2)不同于自動聯系者,簡單循環網絡是多層模型,當調整輸出層單元和隱含層單元間的權重時,計算預測和真實項目間的誤差方差是可以直接計算獲得的,然而當要調整隱含層單元與輸入層單元或上下文層單元間的權重時,由于不存在真實的正確反應,誤差方差則無從計算,所以Rumelhart和McClelland(1986)提出可以用輸出層單元的誤差來估計隱含層單元的誤差,即某一隱含單元的誤差為所有與之連接的輸出層單元的誤差與它們之間權重乘積求和的函數[6]
然后,同樣用斜率遞減法求出權重的變化量,這種誤差計算的法則和簡單循環網絡中原有的信息流方向正好相反,所以又被稱為逆向推導。
簡單循環網絡能有效地模擬序列學習中的預測機制,因此,它剛提出不久,就被用于模擬內隱序列學習,用來研究序列學習的抽象性等問題[13,15,16]。
總之,針對不同的內隱學習任務,為了得到更佳的模擬效果,研究者往往傾向于選擇不同人工神經網絡模型加以模擬。然而,就像是任務之間的劃分并不絕對一樣(比如:Cleeremans等就曾將人工語法和序列學習結合在同一個任務中),神經網絡模型和內隱學習任務間的匹配也并不絕對,比如:Boucher等(2003)就層用簡單循環網絡來模擬序列學習[17]。
4 小結
基于權重調整來學習正確反應的人工神經網絡模型和內隱學習的兩大本質特征間有著極優的匹配,人工神經網絡模型在內隱學習領域的適用性毋庸置疑。在這樣的背景下,出于深入探討內隱學習的目的,研究者紛紛根據不同的內隱學習任務,選用不同的人工神經網絡模型對之加以模擬[18]。到目前為止,針對兩種較為普遍的內隱學習任務,也相應地出現了兩種使用較為廣泛的神經網絡模型――自動聯系者和簡單循環網絡。在實際研究中,合理地使用這兩個模型,必將為內隱學習的理論和人工模擬提供更有力的證據。
參考文獻
[1] Cleeremans A. Mechanisms of Implicit Learning: Connectionist Models of Sequence Processing. In: Jeffrey L E ed. Neural Network Modeling and Connectionism. London: MIT Press, 1993
[2] Dienes Z, Perner J. Implicit knowledge in people and connectionist networks. In: Underwood G.. Implicit cognition. Oxford: Oxford University Press, 1996
[3] McLeod P, Plunkett K, Rolls E T. Introduction to Connectionist Modelling of Cognitive Processes. Oxford: Oxford University Press, 1998
[4] Milner P. A Brief History of the Hebbian Learning Rule. Canadian Psychology, 2003, 44(1): 5~9
[5] Rosenblatt F. The perceptron: A probabilistic model for information storage and organization in the brain. Psychological Reviews, 1958, 65: 386~408
[6] Rumelhart D, McClelland J. Parallel distributed processing (vol. 1). Cambridge: MIT press, 1986a
[7] McClelland J, Rumelhart D. Distributed Memory and the Represantation of General and Specific Information. Journal of Experimental Psychology: General, 1985, 114(2): 159~188
[8] Jordan M. An introduction to linear algebra in parallel distributed processing. In: Rumelhart D, McClelland J ed. Parallel distributed processing (vol. 1). Cambridge: MIT press, 1986a. 365~422
[9] Elman J. Finding structure in time. Cognitive Science, 1990, 14(2): 179~212
[10] Reber A S. Implicit learning of artificial grammars. Journal of Verbal Learning and Verbal Behavior, 1967, 6(2): 317~327
[11] Nissen M J, Bullemer P. Attentional requirement of learning: Evidence from performance measures. Cognitive Psychology, 1987, 19(1): 1~32
[13] 郭秀艷, 鄒玉梅, 李強等. 中學生顏色內隱學習特征的實驗研究. 心理與行為研究, 2003, 1(2): 122~127
[14] Cleeremans A, McClelland J L. Learning the Structure of Event Sequence. Journal of Experimental Psychology: General, 1991, 120(3): 235~253
[15] Dienes Z. Connectionist and Memory-Array Models of Artificial Grammar Learning. Cognitive Science, 1992, 16(1): 41~79
[16] Jiménez L, Méndez C, Cleeremans A. Comparing Direct and Indirect Measures of Sequence Learning. Journal of Experimental Psychology: Learning, Memory, and Cognition, 1996, 22(4): 948~969
[17] Dienes Z, Altmann G, Gao S J. Mapping across Domains Without Feedback: A Neural Network Model of Transfer of Implicit Knowledge. Cognitive Science, 1999, 23(1): 53~82
人工神經網絡范文4
關鍵詞:神經網絡;MATALB仿真;新BP算法
中圖分類號:TP183 文獻標識碼:A 文章編號:1009-3044(2009)05-1197-02
BP Artificial Neural Network's New Algorithm
SONG Shao-yun, ZHONG-tao
(Yuxi Normal University, School of Information Technology and Engineering, Yuxi 653100, China)
Abstract: The BP neural networks algorithm presented in this paper is based on the existing algorithm, which basic principle is choosing a freedom weight, by solving the linear equations to achieve hidden layer, combination freedom weight, then obtain weight is necessary weight. This algorithm hasn't the traditional method such as the local minimum and the slower rate of convergence in BP neural networks algorithm.
Key words: neural network; MATALB simulation; new BP algorithm
1 引言
BP人工神經網絡實際上是通過梯度下降法來修正各層神經元之間的權值,使誤差不斷下降以達到期望的精度。從本質上講,這種計算過程是一種迭代過程,迭代算法一般都與初值的選擇密切相關,如初值選擇的好,則收斂速度快,如初值選擇不好,則收斂速度慢或根本不收斂。當采用梯度下降算法調整權值時,不可避免地存在陷入局部極小的問題。盡管很多文獻都報道了各種各樣的改進方法來加快收斂速度,如變學習率,加慣性項(也稱動量項)等方法。然而,由于這些方法都由于迭代及優化的基本思想,不可能從根本上解決對初值的依賴性及局部極小問題。
2 BP網絡結構及參數假設
人工神經網絡范文5
人工神經網絡屬于一種對人腦結構及功能進行反映的數學抽象模型,對人的思維以及存儲知識等功能進行模擬,從而完成某項工作。對于巖土工程來說,主要包括巖體和土體兩項內容,且這兩項內容均具備很高的復雜性。在巖土工程研究過程中,有必要借助人工神經網絡,從而使巖土工程的研究得到有效進步發展。本文在分析人工神經網絡的基礎上,進一步對人工神經網絡在巖土工程中的應用進行分析,以期為巖土工程研究的進展提供一些具有價值的參考建議。
關鍵詞:
人工神經網絡;巖土工程;應用
巖土工程的研究對象分為兩大類:其一為巖體;其二為土體。巖土工程涉及的介質存在兩大特性,即模糊性和隨機性,這兩大特性又統稱為不確定性。近年來,不少學者在巖土工程研究過程中,提出了人工神經網絡這一概念,即利用人工神經網絡,將其應用到巖土工程研究領域當中,從而為深入了解巖土工程的某些介質特征奠定有效基礎[1]。從巖土工程研究的優化及完善角度考慮,本文對“人工神經網絡在巖土工程中的應用”進行分析意義重大。
1人工神經網絡分析
1.1人工神經網絡概念
對于人工神經網絡來說,是一種對人腦結構與功能進行反映的數學抽象模型;主要通過數理策略,經信息處理,進一步對人腦神經網絡構建某種簡化模型,進一步采取大量神經元節點互連,從而形成復雜網絡,最終完成人類思維及儲存知識的能力的模擬。神經網絡無需構建反映系統物理規律的數學模型,與別的方法比較,在噪聲容忍度方面更強[2]。與此同時,還擁有很強的非線性映射功能,對于大量非結構性以及非精準性規律存在自適應能力,具備超強的計算能力,可完成信息的記憶以及相關知識的推理,且其自身還具備自主學習能力;與常規算法相比,優勢、特點突出。
1.2BP網絡簡述
從研究現狀來看,基于實際應用過程中,人工神經網絡模型大多數采取BP網絡。BP網絡即指的是多層前饋網絡,因多層前饋網絡的訓練通常使用誤差反向傳播算法,所以將BP網絡稱之為屬于一類誤差反向傳播的多層前饋網絡。對于其網絡而言,具備輸入節點和輸出節點,同時還具備一層隱層節點與多層隱層節點,基于同層節點當中不存在耦合狀態。其中的輸入信號從輸出層節點依次傳過各個隱層節點,進一步傳輸至輸出節點,每一層節點的輸出只對下一層的節點輸出產生影響。
2人工神經網絡在巖土工程中的應用分析
在上述分析過程中,對人工神經網絡的概念有一定的了解,由于其模型算法的優越性,可將其應用到巖土工程研究領域當中,從而為解決巖土工程問題提供有效憑據。從現狀來看,人工神經網絡在巖土工程中的應用主要體現在以下幾大方面。
2.1在巖石力學工程中的應用
巖石力學工程是巖土工程中尤為重要的一部分,將神經網絡應用到巖石力學工程當中,主要對巖石非線性系統加以識別,同時還能夠為工程巖體分類提供有效幫助,此外在爆破效應預測方面也具備一定的應用價值。對于人工神經網絡來說,存在從有限數據中獲取系統近似關系的優良特性,而巖石當中的各項參數之間又存在很復雜的關系,并且難以獲取完整的參數集。在這樣的情況下,使用人工神經網絡技術,便能夠使巖石非線性系統識別問題得到有效解決[3]。此外,有研究者將巖石抗壓強度、抗拉強度以及彈性能量指數等作為巖爆預測的評判指標,進一步對巖爆預測的神經網絡模型進行構建,然后預測了巖爆的發生與烈度。通過計算得出結論:采取人工神經網絡方法進行巖爆預測行之有效,值得采納借鑒。
2.2在邊坡工程中的應用
對于巖土工程中的邊坡工程來說,邊坡失穩狀況突出,且是由多因素造成的,比如邊坡失穩的地質形成條件、誘發因素的復雜性以及隨機性等。與此同時,由于邊坡動態監測技術從目前來看尚且不夠成熟,因此邊坡失穩在巖土工程研究領域一直視為是一項難以解決的工程項目。而對于神經網絡方法來說,因其具備非常好的預測功能,因此相關巖土工程研究工作者通常會采取人工神經網絡對巖土工程中的邊坡工程問題進行求解。并且,從現有研究成果來看,將人工神經網絡應用于巖土工程的成果突出。有學者對影響巖質邊坡的穩定性的相關因素進行了分析,包括地形因素、巖體因素以及外部環境因素等,并構建了邊坡穩定性分析的BP網絡模型[4]。此外,還有學者將大量水電邊坡工程的穩定狀況作為學習訓練樣本及預測樣本,對以人工神經網絡技術的邊坡巖體的穩定性進行了研究,結果顯示,采取人工神經網絡對邊坡巖體的穩定狀況進行預測可行性高。
2.3在基坑工程中的應用
采取人工神經網絡對基坑變形進行預測主要分為兩種情況:其一,對會影響基坑變形的各大因素及位移的神經網絡模型加以構建;其二,把變形監測數據作為一個時間序列,以歷史數據為依據,將系統演變規律查找出來,進一步完成系統未來發展趨勢的分析及預測。有學者針對基坑變形利用了人工神經網絡方法進行預測,結果表明:對前期實測結果加以應用,使用此方法能夠對后續階段的基坑變形實時預測出來,并且預測結果和實測結果保持一致性。此外,還有學者根據具體工程項目,采取人工神經網絡,對深基坑施工中地下連續墻的位移進行了深入分析及預測,結果顯示:使用人工神經網絡方法進行分析及預測,在精準度上非常高,值得在深基坑工程相關預測項目中使用[5]。
2.4在地鐵隧道工程中的應用
在地鐵隧道施工過程中,存在地表變形和隧道圍巖變形等狀況,為了深入了解這些狀況,可將人工神經網絡應用其中。有學者在對地層的影響因素進行分析過程中,列出了可能的影響因素:盾構施工參數、盾構物理參數以及地質環境條件,進一步利用人工神經網絡,構建了人工神經網絡模型,進一步針對盾構施工期間的地層移動進行實時動態預測,最終得到了不錯的預測成果。此外,還有學者對BP網絡算法進行改進,然后對某地鐵工程中隧道上方的地表變形進行了未來趨勢預測,結果表明:和其他地表變形預測方法相比,人工神經網絡預測方法的應用價值更為顯著。
3結語
通過本文的探究,認識到基于人工神經網絡模型的算法具備很高的優越性,由于巖土工程地質條件復雜,為了深入研究巖土工程,可將人工神經網絡應用其中。結合現狀研究成果可知,人工神經網絡在巖石力學工程、邊坡工程、基坑工程以及地鐵隧道工程中均具備顯著應用價值。例如:將人工神經網絡應用于巖石力學工程當中,能夠預測巖爆的發生與烈度;應用于邊坡工程當中,能夠邊坡工程的穩定性進行精準預測;應用于基坑工程當中,實現對基坑工程變形的實時動態監測;應用于地鐵隧道工程當中,能夠進一步了解地鐵工程中隧道上方的地表變形情況。
總而言之,人工神經網絡在巖土工程中的應用價值高,值得相關工作者采納應用。
作者:張洪飛 單位:山東正元建設工程有限責任公司
參考文獻
[1]鄭惠娜.章超樺.秦小明.肖秀春,等.人工神經網絡在食品生物工程中的應用[J].食品工程,2012(01):16-19.
[2]鄒義懷.江成玉.李春輝,等.人工神經網絡在邊坡穩定性預測中的應用[J].礦冶,2011(04):38-41.
[3]曹建智.張健.人工神經網絡在白洋淀水質評價中的應用[J].電子技術與軟件工程,2016(08):261-262.
人工神經網絡范文6
旅游市場趨勢預測是旅游業發展戰略和旅游規劃與開發工作的重要基礎依據,一直是旅游市場研究中最重要的內容之一。根據市場趨勢預測的結果,旅游相關部門才可以制定合理的旅游規劃,進行旅游資源的優化配置。旅游市場趨勢預測是在對影響市場的諸因素進行系統調查和研究的基礎上,運用科學的方法,對未來旅游市場的發展趨勢以及有關的各種因素的變化,進行分析、預見、估計和判斷。
近年來,旅游研究者對旅游市場趨勢預測的方法進行了探索。目前主要有時間序列法、回歸分析法、指數預測法、人工神經網絡法。由于旅游市場的變化受到諸多因素的影響,導致旅游市場的趨勢預測難度較大,但我們對預測精度的要求卻越來越高。
本文是基于人工神經網絡方法,提出使用遺傳算法對人工神經網絡進行優化,探索更精確、更適用于旅游市場預測現實狀況的預測方法。
1 方法概述
人工神經網絡是近年來的熱點研究領域,是人類智能研究的重要組成部分,已經成為神經科學、計算機科學、認知科學、數學和物理學等多學科關注的熱點。其應用領域包括:分類、預測、模式識別、信號處理和圖像處理等,并繼續向其他領域延伸。
1.1 BP神經網絡
BP神經網絡是一種多層前饋神經網絡,該網絡的主要特點是信號前向傳遞,誤差反向傳播。在前向傳遞中,輸入信號從輸入層經隱含層逐層處理,直至輸出層。每一層的神經狀態只影響下一層神經元狀態。如果輸出層得不到期望輸出,則轉入反向傳播,根據預測誤差調整網絡權值和閾值,從而使BP神經網絡預測輸出不斷逼近期望輸出。
圖中,X1,X2,…,Xn是BP神經網絡的輸入值,Y1,Y2,…,Ym是BP神經網絡的預測值,wij和wjk為BP神經網絡權值。從圖可以看出,BP神經網絡可以看成一個非線性函數,網絡輸入值和預測值分別為該函數的自變量和因變量。當輸入節點數為n,輸出節點數為m時,BP神經網絡就表達了從n個自變量到m個因變量的函數映射關系。
1.2 遺傳算法
遺傳算法(Genetic Algorithms)是1962年由美國Michigan大學Holland教授提出的模擬自然界遺傳機制和重托進貨論而成的一種并行隨機搜索最優化方法。它把自然界“優勝劣汰,適者生存”的生物進化原理引入優化參數形成的編碼串聯群體中,按照所選擇的適應度函數并通過遺傳中的選擇、交叉和變異對個體進行篩選,使適應度值好的個體被保留,適應度差的個體被淘汰,新的群體既繼承了上一代的信息,又優于上一代。這樣反復循環,直至滿足條件。
1.3 遺傳算法優化BP神經網絡的流程
遺傳算法優化BP神經網絡分為BP神經網絡結構確定、遺傳算法優化和BP神經網絡預測3個部分。其中,BP神經網絡結構確定部分根據按擬合函數輸入輸出參數個數確定BP神經網絡結構,進而確定遺傳算法個體的長度。遺傳算法優化使用遺傳算法優化BP神經網絡的權值和閾值,種群中的每個個體都包含了一個網絡所有權值和閾值,個體通過適應度函數計算個體適應度。遺傳算法通過選擇、交叉和變異操作找到最優適應度值對應個體。BP神經網絡預測用遺傳算法得到最優個體對網絡初始權值和閾值賦值,網絡經訓練后預測函數輸出。
遺傳算法優化BP神經網絡是用遺傳算法來優化BP神經網絡的初始權值和閾值,使優化后的BP神經網絡能夠更好地預測函數輸出。遺傳算法優化BP神經網絡的要素包括種群初始化、適應度函數、選擇操作、交叉操作和變異操作。
1)種群初始化
個體編碼方法為實數編碼,每個個體均為一個實數串,由輸入層與隱含層連接權值、隱含層閾值、隱含層與輸出層連接權值以及輸出層閾值4部分組成。個體包含了神經網絡全部權值和閾值,在網絡結構已知的情況下,就可以構成一個結構、權值、閾值確定的神經網絡。
2)適應度函數
2 實證分析
旅游客流量與當地旅游硬件及軟件設施建設、各種交通設備的完善程度有著密切的關系。一個旅游地的交通設施完善程度決定了該景區的可進入性以及客源地到旅游地的時間距離,直接影響該景區游客量。此外,景區建設情況及旅游接待設施的建設情況決定著景區的吸引力。需要指出的是,由于信息傳達的特性,游客數量對景區旅游相關條件改善的反應具有延遲性的特點。本文中,采用2000 年以來北京旅客周轉量、人均GDP、全國交通、A級及以上景區個數、北京公共交通運營線路長度、北京市基礎投資,預測北京市旅游人數。
通過查詢中國國家統計局及北京市統計局相關資料,得到全國人均GDP、全國交通、北京市旅客周轉量、北京市A級及以上景區個數、北京市公共交通運營線路長度、北京市基礎投資數據,如表1所示。
根據遺傳算法和BP 神經網絡理論,在MATLAB 軟件中編程實現基于遺傳算法優化的BP神經網絡進行預測。預測誤差及真實值與預測值對比如圖2、圖3所示。
3 模型的評價