前言:中文期刊網精心挑選了神經網絡的學習方式范文供你參考和學習,希望我們的參考范文能激發你的文章創作靈感,歡迎閱讀。
神經網絡的學習方式范文1
1、指代不同。人工智能:是研究、開發用于模擬、延伸和擴展人的智能的理論、方法、技術及應用系統的一門新的技術科學;神經網絡:是一種模仿動物神經網絡行為特征,進行分布式并行信息處理的算法數學模型。
2、方法不同。人工智能:企圖了解智能的實質,并生產出一種新的能以人類智能相似的方式做出反應的智能機器,該領域的研究包括機器人、語言識別、圖像識別、自然語言處理和專家系統等;神經網絡:依靠系統的復雜程度,通過調整內部大量節點之間相互連接的關系,從而達到處理信息的目的。
3、目的不同。人工智能:主要目標是使機器能夠勝任一些通常需要人類智能才能完成的復雜工作;神經網絡:具有初步的自適應與自組織能力。在學習或訓練過程中改變突觸權重值,以適應周圍環境的要求。同一網絡因學習方式及內容不同可具有不同的功能。
以上就是小編給大家分享的人工智能與神經網絡之間區別,相信大家通過閱讀完以上文章后對此有了一定的了解,希望能幫到大家。
(來源:文章屋網 )
神經網絡的學習方式范文2
【關鍵詞】BP神經網絡;預測;誤差
1.引言
許多金融學家和計量學家對發達國家成熟市場的波動性進行了廣泛的研究,但是在對股市的預測上,由于人們在知識、能力、經驗上存在著較大的差異,加之問題本身又具有很大的隨機性和高度的非線性,即使是一些金融專家、炒股高手對出現的同一復雜行情進行分析,往往也會得出不同的結論。此外,傳統方法還要事先知道各種參數,以及這些參數在什么情況下應作怎樣的修正。這都給預測股市帶來一定的困難。
基于以上股市預測的困難性,本文提出了人工神經網絡的預測方法。隨著計算機、人工智能尤其是專家系統的發展,人工神經網絡技術逐漸成熟并開始應用于各個領域。人工神經網絡(ANN,簡稱神經網絡)作為一種由大量簡單神經元廣泛相互聯接而成的非線性映射或自適應動力系統,恰好能有效解決股市預測處理中常見的困難,因此它很快在股市預測分析與處理領域得到了廣泛的應用。
2.BP神經網絡介紹
2.1 BP 網絡算法的基本原理
2.1.1 標準的BP 網絡算法的基本原理
BP(Back Propagation)網絡是反向傳播的多層前饋式網絡,是目前使用最為廣泛的一種人工神經網絡。它的核心是BP算法,一種對于多基本子系統構成的大系統進行微商計算的嚴格而有效的方法,采用最小均方差學習方式。BP 神經網絡的原理說到底就是給它一些輸入變量,然后就有一個輸出,輸出值的情況與實際的情況進行比較,差多少,然后再進行網絡的內部調整,屬于有導師的學習規則,使得網絡輸出與實際逼近。
神經網絡能學習和存貯大量的輸入―輸出模式映射關系,而無需事前揭示描述這種映射關系的數學方程。人工神經網絡由非線性函數組成,而由一系列不同權重的線性過濾器組合而成:
2.1.2 BP網絡算法的優化
由于常用的BP算法主要缺點為收斂速度慢,局部極值,難以確定隱含層和隱含層的個數,使得在實際應用中BP算法很難應用,因此,出現了許多改進算法。BP算法的改進主要有兩種途徑,一種是采用啟發式學習方法;另一種則是采用更有效的優化算法,本文采用了動量法和學習率自適應調整的策略,從而提高了學習速度并增加了算法的可靠性。動量法降低了網絡對于誤差曲面局部極值的敏感性,有效地抑制了網絡陷于局部極小。
2.2 BP神經網絡的模型識別及步驟
模式通常指對事物的一種定量描述或結構描述,“識別”是指對客觀事物按其物理特征進行分類。模式識別的基本原理就是從待識別對象和理想標本之間若干特征的相似性推斷它們之間總體的相似性。BP神經網絡模式識別過程分為訓練階段和模式分類階段,分為初始化、數據與處理、網絡訓練以及模式分類四個步驟。以下利用實證分析來進行著四個步驟。
3.實例分析
下面以上證的某股600個交易日的股票價格收盤指數作為原始樣本數據,對上述神經網絡模型進行求解,預測20天的收盤價,與實際收盤價進行比較,并求出其誤差:
式中,表示第日的實際收盤指數,表示第日的預測值,表示誤差。主要按照如下幾部分來處理:(1)準備600個數據的時間序列,進行歸一化。BP神經網絡中每個神經元的輸出值由傳遞函數Sigmoid函數來計算,其輸出值的范圍是(0,1);(2)留出最后20個數據,作為預測檢驗使用;(3)繪制圖像,包括實際值和預測值,能量函數;(4)分析實際和預測兩曲線的趨勢。
采用I-J-K學習模型,該模型是輸入層I個神經元,隱層J 個神經元,輸出層K個神經元。利用BP神經網絡模型訓練500次、800次、1000次的輸出值和期望值以及能量函數(或者叫誤差函數)E,結果見圖1到圖3。
通過上面的圖示,可以看到用BP神經網絡預測的效果比較明顯,這說明該模型適用于短期預測嗎,股市的波動在很多地區都是非常劇烈的,各種因素的綜合作用也使得長期股指的變動具有極大的不確定性,使得預測變得很困難。而BP網絡的算法原理和自學習的特點使其能夠充分挖掘出隱含在樣本數據中的規律性,實現從輸入空間到輸出空間的非線性映射,對樣本數據進行精確的擬合。從而BP神經網絡的方法對于股市上的一些很難看出規律的數據列的預測而言,無疑是一個比較精確的預測方法。
4.結論
本文介紹了股市的特點以及股市預測的困難性,提出了利用BP神經網絡的方法來解決股市預測問題。文章介紹了BP神經網絡算法的基本原理,BP神經網絡算法的優化,BP神經網絡模型識別及步驟,最后后以上海證券交易所每日股票價格收盤指數為分析對象,把原理應用于實際,利用BP神經網絡對股票價格收盤指數進行了短期預測,并計算出預測值和實際值的誤差。通過實驗發現該模型收斂速度快,預測精度非常高,對預測短周期內股指波動具有較強的適用性。
參考文獻
[1]高琴.人工神經網絡在股市預測模型中的應用[J].微電子學與計算機,2007年第24卷第11期.
[2]周翠紅,路邁西.線性回歸與人工神經網絡預測煤炭發熱量[J].煤炭科學技術,第37卷第12期.
[3]尹慶雙,奉瑩.人工神經網絡在第三產業就業分析中的應用[J].人口與經濟,2009年第6期.
[4]鄒文安,劉寶,姜波,楊春生.基于Excel 技術平臺人工神經網絡BP模型及應用[J].水文,第30卷第1期.
[5]康進,劉敬偉.非參數回歸估計與人工神經網絡方法的預測效果比較[J].統計與決策,2009年第23 期.
[6]楊本昭,田耕.基于人工神經網絡的客戶價值分類研究[J].科技管理研究,2007年第12期.
神經網絡的學習方式范文3
伴隨著計算機技術的快速發展,圖像處理技術在社會中的應用也越加廣泛,圖像分割技術優勢越加顯著。圖像分割是圖像處理上面的關鍵性環節,是圖像處理過程中的重要因素,對于圖像理論發展具有決定性因素。近年,圖像分割技術已經取得了較大的成果,特別是在模糊理論和神經網絡方面,眾多研究程度已經開始逐漸在圖像處理中應用,促進圖像處理技術發展。
【關鍵詞】數字圖像處理 圖像分割 灰色系統 神經網絡
近幾年,圖像處理已經在社會中廣泛應用,圖像分割技術在圖像處理上面的重要性越加顯著。圖像分割技術是圖像處理中的基礎性技術之一,圖像分割技術質量直接影響著圖像識別及分析質量,因此圖像分割技術已經成為識別系統中的關鍵性因素。
1 圖像分割發展現狀及應用領域
1.1 發展現狀及存在的問題
在圖像分割中使用統一方法,是現在很多研究人員的主要研究方向,所以圖像分割還是困擾視覺領域上的主要問題,還有很多問題沒有得到很好的處理,現如今圖像分割還存在以下幾個問題:
1.1.1 與人類視覺機理相脫節
伴隨著研究人員對于視覺機理不斷深入性研究,人們對于視覺認識也越加深入,現在圖像分割上面所使用的方法已經與視覺機理研究成果之間存在一定差異,難以提高圖像分割精準性。提高圖像分割精準性,積極探索先進分割方法,就必然將人類視覺特點考慮在內,讓圖像分割與人類視覺特點相結合,滿足人工神經網絡理論。
1.1.2 知識的利用問題
圖像分割在實際利用作用主要表現在,對于灰度及空間信息分割,這種分割方式所產生的效果與人類視覺分割之間的效果之間存在較大差異。在圖像分割中應該積極與人類視覺相結合,了解更多知識,這充分認識到分割圖像上面知識重要性,同時在視覺上面,人們在研究中經常將已經掌握圖像分析,這樣就解決了知識所存在的不確定因素,提高圖像分割重要性。
1.2 應用領域
圖像處理中的重要技術就是圖像分割技術,伴隨著圖像處理在個領域內的廣泛應用,現在圖像分割技術所應用的范圍也越加廣泛。到現在為止,圖像分割技術已經在工業、產品生產等等領域內應用。
2 灰色系統理論
2.1 灰色理論的主要內容及特點
灰色系統理論一共包含兩個部分的理論體系,分別是灰色系統理論與灰色系統分析方法,整個理論體系主要內容就是灰色朦朧集,將灰色序列作為重要的方法?;疑碚撓到y所涉及知識范圍十分廣泛,在短時間內已經取得了快速發展,應用廣泛,主要是由于灰色理論系統在實際應用具有三個特點,分別是系統性、聯系性及動態性。
2.2 灰色關聯分析
灰色系統分析理論的重要組成內容就是灰色關聯分析,核心思想就是將幾個曲線之間所具有的幾何形狀進行對比分析,也就是不同幾何形狀之間越相似,關聯度也就越高,發展拜年話形式越加貼近?;疑P聯度主要是從定量角度對于系統之間各各因素關系變化分析,通過大小、方向、速度等等因素判斷不同因素之間的關聯性?,F在在灰色關聯計算中,所使用的方法較多,例如絕對關聯度、點關聯度等等。
3 基于灰色關聯和神經網絡的圖像分割
3.1 人工神經網絡
人工神經網絡就是根據人腦處理方式所形成的智能信息處理理論,模擬人腦學習方式。近幾年,人工神經網絡研究工作在取得了較大的成果,其中最為顯著特點表現在信息分布及儲存上面,與人類視覺系統越加吻合,具有較高的自學習性及兼容性,發展快速,已經在信息領域上面應用較大的市場前景。
3.2 神經元模型與數字描述
在對于神經網絡神經元與生物神經元對比中發現,生物神經元主要由三個部分構成,分別是細胞體、樹突和軸突,這些部分別承擔著信息處理到傳輸等工作。
在神經元數學模型描述中,第i個神經元能夠接受到其他神經元所傳輸的信號x,突觸強度主要應w表示,這稱之為權系數。這種神經元數學方程式為:
方程式中的θ表示的是闕值,f表示的是激勵函數。
3.3 基于灰色-BP網絡的圖像分割
在圖像分割中已經開始廣泛應用神經網絡,其中主要應用的是神經網絡中的BP網絡,同時應用已經十分成熟。在圖像處理過程中具有較多的隱藏層數及節點缺陷,隱藏層數及節點個數對于網絡泛化能力具有一定影響,如果要是應用BP網絡,那么最后輸出樣本結果才是最合適的。網絡節點要是過多,主要就是將網絡訓練結果考慮在內,其中包含噪聲的影響,網絡泛化能力在不斷降低,節點個數要是過少,網絡就不能夠有效整合數據信息,網絡泛化能力也會受到影響,最后對于網絡整體運行造成影響。在網絡結構優化上面,很多研究人員也根據實際情況提出了一些計算方式,希望能夠簡化網絡結構,例如敏感計算法等等,但是研究人員所提出的計算方法在實際應用中取得的效果并不是十分顯著。筆者所提出的灰色系統和BP網絡結合,能夠有效解決BP網絡所存在的節點問題,提高圖像分割精準度,與傳統BP算法相比較,泛化能力更加顯著,網絡運行更加穩定,分割效果更為顯著。
在BP神經網絡具有代表性結構,拓撲結構為三層,也就是一個輸入層,一個隱含層,一個輸出層。為了能夠提升網絡運行性能,經常使用修改學習效率及優化方法等等方式。
設一個具有Q層的人工神經網絡,其中第一層為輸入層,第Q層為輸出層,那么該網絡的輸入輸出變換關系為:
i=1,2,…,nq 其中η為系統的學習效率,
w為修正權系數,
該式表示第q層第i個節點與第j個節點在t次學習后的值
4 結論
圖像分割質量對于數字圖像處理算法工作具有重要作用,因此圖像分割已經成為理解系統與識別系統在研究中十分重要的因素。本文基于灰色系統理論的數字圖像處理算法簡單研究,還存在一定不足,僅供參考。
參考文獻
[1]陳志國,傅毅,孫俊.群體智能算法的遙感圖像處理研究[J].計算機應用研究,2013(08):2538-2540.
[2]王偉,王輝,張瀟.基于免疫和灰色系統理論的網絡認知研究[J].微電子學與計算機,2013(06):117-121.
[3]李曉峰,劉光中.人工神經網絡BP算法的改進及其應用[J].四川大學學報(二程科學版),2015(03).
[4]邵虹,徐全生,崔文成.基于BP神經網絡的人臉圖像識別方法的研究[J].沈陽工業大學學報,2014,2(04):346-348.
[5]匡錦俞,丁俊民,陳十祿.圖像的小波系數神經網絡預測編碼[J].北京師范大學學報,2015,35(04):464-467.
作者簡介
邵黃興(1991-),男,安徽省宣城市人。同濟大學軟件學院在讀碩士。研究方向為數字圖像處理。
神經網絡的學習方式范文4
關鍵詞:“交通—經濟”大系統;交通投資;BP神經網絡;預測
作為一種人類社會發展的先行資本,交通基礎設施的投資與建設成為了實現經濟增長的重要先決條件。由于建設周期長、投資大,造成影響交通投資的因素十分廣泛而復雜,因此在研究交通投資預測時,國內許多學者增加了影響交通投資的相關因素??锩?、胡思繼等人選取了鐵路市場份額、鐵路貨運量、港口貨物吞吐量、基本建設投資、GDP、第二產業比重、原煤產量、鋼產量8個指標作為鐵路運輸的影響因素,運用BP神經網絡對鐵路運輸進行了預測。方庚明運用多元回歸方法,建立了包括經濟、人口、政策影響客運量發展相關因素在內的客運量發展預測模型。溫愛華、李松選取了GDP、公路運營里程、公路貨運量、鐵路運營里程、鐵路復線比例、鐵路貨物周轉量、鐵路貨運量、鐵路運輸從業人員8個指標作為影響鐵路貨運量的因素,基于GRNN模型對其進行了預測。王文莉、楊俊紅采用灰色理論對影響鐵路客運量的因素,即GDP、人口、居民平均消費水平、工業增加值、社會消費品零售總額、公路客運量、民航客運量、旅客列車旅行速度進行分析,采用動態分辨系數的灰色關聯分析法實現影響因素的優化選擇。
關于交通方面的預測方法較多,常用的有回歸分析法、時間序列法、灰色模型預測法等,他們都需要建立函數模型才能實現預測。而且通過這些方法所建立的模型,不能全面地反映所預測動態數據內在結構的復雜性和非線性,容易丟失信息。近年來,隨著神經網絡技術的發展,部分學者嘗試利用神經網絡進行交通量的預測,構建了多種模型,并取得了一定成就。與傳統的預測模型相比,神經網絡模型不需要建立函數模型,有較強的自適應性和學習性,具有建立分段非線性模型的能力,對于交通基礎設施這個復雜的系統來說,運用神經網絡模型進行預測是一種有效的方法。
由于交通投資是一個復雜的系統工程,影響投資的因素較多,而且每個因素也會隨著環境的變化而變化,因此為了全面、科學、本質地反映交通投資的變化,本文在前人研究的基礎上,構建在“交通—經濟”大系統環境下影響交通投資的層次結構模型,運用BP神經網絡模型進行預測。
一、 交通基礎設施投資影響因素層次結構模型
交通基礎設施投資規模是由交通基礎設施可供量和需求量共同決定的,而影響交通投資規模的可供量和需求量又涉及到社會生產與生活的方方面面,由此決定了交通投資預測是一個復雜的非線性系統。本文將影響交通投資的因素分成三大類:一類是交通基礎設施自身內部的因素,主要包括交通供給與需求;第二類是經濟社會因素,如GDP、產業結構狀況、人均消費、人口等;第三類是經濟體系的外部因素,如資源、環境、地理條件等。根據層次分析法指標體系建立的方法,將交通基礎設施投資作為目標層,交通基礎設施供給系統、需求系統、經濟社會系統和資源系統作為準則層,影響因素作為指標層,構建在“交通—經濟”大系統環境下交通基礎設施投資影響因素層次結構模型(見圖1)。
二、 建立交通基礎設施投資的BP神經網絡預測模型
1. BP神經網絡的基本結構。BP神經網絡是一種多層前饋神經網路,其采用誤差反向傳播學習算法。它由輸入層、隱含層和輸出層構成,通過有指導的學習方式進行訓練和學習,將神經元的激活值從輸入層經各個隱含層向輸出層傳播,在輸出層的各個神經元獲得網絡的實際輸出響應。通過比較輸出層各個神經元的實際輸出與期望輸出,獲得二者之間的誤差,然后按照減少誤差的方向,從輸出層經過各個隱含層并逐層修正各個連接權值,最后回到輸入層。這種過程不斷重復進行,直到誤差降低,至可以接受的范圍,學習訓練過程也就隨之結束。通常情況下,由于訓練樣本有限,一般強調選擇能達到要求的最小網絡。因此,本文所構建的交通投資BP神經網絡預測模型的其網絡拓撲結構見圖2所示。
2. 建立預測模型。訓練對于神經網絡模型的建立是至關重要的,訓練結果的好壞將會影響神經網絡模型的擬合與預測效果。因此,我們在訓練時要考慮到預測,而不是一味地追求高擬合度,要注意整個模型擬合與預測的一致性。
基于這個目的,本文以同一年份的交通投資總額、鐵路投資額、公路投資額、水運投資額、航空投資額、管道投資額、客運量、客運周轉量、貨運量、貨運周轉量、GDP、其他基礎設施投資、非基礎設施投資、人均消費、人口、能源消耗總量16個指標作為一個神經元。利用1980年~2009年的數據作為輸入量,2010年的數據作為輸出量進行網絡訓練;同時利用1979年~2008年的數據作為輸入,2009年的數據作為輸出對網絡的性能進行測試,驗證模型是否可靠。由于隱含層神經元的確定是根據問題的要求和輸入、輸出單元的多少,本文經過反復測試,確定隱含層節點數設為5比較合理。因此,本文的預測模型網絡結構采用30-5-1結構,即輸入層有30個神經元,隱含層有5個神經元,輸出層有1個神經元,也是說用前30年數據作為學習樣本,后1年的數據作為預測效果檢驗樣本。
三、 應用BP神經網絡進行交通基礎設施投資的預測
神經網絡的學習方式范文5
[關鍵詞]探地雷達 神經網絡 自組織特征映射
[中圖分類號] TN95 [文獻碼] B [文章編號] 1000-405X(2015)-3-131-3
1前言
在探地雷達的數據處理中,通常采用的是類似地震數據處理中的一些手段和方法,比如去除零漂、增益處理、帶通濾波、道均衡等等,這些方法均是對整個剖面進行操作的,而我們可以通過神經網絡方法,對數據體中某幾個區域進行選取,對比研究,以判斷其存在的雷同性或者差異性,來達到分類的目的,用以不同深度和區域地質體的判別和認定。
2神經網絡結構及算法
2.1神經網絡結構
神經網絡系統是用數學思維模擬人腦神經信息處理方式的一種人工智能網絡,它是一個高度復雜的非線性動力學系統,由大量簡單的神經元廣泛相互連接而成。神經元一般是一個多輸入單輸出的非線性器件,它是神經網絡的基本處理單元,結構模型見圖1所示。神經網絡因其具有大規模并行計算、容錯性強、分布式存儲及超強學習能力等優點,被廣泛應用于諸多領域,并取得了引人注目的成果。
經過多年的發展,已經發展出感知器網絡、BP網絡、徑向基網絡、Hopfield網絡、自組織網絡和LVQ網絡等等。
在已知目標向量的情況下,可以采用由導師的訓練方法,然后針對探地雷達數據的特點,這里沒有采用BP神經網絡等需要導師的網絡進行訓練學習,而采用了無需提供導師信號的神經網絡――自組織神經網絡。
2.2自組織特征映射神經網絡算法
自組織神經網絡的無導師學習方式更類似于人類大腦認知過程,其最重要的特點是通過自動尋找樣本中的內在規律和本質屬性,自適應地改變網絡參數與結構。自組織神經網絡又分為幾個內容,自組織競爭網絡、特征映射網絡、共振理論模型等。本文采用的自組織特征映射(SOM)神經網絡,是由芬蘭神經網絡專家Kohonen于1981年提出的。SOM網絡共有兩層―輸入層和輸出層,分別模擬感知外界輸入信息的視網膜和做出響應的大腦皮層,對于某個特定的輸入模式,輸出層會有某個節點產生最大響應而獲勝,獲勝神經元對其鄰近神經元存在側擬制機制。
SOM網絡采用的學習算法稱為Kohonen算法,采用優勝域思想,模擬生物區域神經興奮競爭機制,其算法過程按如下步驟進行:
2.2.1初始化
給定初始學習率η(0);建立初始優勝鄰域Nj*(0);給輸出層各神經元對應的權向量賦小隨機數,并進行歸一化處理得到Wj。
2.2.2輸入模式
自組織網絡中選取一個輸入模式,并進行歸一化處理得到X。
2.2.3尋找獲勝神經元
將X與輸出層所有神經元對應的權向量Wj進行相似性比較,最相似的神經元獲勝,權向量為Wj*:
2.2.4確定優勝鄰域Nj*(t)
以j*為中心確定t時刻的權值調整域,優勝鄰域內的所有神經元均按其離開獲勝神經元的距離遠近不同調整權值,隨著訓練次數的增加,優勝鄰域半徑不斷收縮。
2.2.5調整權值
只有獲勝神經元才有權按下式學習調整其權向量Wj*:
其中η(t)隨時間變化逐漸下降到0,一般取 或
2.2.6重新歸一化處理
對經學習調整后的權向量重新進行歸一化處理,循環計算,直到學習率η衰減到0。
3理論數值模擬應用
3.1區分方波函數
首先通過方波函數,用有導師的神經網絡進行訓練,對神經網絡的使用加以試驗說明。
原始數據共48道,400ms采樣時間的方波數據,200-400ms的振幅2倍于0-200ms,如圖2中a所示,將0-48道的0-100ms和300-400ms的數據拼接構成網絡輸入信號,目標函數為一個長度為201的向量,0-100為0,101-201為1;測試數據選取為原始數據中100-350ms部分的數據,測試目標函數為一個長度為251的向量,0-100為0,101-251為1。
通過神經網絡訓練,得到圖2中b中所示結果,星號為目標曲線,紅色為輸出曲線,綠色為誤差曲線,可以看出誤差為零,訓練結果還是令人滿意的。
3.2判別模擬數據
對一個模擬數據的某一塊數據體(圖3(a)),我們采用自組織特征映射網絡對其進行訓練分類。
根據上述的算法,對18-37道、15-50ms采樣時間的數據進行訓練分類,在分成5類的情況下,從18道至37道網絡自動識別成為以下情況:4 4 4 5 5 5 2 2 2 2 2 2 3 3 3 3 1 1 1 1,其中一個數字代表一類情況,用其他道的數據測試該網絡時可以得到如下結果:40道返回數字1,15道返回數字4,與實際情況相符合。
可以看出SOM算法對不同的波形分類的情況還是比較理想的,當然這個分類情況和事先給定的種類也有關系,給定的種類越多,分的越細,給定的種類越少,分的越粗。對于圖3(b)中40ms附近的反射異常,在2個分類的情況下,可以方便的與圍巖分辨出來,反射異常區的各道為一個類別,圍巖區域為一個類別。
4實際數據應用
下面我們通過實際采集到的雷達數據進行訓練處理。
野外作業主機為美國GSSI公司的SIR-20型,天線為40M低頻組合天線,數據共70道,采樣長度1024ms,0.2m點測采集,64次疊加,數據為在灰巖地區獲取。
數據剖面見圖4,由于工作環境為灰巖地區,初步判斷B區域為反射異常,對A區域存有疑慮?,F根據SOM算法,應用神經網絡對其進行分類辨別,通過訓練歸類,得出以下結論:A區域49-55道與B區域62-70道屬于同一類別的,56-61道屬于另外一個類別。因此認定A區域與B區域應為同一類地層反射引起,由于振幅較強,判斷為一個埋深較大的溶洞,56-61道可能由于區域含水吸收導致能量較弱,后經開挖驗證,A區域與B區域確實為一個連通溶洞,且規模很大。
5結論
通過對方波函數的判別、模擬數據的訓練分類以及實際數據異常反射區的分類判定,可以看出神經網絡方法作為一個手段來對探地雷達數據處理還是很有效果的,在一定程度上能夠滿足剖面處理的要求,達到使用的目的。本文使用無導師的網絡進行訓練的目的就是為了能夠自動判別分類,避免人為干預的影響,當然某些情況下以可以采用有導師的網絡,有針對性的進行識別。
本文得到中國地質調查局基[2014]01-034-013項目資助。
Abstract: Get across the introduce of neural network, using the characteristic than training the network to classified, after the experimentation on square function and simulation data, finally carry on real acquisition data, identify and class the choosed area, achieve the aim to distinguish and cognizance about structure in different area on profile,satisfy the require of data process.
Keywords: GPR Neural network Self-Organizing Feature Map
參考文獻
[1]飛思科技產品研發中心.神經網絡理論與MATLAB7實現[M].北京:電子工業出版社,2005.
Fei Si Technology R & D center. Neural Network Theory and MATLAB7 Implementation[M]. Beijing: Electronic Industry Press,2005.
[2]李大心.探地雷達方法與應用[M].北京:地質出版社,1994.
Li Da-xin. Method and application of ground penetrating radar [M]. Beijing: Geology Press, 1994.
[3]翟波,楊峰,孫水明.基于二維濾波的探地雷達數據去噪研究[J].南京師范大學學報,2007,7(3):80.
Zhai Bo, Yang Feng, Shui Ming-sun. Based on two-dimensional filtering of ground penetrating radar data denoising [J]. Nanjing Normal University, 2007,7 (3): 80.
[4]楊峰,彭蘇萍,張全升. 地質雷達精細處理技術方法的應用研究[J].工程勘察,2007,(4):70-74
Yang Feng, Su Ping-peng, Zhang Quan-sheng. Ground Penetrating Radar Method for fine processing technology applied research [J]. Engineering Survey, 2007 (4) :70-74.
[5]郝建新,魏玉峰,林雄斌,地質雷達探測干擾因素及圖像識別研究[J].工程勘察,2008(11):73-75.
Jian-Xin Hao, Yu-Feng Wei, Lin Xiongbin, ground penetrating radar interference factors and image recognition research[J]. Engineering Survey, 2008 (11) :73-75.
[6] David. J. Bescoby, Gavin C. Cawley, and P. Neil Chroston. Enhanced interpretation of magnetic survey data from archaeological sites using artificial neural networks[J]. Geophysics,2006, 71,H45.
[7] Zhengping Liu and Jiaqi Liu. Seismic-controlled nonlinear extrapolation of well parameters using neural networks. Geophysics,1998,63:2035.
神經網絡的學習方式范文6
關鍵詞: BP神經網絡; Gauss變異; 學習率; 沖量系數; 動態調整
中圖分類號: TN911?34 文獻標識碼: A 文章編號: 1004?373X(2014)06?0012?03
0 引 言
神經網絡是一個黑箱模型,它具有很強的適應能力和學習能力,在人工智能、自動控制、模式識別、信號處理、預測及評價等方面都有著越來越廣泛的應用[1?3]。目前已經提出了多種訓練算法和網絡模型,其中應用最廣泛的是前饋型神經網絡。前饋型神經網絡訓練中使用最多的方法是誤差反向傳播(Back Propagation,BP)學習算法。BP算法系統地解決了多層網絡中隱含神經元連接權的學習問題,使BP 網絡成為應用最為廣泛的一種神經網絡模型。但是BP網絡也有一些不足[4?5]。比如:收斂速度太慢問題、局部極小點問題、網絡癱瘓問題、穩定性問題、步長問題等,極大地影響了神經網絡的進一步應用。很多學者對BP 網絡進行了深入研究并提出了許多改進的模型[6?9],這些改進模型的收斂速度比標準梯度法快數十倍,但它們仍都不是普遍適用的,都有著各自的優勢或缺陷。本文結合BP網絡的訓練過程,提出一種改進的BP網絡訓練方法,將Gauss變異與改進的BP算法相結合,對學習率參數和沖量系數進行動態調整,使得權值能很好的調整。避免了傳統的BP 算法容易陷入局部極小的問題,同時可以提高BP 算法的訓練速度,降低收斂時間。
1 BP神經網絡
BP 神經網絡是一種單向傳播的多層前饋網絡[1],它包含輸入層、中間層(隱層)和輸出層,是目前應用較多的一種模型。該算法在層次型網絡結構上采用誤差逆傳播學習方式,學習過程由正向傳播和誤差逆傳播組成。算法的主要思想是把學習過程分為兩個階段:第一階段是正向傳播過程,輸入信息從輸入層經中間層逐層計算各神經元的實際輸出值,每一層神經元的狀態只對下一層神經元的狀態產生影響;第二階段是反向傳播過程,若在輸出層未能得到期望的輸出值,則逐層遞歸計算實際輸出與期望輸出之間的差值,根據此誤差修正前一層權值使誤差信號趨向最小。它通過連續不斷地在相對于誤差函數斜率下降的方向上計算網絡權值和偏差變化而逐漸逼近目標。每一次權值和誤差的變化都與網絡誤差的影響成正比。
假設神經網絡輸出層有m個神經元,若輸出層第j個神經元與中間層第i個神經元之間權值為[wij],中間層第i個神經元的輸出為[Oi],閾值為[bj],則輸出層第j個神經元的輸入總和為其上層各單元加權和:
輸出實際值為:
若輸出期望值為[yj],則網絡關于第p個樣本的誤差函數定義為:
而將網絡關于整個樣本集的全局誤差函數定義為:
BP算法采用梯度下降法調整權值,每次調整的量為:
式中:[δj=f(netj)(yj-Oj)];[α]為學習率,它決定每一次訓練中的權值變化大小。
BP算法主要的優點是簡單、易于實現。但是BP 算法有兩個致命的缺陷:首先最大的缺陷是BP算法很可能陷入局部極小值,因為通常的誤差曲面都是凸凹不平的,會有多個極值點;另一個缺陷是收斂速度慢,當采用梯度下降法時步長不容易確定,步長太長則達不到精度,甚至會發散;太小則迭代步驟增加,收斂速度慢。鑒于此,目前對BP算法的改進主要集中在兩個方面:其一是避免陷入局部極小值,一旦陷入要想辦法逃出;其二是改進迭代算法,加快收斂速度。
2 Gauss變異與改進的BP算法相結合
BP算法的不足在一定程度上都與每次權值修改程度大小有關。如果每次訓練,權值都能向全局極小值方法進行修改,那么上述問題都能得到解決??捎眠z傳算法對BP算法中的學習率進行動態調整。初始時將學習率設大一些,加快算法的收斂。后期將學習率設小一些,以便可以找到全局極小值點。為了使算法的整體性能更高,采用將改進的BP算法和遺傳算法相結合。
2.1 改進的BP算法
BP網絡的訓練過程是根據樣本集對神經元之間的連接權進行調整的過程。其次,BP網絡執行的是有導師訓練。所以,其樣本集是由形如:
(輸入向量,理想輸出向量)
的向量對構成的。BP網絡接收樣本的順序會對訓練的結果有很大的影響。它更“偏愛”較后出現的樣本。如果每次循環都按照[(X1,Y1)],[(X2,Y2)],…,[(XS,YS)]所給定的順序進行訓練,在網絡“學成”投入運行后,對于與該樣本序列較后的樣本較接近的輸入,網絡所給出的輸出的精度將明顯高于與樣本序列較前的樣本較接近的輸入對應的輸出精度。所以算法應該避免“分別”、“依次”的出現。因此,不再“分別”、“依次”根據[(X1,Y1)],[(X2,Y2)],…,[(XS,YS)]對權值向量[W(1)],[W(2)],…,[W(M)]進行調整,而是用[(X1,Y1)],[(X2,Y2)],…,[(XS,YS)]的“總效果”去實施對[W(1)],[W(2)],…,[W(M)]的修改。獲取樣本集“總效果”的最簡單的辦法是?。?/p>
式中:∑表示對整個樣本集的求和;[Δpw(k)ij]代表神經元i到神經元j的連接權[w(k)ij]關于樣本[(Xp,Yp)]的調整量。
權值的本次修改要考慮上次修改的影響,以減少抖動問題。引入沖量系數[β],以將上次權值的調整量,進入當前權值的修改過程,平滑學習路徑??紤]上次修改的影響,本次權值的修改公式為[1]:
式中:[Δwij′]為上一次的修改量;[Oi]表示第i個神經元的輸出;[β]為沖量系數,通常取0~1之間的小數。因為[β]值較大時,雖能加快訓練速度,但影響精度及收斂性,太小又起不到影響本次權值修改的作用。因此,[β]的取值視具體問題由試驗確定。
上述算法較好地解決了因樣本的順序引起的精度問題和訓練的抖動問題。但是,該算法的收斂速度還是比較慢的。為了解決收斂速度問題,可以給每一個神經元增加一個偏移量來加快收斂速度。
2.2 Gauss變異調整學習率參數和沖量系數的基本思想
BP算法中,如果學習率步長、沖量系數不變,那么到后期可能由于步長太大從而不能繼續進行優化。所以步長應該進行動態調整。當權值進行調整時,可用Gauss變異生成兩個小的隨機數,并將這兩個小的隨機數作為學習率參數和沖量系數。
2.3 整體算法流程
為了避免讓算法陷入局部極小值點,將遺傳算法中群體的概念應用進來。生成N個個體,每個個體執行算法,算法運行完成后,選取最好個體中的誤差作為最小誤差。
每個個體執行的算法如下:
3 實驗及實驗結果分析
為了說明Gauss變異的有效性,將本文中的改進算法與不加入Gauss變異和群體概念的改進BP算法在收斂速度方面進行比較。采用Balance?scale數據集進行了算法驗證,該數據集的訓練樣本特征為4個,目標輸出類型有3種,本文采取200個4維樣本向量構造標準樣本空間,輸出為2維向量進行訓練,其收斂曲線對比如圖1所示。
圖1 訓練收斂曲線對比圖
圖1顯示的是迭代1 000次,算法的收斂速度。為了有可比性,初始權值設為固定值。從圖1中可以看出,加入Gauss變異后收斂速度大大提高。運行了幾個例子,都能得到這一結論。但對于不同的例子,產生的Gauss隨機數不能直接賦給學習率參數和沖量系數,還要根據不同的實際,對隨機數乘上不同的權值。這個權值是個經驗值,需要進行若干次實驗來確定一個比較優的值。
另外,用此算法對一個數據集進行分類,采用breast?cancer?wiscon數據集,訓練樣本和測試樣本根據Cross?validation[10]進行劃分。每個分區輪流作為測試樣本進行測試。由于breast?cancer?wiscon數據集比較簡單,分類屬性只有兩個值,所以只將分類屬性的值變換成0或1。BP網絡的輸出如果在[0,0.5]之間,則將屬性的值定為0;否則為1。算法參數設置如表1所示。
表1 算法參數設置
實驗結果如表2所示。
表2 實驗結果
從以上實驗結果可以得知,用Gauss變異動態調整學習率參數和沖量系數,可以加快算法的收斂速度,并且可以得到比較好的分類結果。但是,Gauss函數自變量和隨機數權值應取多大需要進行若干次實驗,才能確定一個比較好的值。
4 結 語
本文結合BP網絡的訓練過程,提出一種改進的BP網絡訓練方法,將Gauss變異與改進的BP算法相結合,對學習率參數和沖量系數進行動態調整,使權值得到很好的調整。實驗結果表明,此方法避免了傳統的BP 算法容易陷入局部極小的問題,在訓練時間和收斂速度方面均表現出更優的性能,具有比較好的實用性。
參考文獻
[1] 蔣宗禮.人工神經網絡導論[M].北京:高等教育出版社,2001.
[2] 張毅,楊建國.基于灰色神經網絡的機床熱誤差建模[J].上海交通大學學報,2011,45(11):1581?1585.
[3] 黃偉,何眸,夏暉.基于小波神經網絡的IP網絡流量預測[J].計算機科學,2011,38(10):296?298.
[4] 田景文,高美娟.人工神經網絡算法研究與應用[M].北京:北京理工大學出版社,2006.
[5] KUMAR S. Neural networks [M].北京:清華大學出版社,2006.
[6] YU X H, CHEN G A, CHENG S X. Dynamic learning rate optimization of the back propagation algorithm [J]. IEEE Transactions on Neural Networks, 1995: 6(3): 669?677.
[7] ROYCHOWDHURY P, SINGH Y P, CHANSARKAR R A. Dynamic tunneling technique for efficient training of multilayer perceptions [J]. IEEE Transactions on Neural Networks, 1999: 10(1): 48?55.
[8] 陳玉芳,雷霖.提高BP網絡收斂速率的又一種算法[J].計算機仿真,2004,21(11):74?79.