卷積神經網絡意義范例6篇

前言:中文期刊網精心挑選了卷積神經網絡意義范文供你參考和學習,希望我們的參考范文能激發你的文章創作靈感,歡迎閱讀。

卷積神經網絡意義

卷積神經網絡意義范文1

過去10年,人們對機器學習的興趣激增。幾乎每天,你都可以在各種各樣的計算機科學課程、行業會議、華爾街日報等等看到有關機器學習的討論。在所有關于機器學習的討論中,許多人把機器學習能做的事情和他們希望機器學習做的事情混為一談。從根本上講,機器學習是使用算法從原始數據中提取信息,并在某種類型的模型中表示這些信息。我們使用這個模型來推斷還沒有建模的其他數據。

神經網絡是機器學習的一種模型,它們至少有50年歷史了。神經網絡的基本單元是節點(node),基本上是受哺乳動物大腦中的生物神經元啟發。神經元之間的連接也以生物的大腦為模型,這些連接隨著時間的推移而發展的方式是為“訓練”。

在20世紀80年代中期和90年代初期,許多重要的架構進步都是在神經網絡進行的。然而,為了得到好的結果需要大量時間和數據,這阻礙了神經網絡的采用,因而人們的興趣也減少了。在21世紀初,計算能力呈指數級增長,計算技術出現了“寒武紀大爆發”。在這個10年的爆炸式的計算增長中,深度學習成為這個領域的重要的競爭者,贏得了許多重要的機器學習競賽。直到2017年,這種興趣也還沒有冷卻下來;今天,我們看到一說機器學習,就不得不提深度學習。

作者本人也注冊了Udacity的“Deep Learning”課程,這門課很好地介紹了深度學習的動機,以及從TensorFlow的復雜和/或大規模的數據集中學習的智能系統的設計。在課程項目中,我使用并開發了用于圖像識別的卷積神經網絡,用于自然語言處理的嵌入式神經網絡,以及使用循環神經網絡/長短期記憶的字符級文本生成。

本文中,作者總結了10個強大的深度學習方法,這是AI工程師可以應用于他們的機器學習問題的。首先,下面這張圖直觀地說明了人工智能、機器學習和深度學習三者之間的關系。

人工智能的領域很廣泛,深度學習是機器學習領域的一個子集,機器學習又是人工智能的一個子領域。將深度學習網絡與“經典的”前饋式多層網絡區分開來的因素如下:

比以前的網絡有更多的神經元更復雜的連接層的方法用于訓練網絡的計算機能力的“寒武紀大爆炸”自動特征提取

這里說的“更多的神經元”時,是指神經元的數量在逐年增加,以表達更復雜的模型。層(layers)也從多層網絡中的每一層都完全連接,到在卷積神經網絡中層之間連接局部的神經元,再到在循環神經網絡中與同一神經元的循環連接(recurrent connections)。

深度學習可以被定義為具有大量參數和層的神經網絡,包括以下四種基本網絡結構:

無監督預訓練網絡卷積神經網絡循環神經網絡遞歸神經網絡

在本文中,主要介紹后三種架構?;旧希矸e神經網絡(CNN)是一個標準的神經網絡,通過共享的權重在空間中擴展。CNN設計用于通過內部的卷積來識別圖像,它可以看到圖像中待識別的物體的邊緣。循環神經網絡(RNN)被設計用于識別序列,例如語音信號或文本。它的內部有循環,這意味著網絡上有短的記憶。遞歸神經網絡更像是一個層級網絡,在這個網絡中,輸入必須以一種樹的方式進行分層處理。下面的10種方法可以應用于所有這些架構。

1.反向傳播

反向傳播(Back-prop)是一種計算函數偏導數(或梯度)的方法,具有函數構成的形式(就像神經網絡中)。當使用基于梯度的方法(梯度下降只是方法之一)解決優化問題時,你需要在每次迭代中計算函數梯度。

對于神經網絡,目標函數具有組合的形式。如何計算梯度呢?有兩種常用的方法:(i)解析微分(Analytic differentiation)。你已經知道函數的形式,只需要用鏈式法則(基本微積分)來計算導數。(ii)利用有限差分進行近似微分。這種方法在計算上很昂貴,因為函數值的數量是O(N),N指代參數的數量。不過,有限差分通常用于在調試時驗證back-prop實現。

2.隨機梯度下降法

一種直觀理解梯度下降的方法是想象一條河流從山頂流下的路徑。梯度下降的目標正是河流努力達到的目標——即,到達最底端(山腳)。

現在,如果山的地形是這樣的,在到達最終目的地之前,河流不會完全停下來(這是山腳的最低點,那么這就是我們想要的理想情況。)在機器學習中,相當從初始點(山頂)開始,我們找到了解決方案的全局最小(或最佳)解。然而,可能因為地形的性質迫使河流的路徑出現幾個坑,這可能迫使河流陷入困境。在機器學習術語中,這些坑被稱為局部極小值,這是不可取的。有很多方法可以解決這個問題。

因此,梯度下降很容易被困在局部極小值,這取決于地形的性質(用ML的術語來說是函數的性質)。但是,當你有一種特殊的地形時(形狀像一個碗,用ML的術語來說,叫做凸函數),算法總是保證能找到最優解。凸函數對ML的優化來說總是好事,取決于函數的初始值,你可能會以不同的路徑結束。同樣地,取決于河流的速度(即,梯度下降算法的學習速率或步長),你可能以不同的方式到達最終目的地。這兩個標準都會影響到你是否陷入坑里(局部極小值)。

3.學習率衰減

根據隨機梯度下降的優化過程調整學習率(learning rate)可以提高性能并減少訓練時間。有時這被稱為學習率退火(learning rate annealing)或自適應學習率(adaptive learning rates)。訓練過程中最簡單,也是最常用的學習率適應是隨著時間的推移而降低學習度。在訓練過程開始時使用較大學習率具有進行大的改變的好處,然后降低學習率,使得后續對權重的訓練更新更小。這具有早期快速學習好權重,后面進行微調的效果。

兩種常用且易于使用的學習率衰減方法如下:

逐步降低學習率。在特定的時間點較大地降低學習率。

4?. Dropout

具有大量參數的深度神經網絡是非常強大的機器學習系統。然而,過擬合在這樣的網絡中是一個嚴重的問題。大型網絡的使用也很緩慢,這使得在測試時將許多不同的大型神經網絡的預測結合起來變得困難。Dropout是解決這個問題的一種方法。

Dropout的關鍵想法是在訓練過程中隨機地從神經網絡中把一些units(以及它們的連接)從神經網絡中刪除。這樣可以防止單元過度適應。在訓練過程中,從一個指數級的不同的“稀疏”網絡中刪除一些樣本。在測試時,通過簡單地使用一個具有較小權重的單一網絡,可以很容易地估計所有這些“變瘦”了的網絡的平均預測效果。這顯著減少了過擬合,相比其他正則化方法有了很大改進。研究表明,在視覺、語音識別、文檔分類和計算生物學等監督學習任務中,神經網絡的表現有所提高,在許多基準數據集上獲得了state-of-the-art的結果。

5. Max Pooling

最大池化(Max pooling)是一個基于樣本的離散化過程。目標是對輸入表示(圖像,隱藏層輸出矩陣等)進行下采樣,降低其維度,并允許對包含在分區域中的特征進行假設。

這在一定程度上是為了通過提供一種抽象的表示形式來幫助過擬合。同時,它通過減少學習的參數數量,并為內部表示提供基本的平移不變性(translation invariance),從而減少計算成本。最大池化是通過將一個最大過濾器應用于通常不重疊的初始表示的子區域來完成的。

6.批量歸一化

當然,包括深度網絡在內的神經網絡需要仔細調整權重初始化和學習參數。而批量標準化有助于實現這一點。

權重問題:無論權重的初始化如何,是隨機的也好是經驗性的選擇也罷,都距離學習到的權重很遙遠??紤]一個小批量(mini batch),在最初時,在所需的特征激活方面將會有許多異常值。

深度神經網絡本身是有缺陷的,初始層中一個微小的擾動,就會導致后面層巨大的變化。在反向傳播過程中,這些現象會導致對梯度的分散,這意味著在學習權重以產生所需輸出之前,梯度必須補償異常值,而這將導致需要額外的時間才能收斂。

批量歸一化將梯度從分散規范化到正常值,并在小批量范圍內向共同目標(通過歸一化)流動。

學習率問題:一般來說,學習率保持較低,只有一小部分的梯度校正權重,原因是異常激活的梯度不應影響學習的激活。通過批量歸一化,減少異常激活,因此可以使用更高的學習率來加速學習過程。

7.長短時記憶

LSTM網絡在以下三個方面與RNN的神經元不同:

能夠決定何時讓輸入進入神經元;能夠決定何時記住上一個時間步中計算的內容;能夠決定何時讓輸出傳遞到下一個時間步長。

LSTM的優點在于它根據當前的輸入本身來決定所有這些。所以,你看下面的圖表:

當前時間標記處的輸入信號x(t)決定所有上述3點。輸入門從點1接收決策,遺忘門從點2接收決策,輸出門在點3接收決策,單獨的輸入能夠完成所有這三個決定。這受到我們的大腦如何工作的啟發,并且可以基于輸入來處理突然的上下文/場景切換。

8. Skip-gram

詞嵌入模型的目標是為每個詞匯項學習一個高維密集表示,其中嵌入向量之間的相似性顯示了相應詞之間的語義或句法相似性。Skip-gram是學習單詞嵌入算法的模型。

Skip-gram模型(以及許多其他的詞語嵌入模型)的主要思想是:如果兩個詞匯項(vocabulary term)共享的上下文相似,那么這兩個詞匯項就相似。

換句話說,假設你有一個句子,比如“貓是哺乳動物”。如果你用“狗”去替換“貓”,這個句子仍然是一個有意義的句子。因此在這個例子中,“狗”和“貓”可以共享相同的上下文(即“是哺乳動物”)。

基于上述假設,你可以考慮一個上下文窗口(context window,一個包含k個連續項的窗口),然后你跳過其中一個單詞,試著去學習一個能夠得到除跳過項外所有項的神經網絡,并預測跳過的項是什么。如果兩個詞在一個大語料庫中反復共享相似的語境,則這些詞的嵌入向量將具有相近的向量。

9.連續詞袋(Continuous Bag Of Words)

在自然語言處理問題中,我們希望學習將文檔中的每個單詞表示為一個數字向量,使得出現在相似的上下文中的單詞具有彼此接近的向量。在連續的單詞模型中,我們的目標是能夠使用圍繞特定單詞的上下文并預測特定單詞。

我們通過在一個龐大的語料庫中抽取大量的句子來做到這一點,每當我們看到一個單詞時,我們就會提取它周圍的單詞。然后,我們將上下文單詞輸入到一個神經網絡,并預測位于這個上下文中心的單詞。

當我們有成千上萬的這樣的上下文單詞和中心詞以后,我們就有了一個神經網絡數據集的實例。訓練神經網絡,最后編碼的隱藏層輸出表示特定單詞的嵌入。而當我們對大量的句子進行訓練時也能發現,類似語境中的單詞得到的是相似的向量。

10.遷移學習

卷積神經網絡意義范文2

關鍵詞:人機大戰;人工智能;發展前景

中圖分類號:TP391 文獻標識碼:A

0.引言

2016年3月15日,備受矚目的“人機大戰”終于落下帷幕,最終Google公司開發的“AlphaGo”以4∶1戰勝了韓國九段棋手李世h。毫無疑問,這是人工智能歷史上一個具有里程碑式的大事件。大家一致認為,人工智能已經上升到了一個新的高度。

這次勝利與1997年IBM公司的“深藍”戰勝國際象棋世界冠軍卡斯帕羅不同。主要表現在兩個方面:

(1)AlphaGo的勝利并非僅僅依賴強悍的計算能力和龐大的棋譜數據庫取勝,而是AlphaGo已經擁有了深度學習的能力,能夠學習已經對弈過的棋盤,并在練習和實戰中不斷學習和積累經驗。

(2)圍棋比國際象棋更加復雜,圍棋棋盤有361個點,其分支因子無窮無盡,19×19格圍棋的合法棋局數的所有可能性是冪為171的指數,這樣的計算量相當巨大。英國圍棋聯盟裁判托比表示:“圍棋是世界上最為復雜的智力游戲,它簡單的規則加深了棋局的復雜性”。因此,進入圍棋領域一直被認為是目前人工智能的最大挑戰。

簡而言之,AlphaGo取得勝利的一個很重要的方面就是它擁有強大的“學習”能力。深度學習是源于人工神經網絡的研究,得益于大數據和互聯網技術。本文就從人工智能的發展歷程與現狀入手,在此基礎上分析了人工智能的未來發展前景。

1.人工智能的發展歷程

AlphaGo的勝利表明,人工智能發展到今天,已經取得了很多卓越的成果。但是,其發展不是一帆風順的,人工智能是一個不斷進步,并且至今仍在取得不斷突破的學科。回顧人工智能的發展歷程,可大致分為孕育、形成、暗淡、知識應用和集成發展五大時期。

孕育期:1956年以前,數學、邏輯、計算機等理論和技術方面的研究為人工智能的出現奠定了基礎。德國數學家和哲學家萊布尼茨把形式邏輯符號化,奠定了數理邏輯的基礎。英國數學家圖靈在1936年創立了自動機理論(亦稱圖靈機),1950年在其著作《計算機與智能》中首次提出“機器也能思維”,被譽為“人工智能之父”??傊?,這些人為人工智能的孕育和產生做出了巨大的貢獻。

形成期:1956年夏季,在美國達特茅斯大學舉辦了長達2個多月的研討會,熱烈地討論用機器模擬人類智能的問題。該次會議首次使用了“人工智能”這一術語。這是人類歷史上第一次人工智能研討會,標志著人工智能學科的誕生。其后的十幾年是人工智能的黃金時期。在接下來的幾年中,在眾多科學家的努力下,人工智能取得了矚目的突破,也在當時形成了廣泛的樂觀思潮。

暗淡期:20世紀70年代初,即使最杰出的AI程序也只能解決問題中最簡單的部分,發展遇到瓶頸也就是說所有的AI程序都只是“玩具”,無法解決更為復雜的問題。隨著AI遭遇批評,對AI提供資助的機構也逐漸停止了部分AI的資助。資金上的困難使得AI的研究方向縮窄,缺少了以往的自由探索。

知識應用期:在80年代,“專家系統”(Expect System)成為了人工智能中一個非常主流的分支?!皩<蚁到y”是一種程序,為計算機提供特定領域的專門知識和經驗,計算機就能夠依據一組從專門知識中推演出的邏輯規則在某一特定領域回答或解決問題。不同領域的專家系統基本都是由知識庫、數據庫、推理機、解釋機制、知識獲取等部分組成。

集成發展期:得益于互聯網的蓬勃發展、計算機性能的突飛猛進、分布式系統的廣泛應用以及人工智能多分支的協同發展,人工智能在這一階段飛速發展。尤其是隨著深度學習和人工神經網絡研究的不斷深入,人工智能在近幾十年中取得了長足的進步,取得了令人矚目的成就。

人工智能發展到今天,出現了很多令人矚目的研究成果。AlphaGo的勝利就是基于這些研究成果的一個里程碑。當前人工智能的研究熱點主要集中在自然語言處理、機器學習、人工神經網絡等領域。

2.人工智能l展現狀與前景

人工智能當前有很多重要的研究領域和分支。目前,越來越多的AI項目依賴于分布式系統,而當前研究的普遍熱點則集中于自然語言處理、機器學習和人工神經網絡等領域。

自然語言處理:自然語言處理(Natural Language Processing,簡稱NLP),是語言學與人工智能的交叉學科,其主要功能就是實現讓機器明白人類的語言,這需要將人類的自然語言轉化為計算機能夠處理的機器語言。

自然語言處理主要包括詞法分析、句法分析和語義分析三大部分。詞法分析的核心就是分詞處理,即單詞的邊界處理。句法分析就是對自然語言中句子的結構、語法進行分析如辨別疑問句和感嘆句等。而語義分析則注重情感分析和整個段落的上下文分析,辨別一些字詞在不同的上下文定的語義和情感態度。

當前自然語言的處理主要有兩大方向。一種是基于句法-語義規則的理性主義理論,該理論認為需要為計算機制定一系列的規則,計算機在規則下進行推理與判斷。因此其技術路線是一系列的人為的語料建設與規則制定。第二種是基于統計學習的經驗主義理論,這種理論在最近受到普遍推崇。該理論讓計算機自己通過學習并進行統計推斷的方式不停地從數據中“學習”語言,試圖刻畫真實世界的語言現象,從數據中統計語言的規律。

機器學習:機器學習(Machine Learning)是近20年來興起的人工智能一大重要領域。其主要是指通過讓計算機在數據中自動分析獲得規律,從而獲取“自我學習”的能力,并利用規律對未知數據進行判斷和預測的方法。

機器學致可以分為有監督的學習和無監督的學習。有監督的學習是從給定的訓練數據集中練出一個函數和目標,當有新的數據到來時,可以由訓練得到函數預測目標。有監督的學習要求訓練集同時有輸入和輸出,也就是所謂的特征和目標。而依據預測的結果是離散的還是連續的,將有監督的學習分為兩大問題,即統計分類問題和回歸分析問題。統計分類的預測結果是離散的,如腫瘤是良性還是惡性等;而回歸分析問題目標是連續的,如天氣、股價等的預測。

無監督學習的訓練集則沒有人為標注的結果,這就需要計算機去發現數據間的聯系并用來分類等。一種常見的無監督學習是聚類分析(Cluster Analysis),它是將相似的對象通過靜態分類的方法分成不同的組別或者是特定的子集,讓同一個子集中的數據對象都有一些相似的屬性,比較常用的聚類方法是簡潔并快速的“K-均值”聚類算法。它基于K個中心并對距離這些中心最近的數據對象進行分類。

機器學習還包括如半監督學習和增強學習等類別??偠灾?,機器學習是研究如何使用機器來模擬人類學習活動的一門學科,而其應用隨著人工智能研究領域的深入也變得越來越廣泛,如模式識別、計算機視覺、語音識別、推薦算法等領域越來越廣泛地應用到了機器學習中。

人工神經網絡:在腦神經科學領域,人們認為人類的意識及智能行為,都是通過巨大的神經網絡傳遞的,每個神經細胞通過突出與其他神經細胞連接,當通過突觸的信號強度超過某個閾值時,神經細胞便會進入激活狀態,向所連接的神經細胞一層層傳遞信號。于1943年提出的基于生物神經元的M-P模型的主要思想就是將神經元抽象為一個多輸入單輸出的信息處理單元,并通過傳遞函數f對輸入x1,x2…,xn進行處理并模擬神經細胞的激活模式。主要的傳遞函數有階躍型、線性型和S型。

在此基礎上,對神經網絡算法的研究又有諸多進展。日本的福島教授于1983年基于視覺認知模型提出了卷積神經網絡計算模型。通過學習訓練獲取到卷積運算中所使用的卷積系數,并通過不同層次與自由度的變化,可以得到較為優化的計算結果。而AlphaGo也正是采用了這種深度卷積神經網絡(DCNN)模型,提高了AlphaGo的視覺分類能力,也就是所謂的“棋感”,增強了其對全盤決策和把握的能力。

3.人工智能的發展前景

總體來看,人工智能的應用經歷了博弈、感知、決策和反饋這幾個里程碑。在以上4個領域中,既是縱向發展的過程,也是橫向不斷改進的過程。

人工智能在博弈階段,主要是實現邏輯推理等功能,隨著計算機處理能力的進步以及深度學習等算法的改進,機器擁有了越來越強的邏輯與對弈能力。在感知領域,隨著自然語言處理的進步,機器已經基本能對人類的語音與語言進行感知,并且能夠已經對現實世界進行視覺上的感知。基于大數據的處理和機器學習的發展,機器已經能夠對周圍的環境進行認知,例如微軟的Kinect就能夠準確的對人的肢體動作進行判斷。該領域的主要實現還包括蘋果的Siri,谷歌大腦以及無人駕駛汽車中的各種傳感器等。在以上兩個階段的基礎上,機器擁有了一定的決策和反饋的能力。無人駕駛汽車的蓬勃發展就是這兩個里程碑很好的例證。Google的無人駕駛汽車通過各種傳感器對周圍的環境進行感知并處理人類的語言等指令,利用所收集的信息進行最后的決策,比如操作方向盤、剎車等。

人工智能已經滲透到生活中的各個領域。機器已經能識別語音、人臉以及視頻內容等,從而實現各種人際交互的場景。在醫學領域,人工智能可以實現自動讀片和輔助診斷以及個性化t療和基因排序等功能。在教育領域,機器也承擔了越來越多的輔助教育,智能交互的功能。在交通領域,一方面無人車的發展表明無人駕駛是一個可以期待的未來,另一方面人工智能能夠帶來更加通暢和智能的交通。另外人工智能在安防、金融等領域也有非常廣闊的發展前景??傊?,人工智能在一些具有重復性的和具備簡單決策的領域已經是一種非常重要的工具,用來幫助人們解決問題,創造價值。

參考文獻

[1]阮曉東.從AlphaGo的勝利看人工智能的未來[J].新經濟導刊,2016 (6):69-74.

卷積神經網絡意義范文3

關鍵詞:視覺注視;移動端;數據集;行為推測

中圖分類號:TP391 文獻標識碼:A 文章編號:1009-3044(2017)01-0254-03

Abstract: With the development of computer vision application technology, the behavior prediction of eye gaze has been widely concerned by many scholars at home and abroad, and also has important research significance in the field of biological information recognition. In the era of smart phone tablet popularity to improve human-computer interaction and accurate prediction of the mobile side of the user gaze behavior becomes particularly important. Based on the existing research on visual technology, this paper proposes a scheme to solve the gaze behavior of mobile users by using large data combined with machine learning and convolution neural network knowledge, and analyzes the importance of large-scale data sets in visual application.

Key words: visual gaze; mobile end; data set; behavior conjecture

1 概述

伴S著計算機軟硬件性能和互聯網技術的迅猛發展,大規模的并行計算技術突飛猛進,不斷地發展使各種現有技術變得越來越成熟,同時機器學習和計算機視覺領域也都得到了飛速發展。視覺技術的發展變得越來越重要,并且可以應用到實際生活中的很多方面。人類大量的視覺信息現在可以利用計算機來輔助處理,并完成相關的一些工作。相對于生物信息識別技術這一計算機視覺領域的熱點技術來說,也已廣泛應用于日常生活中[1]。比如指紋識別器,人臉考勤器等平時在許多地方可以經常見到,還有居民家用的攝像頭智能報警系統以及近期炒得火熱的運用支付寶進行刷臉而完成的支付技術等,這些都是運用了生物信息識別技術?,F實中的種種跡象已經表明運用生物信息識別的計算機技術已漸漸的滲透到人們的日常生活中并成為不可或缺的組成部分。時下發展較快也比較常見的生物特征有視網膜、指紋、人臉和人眼等。這些生物信息比如人臉具有個體差異性和自身穩定性特點,從用戶的角度來看該特征具有便攜和低侵入等一些優點。而人眼作為人臉中最顯著的特征,又是人們獲取外界信息最直接最方便的途徑。都說眼是心靈的窗戶,因為眼睛中蘊含著表情、意圖等多種信息。因此,眼睛注視的行為預測受到了國內外眾多學者的廣泛關注,同時在生物信息識別領域中也具有重要的研究意義[2]。

2 注視預測問題

2.1 問題的背景

在心理、認知和用戶交互研究中的注視跟蹤最近已朝向移動解決方案發展,因為它們使得可以直接評估用戶在自然環境中的視覺注意。 除了注意,注視還可以提供關于用戶的動作和意圖的信息:用戶正在做什么以及接下來將做什么。然而,在自然狀態下非結構化的任務中注視行為是相當復雜的,并且不能使用在受控的實驗室環境中創建的模型來得到令人滿意的解釋。自然條件下和實驗室環境有著很大的不同。為了演化在自然環境中對注視行為的推斷,需要一種更加整體的方法,將從認知科學到機器學習的許多學科結合在一起[3]。

從人機交互技術到醫學診斷到心理學研究再到計算機視覺,眼睛注視跟蹤在許多領域都有應用。注視是外部可觀察的人類視覺注意的指標,許多人試圖記錄它。對于眼睛視線方面的研究可以追溯到十八世紀后期。而現如今已經存在各種解決方案(其中許多是商業化的),但是所有的解決方案都具有以下一個或多個方面的問題:高成本(例如,Tobii X2-60),定制或侵入性硬件(例如,Eye Tribe,Tobii EyeX)。然而在現實中的自然條件下,這些因素對實際的應用會造成一些障礙影響,使得眼睛注視跟蹤不能成為任何具有合理的相機(例如,智能手機或網絡攝像頭)的人應該可以使用的普及技術。如何才能使得這種技術普及并且得到應用,提出了一種解決方案。

2.2問題的提出

研究中首先要解決的就是用戶的約束問題,也就是自然條件下使用過程中所受到的各種限制問題。到目前為止,基于注視數據推斷用戶動作的研究受到許多的限制,特別是在自然環境中。限制因素可能包括可用的商業解決方案的昂貴性,其專有性和封閉性以及缺乏實時交互能力等方面。目前的注視跟蹤系統,只是盡量在移動設置中設置各種條件進行補救。商業化定制化的解決方案都有其獨自的閉合性質,因此阻礙了注視跟蹤算法的發展,并且使得不同方法之間的客觀比較變得不可能[4]。此外,注視是一種復雜的現象,涉及認知過程的相互作用。這些過程在設置計算上的建模是非常困難的,尤其是涉及一些未知因素,使得構建實驗設置成為一個很大的挑戰。此外,來自跟蹤實驗的數據因為其商業化的原因很少共享,即使共享數據很大部分也是有其獨立的實驗條件。這些方面的問題都阻礙了跨學科方法在分析和利用注視數據和實驗的相關研究與發展。

2.3 解決問題的研究方向

對基于注視的推斷的個體貢獻通常保持孤立,不能形成更大的整體以促進對注視動作行為的研究。隨著這方面的技術發展和應用,最近出現了一些開源的解決方案。雖然在不同的應用和用戶界面中使用注視已經相當有限,但是移動注視跟蹤的新穎應用開始出現并得到了很快的發展。然而使用移動注視跟蹤來推斷用戶動作的問題是高度多學科的,需要深入理解各個研究領域,包括人眼的功能,數學建模,計算機視覺,機器學習,信息技術,認知過程,用戶交互以及心理學。任何一個研究員或甚至任何研究小組都不可能擁有所有研究領域的專家,因此需要相互的協作共同推進技術的發展[5]。

目前的研究主要是從以下幾個方面進行:

1)研究移動注視跟蹤的認知方面,例如增強對任務中的注視行為的理解或識別不同任務的特征和階段;

2)開發用于從注視數據推斷用戶動作的計算方法,諸如應用機器學習用于行為推斷,優選地實時地;

3)增強用于改善移動注視跟蹤方法和性能的技術軟件/硬件解決方案,并使得設備更容易訪問;

4)發現注視數據在自然環境和虛擬和增強現實應用中的潛在用途,以及定義任務,其中注視可以是用戶動作的有用的預測器。

3 解決方案

首先選擇移動端進行研究,因為目前比較普遍的移動設備比如智能手機、平板電腦都有自己可靠的工作系統,且不需要外部附件。移動設備相對于其他平臺具有以下優勢:

1)使用的廣泛性。據估計,到2019年,世界上超過三分之一的人口擁有智能手機,遠遠超過臺式機/筆記本電腦用戶;

2)軟硬件技術升級的采用率較高。大部分的移動設備具有允許使用擁有計算復雜數據方法的實時的最新軟硬件;

3)移動設備上相機的大量使用已經導致相機技術的快速開發和部署;

4)相機相對于屏幕的固定位置減少了未知參數的數量,潛在地允許開發高精度的校準跟蹤應用。

3.1 注視類型分析

注視估計方法可以分為基于模型或基于外觀[6]?;谀P偷姆椒ㄊ褂醚劬Φ膸缀文P停⑶铱梢员患毞譃榛诮悄し瓷浜突谛螤畹姆椒?。另一方面,基于形狀的方法從觀察到的眼睛形狀觀察注視方向。這些方法傾向于具有低的圖像質量和可變的照明條件。基于外觀的方法直接使用眼睛作為輸入,并可能在低分辨率圖像上工作。相比基于模型的方法,基于外觀的方法被認為需要更大量的用戶特定的訓練數據。通過使用深度學習和大規模數據不必依賴于視覺,以實現準確的無校準注視估計。這種方案提出建立一個基于外觀的數據模型,而不使用任何手工設計的功能,例如頭部姿勢或眼球中心位置。

3.2 技術方案

深度學習的最近成功在計算機視覺的各種領域中是顯而易見的,但是它對改善眼睛跟蹤性能的影響還是相當有限。因為深度學習是需要大量的數據作為支持,而視線追蹤這方面的數據集還比較少,普通的研究所得到的稻菁比較有限,最大的數據集通常只是具有50個受試者左右,由于缺乏大規模數據的可用性,因此發展比較緩慢。因而提出了使用深度學習進行研究的一套方案,就是構造大規模的數據集。利用網絡資源構造一個大規模的基于移動的眼動跟蹤數據集,它包含來自各種背景的大量的受試者,在可變照明條件和不受限制的頭部運動下記錄[7]。運用現有的智能算法得到一個可以進行卷積神經網絡學習端到端的注視預測的后臺決策網絡。不依賴任何預先存在的系統,不需要頭部姿態估計或其他手動設計的特征用于預測。使用只有雙眼和臉部的特征訓練網絡,在這個領域的性能優于現有的眼睛跟蹤方法。雖然現在的決策網絡在精度方面實現了很先進的性能,但是數據輸入的大小和參數的數量使得難以在移動設備上實時使用。 為了解決這個問題,需要培養學習得到一個更小更快的網絡,在移動設備上實現實時性能,使得精度損失進一步降低。

3.3 大規模數據集

為了達到這一方案的預測效果,首先要進行的是數據集的建立。網絡上相關的研究中有許多公開的注視數據集[8]??偨Y對比這些相關的數據集,分析出有些早期的數據集不包含顯著性的頭部姿勢變化或具有粗略的注視點采樣密度。需要對這些數據進行篩選,使得到的數據具有隨機分布特點。雖然一些現代數據集遵循類似的方法,但它們的規模(尤其是參與者的數量)相當有限。大多數現有的眼動追蹤數據集已經由邀請實驗室參與者的研究人員收集,這一過程導致數據缺乏變化,并且成本高且效率不高。因此需要大量的進行數據收集和篩選分析。大規模數據可以通過卷積神經網絡有效地識別人臉(他們的眼睛)上的細粒度差異,從而做出準確的預測。

收集眼動跟蹤數據應該注意的方面:

1)可擴展性。數據應該是自然條件下的使得用戶具有靈活性;

2)可靠性。運用現有的智能移動設備真實的應用圖像而非設計處理過的圖像;

3)變異性。盡量使數據具有較大的變異性,使得模型更加穩健,適應各種環境下的操作。

4 結束語

文章介紹了一種針對移動設備的用戶注視行為推測解決方案。首先建立一個大規模眼動跟蹤數據集,收集大量的注視數據。大型數據集的重要性,以及具有大量各種數據以能夠訓練用于眼睛跟蹤的魯棒模型。然后,訓練得到一個深層卷積神經網絡,用于預測注視。通過仔細的評估,利用深度學習可以魯棒地預測注視,達到一個較好的水平。此外,雖然眼睛跟蹤已經存在了幾個世紀,相信這種新方案的策略可以作為下一代眼動跟蹤解決方案的關鍵基準。希望能通過這方面的研究,使人機交互得到更好的發展。

參考文獻:

[1] 崔耀 視控人機交互系統技術研究與實現[D].西安,西安電子科技大學,2013.

[2] 遲健男, 王志良, 張闖.視線追蹤[M].北京: 機械工業出版社, 2011.

[3] Alireza Fathi, Yin Li, and James M Rehg 2012 Learning to recognize daily actions using gaze In Computer VisionCECCV 2012. Springer, 314-327.

[4] Makeroni Labs 2016 Eye of Horus. https://hackaday.io/project/

6638-eye-of-horus-open-source-eye-tracking-assistance (2016) Accessed: 2016-02-26.

[5] Francisco J Parada, Dean Wyatte, Chen Yu, Brandi Emerick, and Thomas Busey,2015.Expert Eyes: Open-source, high-definition eyetracking Behavior research methods ,2015.

[6] 楊彩霞.基于近紅外光源的非接觸式視線跟蹤技術研究 [D].山東:山東大學,2012.

卷積神經網絡意義范文4

關鍵詞:誘發腦電;事件相關電位;信號提??;生物醫學信號處理

中圖分類號:TP391文獻標識碼:B

文章編號:1004-373X(2008)22-139-03

Review of Methods for Extracting Evoked Potential

HUANG Rihui,LI Ting,FU Yan,WANG Zhaodong

(School of Information,Wuyi University,Jiangmen,529020,China)

Abstract:Estimation of Evoked Potential(EP)is one of the pop issues in biomedical signal processing.As the review of extracting evoked potential,the theories of EP estimation using the methods of coherent average,independent component analysis,wavelet transform,time sequence analysis and neural network in application are introduced.The problems in application with the upper five methods are indicated,it provids a theory basis for research.

Keywords:evoked potential;event related potential;signal extract;biomedical signal processing

誘發腦電(Evoked Potential,EP)是指人為地對外周感覺神經、感覺通路與感覺系統有關的任何結構進行施加適當刺激時所引起的腦電位變化,事件相關電位(Event Related Potential,ERP)是一種特殊的誘發腦電信號,兩者區別主要在于EP是受感覺刺激(視、聽或體感)后神經系統對刺激的直接電生理反應,ERP則是受試者受某一事件刺激后,對該事件所攜帶的某種信息的反應,涉及到人的高級認知活動。

在實際中,由于誘發腦電總是淹沒在較強背景噪聲(包括自發腦電、工頻干擾、眼電、肌電、心電等) 中,其幅值只有0.2~20 μV,信噪比為0~10 dB,而且腦電信號本身又具有隨機性和非平穩性,誘發腦電和自發腦電在頻譜上有相當大的重疊區,使得從觀測的腦電信號中提取誘發腦電更加困難。目前用于腦電信號提取的主要方法如下文所述。

1 相干平均

目前較多用于提取誘發腦電的方法是相干平均[1],采用相干平均法進行誘發腦電提取是基于以下3個假設的:

(1) 誘發腦電和噪聲為加法性的關系,且相互獨立;

(2) 每次刺激后所獲得的誘發腦電波形是一致的,即誘發腦電為確定性信號;

(3) 噪聲與刺激無關,且是零均值的隨機信號。誘發腦電、噪聲和記錄到的信號表示如下:

由于各次記錄下來的誘發腦電信號基本不變,而自發腦電及其他噪聲信號卻是隨機呈現的,故式(2)中的第二項1N∑ni=1ni(n)=0。因此,疊加平均后得到的誘發腦電信號的信噪比提高了N倍。由于各次刺激和響應間的潛伏期有隨機性[2]:

其中,ni是隨機的潛伏期,在進行記錄的信號xi(n)累加時不能簡單地以刺激開始時刻作為對齊數據的參考點,而需要對齊各次記錄信號后再進行疊加。用原始模板0(n)和xi(n)做互相關,由互相關極大處得到延遲ni,對齊后再做平均,并把平均后的結果作為新的模板。

相關平均可以減少不相關自發腦電、噪聲干擾的影響,并可以突出誘發腦電;但這樣需要耗費更多的時間來進行實驗,而且并不是每次實驗都會產生誘發腦電,相干平均后反而會使得誘發腦電更?。?]。

2 獨立分量分析

獨立分量分析(Independent Component Analysis,ICA)是信號處理領域在20世紀90年代后期發展起來的一種全新的處理方法。ICA的發展是和盲信源分離(Blind Source Separation,BSS)緊密聯系的,并在通信、特征提取、生物醫學信號處理、語音信號處理、圖像處理等方面得到廣泛的應用。近年來,ICA逐漸應用于腦電信號處理中,如用ICA進行眼電、肌電、工頻干擾等腦電偽跡(artifact)的去除[4],及單次(或少次)的誘發腦電信號的提?。?],并比較了使用PCA和ICA進行腦電去噪的效果[6]:

(1) 后者適用于去除更多不同種類的腦電干擾;

(2) 分離分析不需要分開不同類型的干擾;

(3) 同時把EEG和干擾信號分離成獨立分量;

(4) 在訓練完成后,能同時提取各通道中的無干擾的腦電信號;

(5) 在大部分的情況下,ICA比PCA保留更多有用的腦電信號。

獨立分量分析是基于信號高階統計量的信號處理方法[7],其基本含義是將多道觀測信號按照統計獨立的原則通過優化算法分解為若干獨立成分,復現出原來的獨立信源。前提是各源信號為彼此統計獨立的非高斯信號(最多有一個源信號符合高斯分布)。

在以往的多導信號處理中,主分量分析(Principal Component Analysis,PCA)和奇異值分解(Singular Value Decomposition,SVD)是較常用的方法之一,但按PCA或SVD分解出來的各分量,只能保證它們之前各不相關,除非它們都是高斯過程,才可以保證各分量之間相互獨立。ICA不僅實現了信號的去相關,而且要求各高階統計量獨立。

ICA的基本原理框圖如圖1所示[8],多導觀測信號X是由多個等效源S(獨立信源)經混合系統A組合而成。ICA的任務是在假定各等效源S獨立且S與A均為未知的條件下,求取最優的解混系統B,使得X通過B后得到的Y逼近S。

圖1 ICA原理圖

獨立分量分析實際上是在某一衡量獨立性的優化判據最優的意義下尋求其近似解,使Y中各分量盡可能獨立;Y與S不但只是近似,而且在排列次序和幅度上都允許不同。較常用的判據如下:互信息極小化,信息極大化,極大似然判據,代價函數極小化等。

由于各種偽跡與腦電信號在時間上是相互獨立的,而且觀測信號可視為它們與腦電無延遲的線性組合,偽跡等效源的數目一般比頭皮上測得的腦電導數要少,所以可以應用ICA來進行腦電去噪,并已經取得了很好的效果[4]。

也有一些研究者把ICA應用于誘發腦電信號的單次提取中[5],主要是假定誘發腦電和背景腦電EEG為相互獨立的信號成分,通過尋找線性變換,在上述優化判據最優的意義下,將觀測到的腦電信號分解為盡可能相互獨立的成分。在將觀察信號分解成相互獨立的分量以后,為了達到增強或提取誘發腦電信號的目的,把不相干的分量置零或對其中的某些分量幅值做適當的衰減,然后再用處理后的獨立分量重建原始信號。

3 小波變換法

如果信號x(t)∈L2(R),小波變換定義為信號x(t)和小波函數ψa,b(t)的卷積:

小波變換是同時具有時域和頻域的良好局部化性質的時頻分析方法。小波變換的主要優點在于它具有可變的時-頻分析窗口,對于低頻信號可用寬的窗口分析,對于高頻信號可用窄的窗口分析。這樣小波變換可以在所有頻率范圍內為信號分析提供最優的時-頻分辨率。而且,由于小波變換窗口范圍能夠自動地適應每個尺度的瞬時事件,因此它能夠精確地檢測到神經信號定事件產生的時間、瞬變程度及其頻率隨時間變化的情況,所以特別適合于分析腦電信號等非平穩信號[9,10]。

在誘發腦電信號處理方面,主要應用小波變換的多分辯率分析,當尺度a較大時小波視野寬而分析頻率低,可以觀察信號的概貌;當尺度a較小時小波視野窄而分析頻率高,可以觀察信號的細節。但不同a值下分析的品質因數(指中心頻率與帶寬的比值)卻保持不變。

如果把小波ψj,k對每一分辨率j所產生的L2子空間用Wj表示,當j∞時WjL2(R),包含整個平方可積的實函數空間。則空間L2可以分解成一系列的子空間Wj之和[9]:

L2=∑j∈ZWj(6)

定義子空間為:

Vj=Wj+1Wj+2…j∈Z(7)

子空間Vj是L2的多分辨率近似,它是由尺度函數φj,k經伸縮和平移產生的。對于子空間Vj會有一個與之相對應的正交子空間Wj:

Vj-1=VjWjj∈Z(8)

假設有一能量有限的離散信號x(n)a0(n),可依照下面的關系式連續對信號進行分解:

aj-1(n)=aj(n)dj(n)(9)

這里aj(n)∈Vj,它表示信號的概貌;而dj(n)∈Wj,它表示每一尺度(j=0,1,…,N)的細節。因此對每一分辨率N>0,信號的分解形式可表示為:

x(n)a0(n)=d1(n)+d2(n)+…+dN(n)+aN(n)(10)

因此每一分辨率分解把該級輸入信號分解成一個低頻的近似信號和高頻的細節信號。

誘發腦電是由刺激引起的觀測腦電信號中的變化,它與刺激作用存在鎖時關系。盡管誘發腦電淹沒在強背景噪聲中(含自發腦電及其他干擾信號),而且部分EEG和EP在頻率上重迭,但可根據它們時間位置的不同區別出來。如較常用著實驗的P300(事件相關電位的一種),它是在受刺激后約250~400 ms期間腦電產生的正向波峰,頻率范圍集中在2~8 Hz間,與自發腦電中的θ波(4~8 Hz)和δ(0~4 Hz)在頻率上有重疊。

利用小波變換的多分辨率分析后,把與P300有關頻帶的小波系數保留,然后從保留頻帶的小波系數中取出在250~400 ms之間的小波系數,用這些小波系數進行誘發腦電信號的重構,從而從強背景噪聲中提取出微較的誘發腦電信號。

4 時間序列分析法

由于在誘發腦電中,信號與噪聲頻譜重疊,一般的濾波方式很難將其分開。有些學者試圖通過時間序列分析方法,用AR或者ARMA模型對誘發腦電信號建立數學模型,再通過濾波等方法提取誘發響應信號。

1988年Sprechelsen[11]等的方案中,利用卡爾曼濾波對已知隨機信號建立模型,根據前一個估值和最近一個觀察數據估計信號的當前值,自動跟隨信號統計性質的非平穩性,從而提取出誘發響應信號。

李魯平[12]等還提出了帶外輸入的自回歸算法和附加信號處理方法兩種基于時間序列分析的方法;關力[13]的則提出了維納濾波在誘發腦電信號處理上的應用。

5 神經網絡法

Nishida[14]等1994年提出了用神經網絡方法自動提取P300的方案。1999年Fung KSM[15]等提出了一種自適應信號處理與神經網絡相結合的方法,文獻[16]對這種方法進行了總結。

神經網絡可以把專家知識結合進一個數學框架,并通過訓練對專家的經驗進行學習,而不需要任何對數據和噪聲的先驗統計假設;但它只能用于提取EP信號的特征,無法提取整個波形,因而丟失了部分重要的信息。

6 結 語

相干平均在實現上較為容易,但相干平均后只反映多次平均的結果,不能反映誘發腦電的逐次變化,而隨著實驗次數的增多,會使得受試者疲勞或不適,影響實驗結果。獨立分量分析和小波變換能從單次(或少次)刺激中提取出誘發腦電,但ICA后的各獨立分量所對應的物理意義有待進一步研究;如何在減少檢測通道數的同時,能有效地分離出各獨立分量也是ICA在誘發腦電提取方面有待研究的方向。SVM能很好地區分觀測信號中是否存在誘發腦電,但它只能提取特征,不能提取信號,因而丟失了部分信息。如何能有效地在單次(或少次)刺激中提取誘發腦電是這方面研究的發展方向。

參考文獻

[1]胡廣書.數字信號處理――理論算法實現[M].北京:清華大學出版社,1996.

[2]楊福生,高上凱.生物醫學信號處理(二)[M].北京:高等教育出版社,1995.

[3]Bayliss J D.A Flexible Brain-computer puter Science Dept.,Univ.of Rochester,Rochester,NY,2001.

[4]Jung T P,Humphries C,Lee T W,et al.Removing Electroencephalographic Artifacts by Blind Source Separation [J].Psychophysiol,2000,37:163-178.

[5]Jung T P,Makeig S,Westerfield,et al.Analysis and Visuali-zation of Single-trial Event-related Potentials[J].Human Brian Mapping,2001,14(2):166-185.

[6]Jung T-P,Humphries C,Lee T-W,et al.Removing Electroencephalographic Artifacts:Comparison between ICA and PCA.Neural Networks Signal Processing,1998:63-72.

[7]Hyvarinen A,Oja E.Independent Component Analysis:Algorithms and Applications [J].Neural Network,2000,13:411-430.

[8]楊福生,洪波.獨立分量分析的原理與應用[M].北京:清華大學出版社,2006.

[9]Quiroga R Quian.Obtaining Single Stimulus Evoked Potentials with Wavelet Denoising.Physica,2000,145(3):278-292.

[10]R.Quian Quiroga,Sakowitz O W,Basar E.Wavelet Transform in the Analysis of the Frequency Composition of Evoked Potentials.Brain Research Protocols,2001,8:16-24.

[11]Spreckelsen M V.Estimation of Single Evoked Cerebral Potentials by Means of Parametric Modeling and Kalman Filtering.IEEE Trans.BME,1988,35(9):691-700.

[12]李魯平,吳延軍,程敬之.誘發腦電動態提取方法研究[J].國外醫學生物醫學工程分冊,1995(18):195-201.

[13]關力.誘發電位檢測技術的進展[J].國外醫學生物醫學工程分冊,1995(18):125-129.

[14]Nishida S,Nakamura M,Suwazono S,et al.Automatic Detection Method of P300 Waveform in the Single Sweep Records by Using a Neural Network[J].Med.Eng.Phys.,1994,14: 425-429.

[15]Fung K S M,Chan F H Y,Lam F L,et al.A Tracing Evoked Potential Estimator[J].Signal Processing,1994,36:287-314.

[16]朱常芳,胡廣書.誘發電位快速提取算法的新進展[J].國外醫學生物醫學工程分冊,2000(23):211-216.

作者簡介

黃日輝 男,1982年出生,廣東臺山人,五邑大學在讀碩士研究生。研究方向為腦電信號處理。

卷積神經網絡意義范文5

關鍵詞: 數字信號處理課程 教學改革 優化知識結構 加強實驗教學 綜合化教學模式

數字信號處理所涉及的內容非常繁多、廣泛。其所應用的數學工具涉及微積分、隨機過程、數值分析、復變函數和各種變換等;其理論基礎包括網絡理論、信號與系統、神經網絡等;其應用領域包括通信、雷達、人工智能、模式識別、航空航天、圖像處理、語音處理等。在GSM手機中應用數字信號處理技術可將語音壓縮至13kps;在語音信箱、留言電話方面也均可以采用數字信號處理技術。

學生在學習數字信號處理課程時,常常會覺得枯燥乏味,不僅覺得概念抽象,而且對其中的分析方法與基本理論不能很好地理解與掌握。為了有利于學生系統地理解和掌握課程中的基本內容,充分鍛煉實驗的應用能力,我對數字信號處理課程的教學進行了針對性的改革與探討。

1.優化知識結構

數字信號處理課程中知識點比較多,數學推導十分復雜。我通過對本門課程進行深入研究,類比各知識點,發現有一條線路貫穿于課程之中,只要在課程教學中把握好這條線路,復雜的數學推導將會變得清晰,容易識記。我將該課程優化成兩大模塊:變換域的知識結構和數字濾波器的知識結構。

1.1變換域的知識結構

變換域的知識結構是該課程的第一大模塊結構。先引入時域離散信號與系統,通過時域采樣定理對模擬信號進行采樣得到離散時間信號(序列)內容進行展開討論,對于幾種典型序列和時域離散系統性質:線性、時不變、因果性和穩定性進行重點介紹。其次講述DTFT、DFS、ZT(IZT)、DFT變換的定義、性質和定理。其中每個變換都遵循嚴密的數學推理,都圍繞著變換的定義、性質和定理展開內容講解。在教學過程中除了詳細講解各個知識點之外,還要建立之間的聯系,歸納出變換之間的聯系如圖1所示。在建立聯系時不僅要從數學公式上進行變換證明,而且要用物理意義進行直觀的講解,使學生能夠完全掌握。例如DTFT是單位圓上的Z變換,DFT是DTFT的等間隔采樣,等等。

1.2數字濾波器的知識結構

數字濾波器的知識結構是該課程的第二大模塊結構,其主要圍繞數字濾波器網絡結構及其設計方法展開討論。數字濾波器的網絡結構分為:IIR網絡結構和FIR網絡結構。通過狀態變量分析法對網絡結構進行分析,確定狀態變量,求出狀態方程和輸出方程。應用脈沖響應不變法和雙線性變換法設計低通、帶通IIR數字濾波器,分析理解兩種具體方法的特點和區別,與分別設計的數字濾波器的頻域特性。窗函數法和頻率采樣法是設計FIR濾波器基本方法,通過實驗使學生熟悉線性相位FIR濾波器的幅頻特性和相頻特性,了解不同窗函數對濾波器性能的影響。數字濾波器的設計和網絡結構分析如圖2所示。

2.加強實驗教學

數字信號處理課程中的理論和結論大都是經過數學推導得來的,比較抽象,也較難理解。MATLAB語言對諸如離散線性卷積、循環卷積、抽樣定理、對Z變換進行等間隔采樣實現DFT、數字濾波器設計等一系列問題都可通過圖形建模使之可視化。實驗教學平臺可以選擇MATLAB軟件平臺和DSP硬件平臺,MATLAB軟件平臺主要用來演示數字信號處理的概念、性質和原理。例如序列的傅立葉變換、Z變換、離散傅立葉變換的概念和性質等;硬件平臺主要實現數字信號處理的算法,例如卷積、FFT算法、FIR濾波器和IIR濾波器設計方法等。

2.1基于MATLAB基礎理論實驗

數字信號處理課程具有理論性強和應用性強等特點,在教學中教師要加強理論教學。實驗教學的設計可以更好地讓學生理解理論教學內容,具有啟發性,能培養學生的思考能力和科研能力。

針對理論知識點的內容,可將實驗各部分的內容劃為:系統響應及系統穩定性;時域采樣與頻域采樣;用FFT對信號作頻譜分析;IIR數字濾波器設計及軟件實現;FIR數字濾波器設計與軟件實現。對于所涉及的實驗教學內容,要突出強調對實驗結果的“物理意義”的理解,使知識點覆蓋基本完整且重點突出。

2.2綜合性課程設計

在基礎理論實驗的基礎上,為了充分調動學生主動學習的積極性,提高學生鉆研科學的興趣,綜合性課程設計是非常有必要的。其可以充分發揮學生的主觀能動性,更有利于培養他們獨立思考、善于創造、綜合運用知識的能力。

根據數字信號處理在雙音多頻撥號系統中的實際應用,我進行了綜合性、設計性實驗的探討。雙音多頻(Dual Tone Multi Frequency,DTMF)信號是音頻電話中的撥號信號。DTMF信號系統是一個典型的小型信號處理系統,它用數字方法產生模擬信號并進行傳輸,其中還用到了D/A變換器;在接收端用A/D變換器將其轉換成數字信號,并進行數字信號處理與識別。

3.綜合化教學模式

由于數字信號處理的DTFT、DFS、ZT(IZT)、DFT變換的定義、性質和定理和數字濾波器設計的內容涉及的公式繁多、概念抽象,在學習過程中,學生對其都具有犯難情緒,因而在授課中需要采用形象化教學方法、多樣化教學手段、創造自主化學習情境,提高學生的學習興趣,幫助學生理解公式的物理意義,便于對知識的識記和應用。

3.1形象化教學方法

數字信號處理課程中大量的抽象概念都是用繁瑣的公式來描述,其推導過程也相當復雜。在實際的教學中,教師需要采用課程板書的形式,讓學生跟上你的思路一步一步去解析公式,完全細化每一個變換的來源。而不是急于把最新的知識、最新的技術一股腦地塞給學生。教師在教學中,必須從公式所代表的具體意義去理解公式,注重物理意義的表達,也要相信學生在打好基礎后,能舉一反三,學一知十,例如:X(k)=X(e)|k=0,1,…,N-1,說明X(k)為x(n)的傅里葉變換X(e)在區間[0,2π]上的N點等間隔采樣。在講解相關抽象化的知識點時,教師可采用繪制波形圖或框圖的方法將抽象概念形象化,用直觀圖形進行解讀公式的意義。在教學中,教師可采取合理應用形象化的方法,培養學生看到公式可以聯想到公式的物理意義,突破公式難懂難記的問題。

3.2多樣化教學手段

在習題課和一些基本原理、基本方法的推導和證明中,教師要采用課堂板書形式,解答思路清晰,在板書的過程中,也要留給學生足夠的時間進行領會。

對于難以理解的抽象概念,需要用形象化的圖形來進行解析,采用多媒體教學手段,可以節約大量的板書時間,可以化抽象為形象,化枯燥為生動,增加課堂信息量,使學生把重點放到加深對抽象概念的理解上。同時,PPT要有一定的吸引力,比如適當地粘貼一些圖片性內容,遠比文字要形象和生動,還可以粘貼一些調節氣氛的有意思圖片,但不可太花哨,速度要放慢,講一行放一行,切不可地所有的一次都放出來,否則容易誤導學生去費勁地閱讀PPT上的文字。多媒體教學手段與傳統的板書教學相融合,不但可以發揮多媒體手段信息量大、形象、直觀等優勢,而且板書可以對多媒體的推導細節進行補充,放慢上課節奏,使教學邏輯更嚴密、交互性更強,其實際效果比單獨使用其中的一種都要好。

3.3自主化學習情境

在實際教學中,教師要站在學生的立場上,找到學習入門的最好切入點:結合課堂提問、作業布置、習題講解等手段,使學生達到基本的教學要求。適當地提問,可以檢驗學生學得怎么樣,將學生的狀況及時的反饋給老師,老師再適當地在教學中作調整,將取得很好的教學效果,同時也可加強與學生的雙向交流,活躍課堂氣氛。

由于該門課程比較抽象,公式又相對繁瑣,單靠課堂講解學生當時可能聽得明白,但是課后若不加以鞏固,掌握情況也不會太理想,因此每次課后要給學生布置適量的作業,通過批改作業來發現存在的問題并及時解決。

3.4完善化考試模式

本門課程的成績考核采取傳統模式,即由平時表現成績、期末筆試成績按比例綜合計算。這樣的考核方式簡單易于操作,這也是一些學生不重視實驗、不注重如何應用所學知識解決實際問題的原因之一,結果造成理論聯系實際和解決實際問題的能力差。

完善化考試模式,增加上機考試,要求MATLAB上機考試,這能極大地強化學生的自主學習能力及動手實踐能力。

4.結語

我針對數字信號處理課程的特點,應用知識的連貫性,建立了各個知識點之間的聯系,便于學生理解與聯想記憶。MATLAB的引入為數字信號處理教學提供了全新的方法,激發了學生的學習興趣,變被動學習為主動探索,加強了理論與實踐相結合,提高了綜合運用知識及解決實際問題的能力。采用了傳統板書和多媒體教學相結合的手段,提高了學生的學習興趣,做到了用中學、學中用,使學生大大增強了學習的興趣。

參考文獻:

[1]高西全,丁玉美.數字信號處理[M].陜西:西安電子科技大學出版社,2008.

[2]A?V?奧本海姆,R?W?謝弗.離散時間信號處理[M].西安:西安交通大學出版社,2001.

[3]姜恩華.數字信號處理課程“教與學”探索[J].淮北煤炭師范學院學報,2009,30,(3):78-81.

[4]王祥春.“數字信號處理”教學方法探討[J].科技創新導報,2010,16:248.

卷積神經網絡意義范文6

關鍵詞:拉格朗日力學; 圖像預測; 圖像追蹤; 天氣雷達; 臨近預報

DOIDOI:10.11907/rjdk.162240

中圖分類號:TP317.4

文獻標識碼:A文章編號:1672-7800(2016)012-0001-04

0 引言

多普勒天氣雷達(以下簡稱雷達)是現代氣象業務研究及應用中不可或缺的重要工具,基于雷達回波及圖像的追蹤與外推是短時臨近預報的關鍵性技術,也是長期以來的難點問題。準確而及時的雷達外推預報,可以為局地龍卷風、雷暴、短時強降水等極端災害性天氣提供預警,以便做好防御措施,最大限度保障人民及生命財產安全。

近半個世紀以來,很多學者在基于雷達資料的預報領域作出了大量卓有成效的貢獻,并逐步形成了一系列較為通行的方法。例如,TREC算法通過逐區域尋求相鄰時刻雷達反射率的最大相關,跟蹤整個回波區域的移動,并且假設回波具有一致的移動方向[1]。CTREC算法則利用交叉相關分析,跟蹤反射率因子大于一定閾值區域的移動,進而推算回波的發展[2]。TITAN是由美國國家大氣研究中心(NCAR) 研發的一套風暴識別、跟蹤、分析和預報系統,其利用雷達一次完整體掃所構成的三維結構數據對強回波中心進行識別追蹤[3-4]。SCIT算法則更加側重對雷暴單體的有效追蹤和預測[5-7]。近年來,又有一些學者試從圖形圖像學中的光流技術入手,通過分析雷達回波時序圖像中的光流場特征進行回波強度和位置的外推預測[8-11]。此外,還有基于神經網絡、模式匹配等多種方法[12-14]。

總體來說,這些方法的共同之處是需要分析相鄰時刻雷達圖像(或基數據)中區域的相似性,而該相似性的度量,如最大相關法,雖然可以計算出最匹配的位置,但匹配和外推結果往往表現出發散性或多個最優解。并且,基于窗口平移的模板匹配算法無法適應區域圖像的旋轉和變形等情況。

為了克服相關性度量算法所遇到的問題,本文考慮對位移場的分析加以分層,也就是每個特征運動被認為是確定在相對粗糙的空間分辨率下的平穩變化趨勢的總和,然后衍生為更高的空間分辨率下的小幅度局部修正,并對此過程進行多次迭代。對于位移場的分析,將充分考慮雷達回波所指示風暴的動力學特征,運用拉格朗日力學相關理論構建預測模型。該方法的研究意義在于進一步提高中小尺度、強對流天氣事件的預測能力,且相對于光流等一些大運算量算法,本方法運算規模更小,進而能夠更好地滿足短臨預報業務高時效性的要求。

1 理論與方法基礎

1.1 雷達回波外推預測

大量研究表明,合理的外推預測算法可以為降水、雷暴、冰雹等對流天氣的預報提供重要支撐[15-17]?;谕馔祁A報的一般性描述為:

其中,pt(x,y)表示任一位置的回波強度,U和V分別表示回波在水平和垂直方向上的偏移量,由U和V共同組成回波移動的速度矢量。g表示一個函數,用來計算單位時間間隔后回波強度的變化。根據式(1),Δpt(x,y)反映了任一點(x, y) 在t 時刻回波強度的變化情況,U和V反映了回波移動的方向和速度。此外,函數g代表一個拉格朗日動力學過程,在此過程中雷達回波的強度是由其沿回波路徑移動時在拉格朗日坐標系統中的歷史變化推導出的,也就是用當前回波演變的趨勢預測回波未來的位置和強度。究其趨勢預測的方法,多年來諸多學者作出很多研究,本文主要從拉格朗日力學角度進行分析,提出一種雷達回波圖像追蹤預測的方法。

1.2 拉格朗日力學

拉格朗日力學是由Joseph Lagrange[18-19]最早提出的一種力學分析方法。由于該方法引用了廣義坐標的概念,使得對力學相關問題的研究更具普適性。

在雷達回波圖像預測研究中,如何準確得到回波運動矢量是預測需要解決的關鍵問題。在不考慮天氣系統的非線性變化時,拉格朗日力學模型能夠滿足構建回波發展演變過程的算法要求,式(1) 可以改寫為:

有研究表明,對整個回波圖像采用統一的U和V所構成的位移矢量,可適用于對大尺度天氣系統的預測分析,如對衛星圖像的外推預測和云導風的分析[20]。但對于局地強對流天氣系統,預測結果往往與實際偏差較大。因此,這也是本文將重點闡述解決的問題。

2 雷達圖像追蹤預測

2.1 基于拉格朗日力學的追蹤算法

在上述理論基礎上,根據大氣運動演變發展的規律及其在雷達回波圖像上的表征特點,構建基于拉格朗日力學的追蹤算法模型,如式(3) 所示。

該模型假定所預測的回波圖像是當前和過去若干個回波圖像以固定時間間隔而變化的函數。f2表征一個用于估測單位時間間隔前后回波圖像各相應網格點回波強度值變化率的函數,即回波的演變趨勢。在不斷生消、發展的對流系統中,ΔP可以為正,也可以為負數。式(4)~式(6) 進一步表明了函數f1和f2,即回波移動矢量及回波強度的計算方法。

2.2 中心極值濾波

為了降低雷達雜波對位移矢量計算的不良影響,本節提出采用一種濾波器對雷達基數據進行濾波處理。其基本思想是:逐網格分析回波強度特征,如果某格點的值大于周邊最相鄰一圈(共8個網格)的最大值,或者該值小于周邊最相鄰一圈的最小值,則將當前網格點回波強度值用上述8個網格的最大值或最小值替代。

如圖1所示,位于當前中心點的數值39大于其最鄰近一圈8個網格的最大值。因此,使用數值23替換當前網格的39。

從圖像上看,該濾波方法可顯著降低圖像中的椒鹽噪聲,從實際效果上看,該方法可以有效過濾單點的雜波奇異值,較傳統的均值濾波和中值濾波更好地保留了回波細節[21-22],特別是回波中梯度變化較大的邊緣區域。

2.3 分層外推預測算法

由于天氣系統復雜多變,特別是尺度較小的局地強對流,其生命周期短的只有幾分鐘到幾十分鐘,由于其空間尺度小,生消速度快,因此,包括基于拉格朗日力學在內的各種線性關系外推算法,其預測準確性都存在一定的局限性。為了改善這一問題,本節提出采用分層的外推預測方法。該思想最早由Bellerby等 [20]提出,并研究應用于衛星圖像的云頂平流場分析中。

該算法的關鍵流程為:先將當前雷達回波圖像逐級抽稀,降低圖像的分辨率,以模糊回波細節,由此粗略估算出回波主體的移動趨勢;然后再反向逐級提高圖像分辨率,在較粗的移動趨勢基礎上,細化和訂正位移矢量的細節。從而產生一個在空間上連續和平滑的且不受模板邊界不連續性影響的矢量場。計算方法如式(7)所示:

對于每一級抽稀計算,都是將當前一級各網格點的回波強度值經由公式(7)計算,并往復迭代。其中P表示某一點的回波強度,L和L-1代表抽稀的層級,在本文下述實驗中,采用的最高層級為4。

在計算兩個相鄰時刻圖像中回波的位移時,可以借鑒交叉相關法,計算方法如式(8),在每個選定的匹配窗口遍歷出最大相關矩陣的位置,從而輸出位移矢量。

式(8) 中,P和P’ 分別表示相鄰兩個時刻(如t-Δt與t)的回波,(x, y) 表示圖像中的某一點,X和Y表示匹配窗口的大小。再將兩幅回波圖像之間的網格還原或內插到其先前空間分辨率的兩倍,重復上述匹配。該迭代過程還考慮到了由非矩形網格代表的局部扭曲,結合這些局部扭曲,使外推預測算法能夠適應旋轉、擴展、縮小等回波圖像形態上的變化。如此插值和匹配計算,迭代直到網格分辨率達到原始雷達圖像分辨率。

3 實驗與結果分析

3.1 實驗數據說明

為檢驗所述方法的預測效果,本實驗數據使用2016年6月南京地區多普勒天氣雷達的基數據文件。該雷達使用VCP-21體掃模式,探測周期為6分鐘。實驗選用1.5°和2.4°仰角的基本折射率數值。為方便計算,實驗前將原始數據由極坐標系統轉換為平面直接坐標系統,數據的圖像分辨率為920×920。為減少樣本數量,從全部7199個基數據文件中篩選出以230庫長為半徑,其覆蓋區域內具有大面積強回波的數據文件,共計880個。

3.2 實驗結果分析

為檢驗雷達回波圖像預測的準確性,使用與預測同一時刻的雷達實際探測數據作比對分析,計算過程采用交叉相關檢驗法。

首先以自然日為單位,統計逐日樣本數據中每份預測結果與實況交叉檢驗的相關系數的平均值,如圖2所示。

圖2中3種圖案標記分別表示預測6分鐘、30分鐘和60分鐘的檢驗結果,每個值代表當日所有樣本檢驗結果的平均值。橫坐標為2016年6月的逐個日期,縱坐標為相關系數,其中橫坐標4、5、9、10等日期沒有標記圖案,原因是這些日期的當日為晴天或少云,體現在雷達上沒有強的大面積回波,因此沒有列入樣本數據進行分析。從圖2中還可以看出,本方法預測未來6分鐘的結果與實況相比,相關系數超過87%,平均達到93%以上,而隨著預測時效的延長,預測準確率逐步下降,在未來60分鐘的預測中,全月平均相關系數為70%左右。

進一步統計分析每次預測準確率的穩定性。以6月19日全天樣本數據為例,統計每批樣本所預測6、12、18至60分鐘結果分別與實況交叉相關檢驗的情況,如圖3所示。

圖3中,每個柱狀條的頂端和底端分別表示檢驗的相關系數的最大值和最小值,柱狀條中間的黑色方形表示相關系數的均值??梢钥闯觯S著預測時效的增長,其預測準確率的個體差異也隨之增大。在前6分鐘的預測中,該差異約為3%,30分鐘時約為8%,而到預測60分鐘時,差異進一步增大到20%。結果與強對流天氣系統具有生命史短、突發性強,水氣生消發展變化快的特點是相一致的。

4 結語

由于天氣系統復雜多變,特別是對于中小尺度的對流系統,其生消、發展時間短、變化快,如何進行準確、有效的預報是提升當今短時臨近預報的關鍵環節之一??紤]到大氣中水氣等物質的移動變化應遵循一般力學規律,而拉格朗日力學正是表征和計算動力學問題的普適性方法,因此,本文的預測動力模型建立在拉格朗日力學關系基礎之上。又由于天氣系統的變化表現在雷達圖像上,其回波圖形具有相當的不確定性,因此,本文提出采用分層的位移場分析方法,先假定位移矢量是在相對粗糙的空間分辨率下的平穩變化趨勢的總和,然后在更高空間分辨率下作小幅度局部修正,并如此進行多次迭代。為了減少低仰角雜波對實驗結果的影響,提出采用中心極值濾波對實驗數據進行處理。結合上述理論構建起基于拉格朗日力學的追蹤預測模型及算法流程,以雷達基本反射率因子作為輸入場,追蹤和預測回波在空間和時間上的位移矢量,并由此預測未來一段時間雷達回波的位置和強度。

實驗部分采用1個月樣本數據對本算法模型進行檢驗,通過預測結果與同時刻實況的比對分析,得出兩者的相關性和個例穩定性等評價指標。結果表明,該方法能夠較好地預測局地天氣系統的演變過程,在未來30分鐘的預測中準確率平均超過80%,且對于輔助預報未來60分鐘內的局地龍卷風、強降水、雷暴等災害性事件具有實踐應用的價值。

參考文獻:

[1] 劉紅艷,魏鳴.多普勒雷達風場資料在臨近預報中的應用[J].大氣科學學報,2015(4):483-491.

[2] 鄭永光,林隱靜,朱文劍,等.強對流天氣綜合監測業務系統建設[J].氣象,2013(2):234-240.

[3] 周康輝,鄭永光,藍渝.基于閃電數據的雷暴識別、追蹤與外推方法[J].應用氣象學報,2016,(2):173-181.

[4] DIXON M, WIENER G.TITAN:thunderstorm identification,tracking,analysis,and nowcasting―a radar-based methodology[J].Journal of Atmospheric & Oceanic Technology, 1993, 10(6):785-797.

[5] SHAH S, NOTARPIETRO R, BRANCA M.Storm identification,tracking and forecasting using high-resolution images of short-range X-band radar[J].Atmosphere, 2015, 6(5):579-606.

[6] 莊旭東,胡勝,陳榮,等.“雨燕”中風暴算法與新一代雷達SCIT產品的對比分析[J].熱帶氣象學報,2011(3):299-306.

[7] DUAN Y, XU Y, ZHI S.Application analysis of the hail suppression operation based on the improved SCIT Algorithm[J].Meteorology & Disaster Reduction Research, 2014(15):23-29.

[8] 曹春燕,陳元昭,劉東華,等.光流法及其在臨近預報中的應用[J].氣象學報,2015(3):471-480.

[9] GARCIA F, CERRI P, BROGGI A, et al.Data fusion for overtaking vehicle detection based on radar and optical flow[J].2012, 7(2272):494-499.

[10] 王興,王新,苗春生,等.基于GPU加速的雷暴追蹤外推方法研究[J].南京師范大學學報:工程技術版,2015(1):35-42.

[11] STAINVAS OLSHANSKY I, BILIK I, BIALER O.Doppler-Based Segmentation and Optical Flow in Radar Images: US20160084953[P].2016.

[12] 盛仲飆.BP神經網絡在數據預測中的應用[J].軟件導刊,2016(1):147-148.

[13] 王利卿,黃松杰.基于多尺度卷積神經網絡的圖像檢索算法[J].軟件導刊,2016(2):38-40.

[14] WANG X, GU Y H, MIAO C S, et al.Parallelization and performance optimization of radar extrapolation algorithm with OpenCL[J].Journal of Internet Technology, 2016(17):323-330.

[15] .雷達外推預報與暴雨數值模式融合預報降水方法研究[D].北京:中國氣象科學研究院,2013.

[16] 張蕾.多普勒雷達回波演變的動力學分析及臨近預報算法改進[D].南京:南京信息工程大學,2015.

[17] FOX N I, WEBB R, BALLY J, et al.The impact of advanced nowcasting systems on severe weather warning during the sydney 2000 forecast demonstration project:3 November 2000[J].Weather & Forecasting, 2004, 19(1):97-114.

[18] 李艷艷.相似空間中不變的歐拉-拉格朗日方程[J].河南大學學報:自然科學版,2014,03:273-276.

[19] ERICKSEN R E, GUITERAS J J, LARRIVEE J A, et al.A parachute recovery system dynamic analysis [J].Journal of Spacecraft & Rockets, 1967, 4(3):321-326.

[20] BELLERBY T J.High-resolution 2-D cloud-top advection from geostationary satellite imagery[J].IEEE Transactions on Geoscience & Remote Sensing, 2006, 44(12):3639-3648.

亚洲精品一二三区-久久