卷積神經網絡的優點范例6篇

前言:中文期刊網精心挑選了卷積神經網絡的優點范文供你參考和學習,希望我們的參考范文能激發你的文章創作靈感,歡迎閱讀。

卷積神經網絡的優點

卷積神經網絡的優點范文1

關鍵詞:卷積神經網絡 人體行為識別 Dropout

中圖分類號:TP391.41 文獻標識碼:A 文章編號:1672-3791(2017)04(c)-0028-02

該文采用隨機Dropout卷積神經網絡,筆者將此法的優點大致概況為將繁瑣雜亂的前期圖像處理簡易化,原來的圖像不可以直接輸入,現在的原始圖像即可實現直輸功能,因其特性得到廣泛研究與應用。另外,卷積神經網絡在圖像的處理中能夠將指定的姿勢、陽光的照射反應、遮避、平面移動、縮小與放大等其他形式的扭曲達到魯棒性,從而達到良好的容錯能力,進而可以發現其在自適應能力方面也非常強大。因為卷積神經網絡在之前建立網絡模型時,樣本庫為訓練階段提供的樣本,數量有限,品質上也很難滿足要求,致使網絡權值參數不能夠完成實時有效的調度與整理。

1 卷積神經網絡

據調查卷積神經網絡由K.Fukushima在80年代提出,那時候它被稱為神經認知機,這一認知成為當時的第一個網絡,后來網絡算法發生了規模性變革,由LeCun為代表提出了第一個手寫數字識別模型,并成功投入到商業用途中。LeNet被業界冠以卷積神經網絡的代表模型,這類系統在很多方面都起到了不容小趨的作用,它多數應用于各類不同的識別圖像及處理中,在這些層面上取得了重要成果。

筆者經查閱資料發現卷積神經網絡其實是由兩個種類組合而來,它們分別是特征提取、分類器,這種組成我們可以看到特征提取類可由一定數量的卷積層以及子采樣層相互重疊組合而成,全部都連接起來的1層或者2層神經網絡,就是由分類器來進行安排的。卷積神經網絡中的局部區域得到的感覺、權值的參數及子采樣等可以說是重要網絡結構特征。

1.1 基本CNN網絡結構

圖1中就是最為經典的LeNet-5網絡模型結構圖。通過圖1中我們可以獲悉,該模型有輸入輸出層,除這兩層外還有6層,其征提取可在前4層中體現,后兩層體現的是分類器。

在特征提取部分,6個卷積核通過卷積,是圖像經尺寸為32×32的輸入而得見表1,運算過程如式(1):

(1)

式中:卷積后的圖像與一個偏置組合起來,使函數得到激活,因此特征圖變誕生了,通過輸出得到了6個尺寸的特征圖,這6個尺寸均為28×28,近而得到了第一層的卷積,以下筆者把它簡要稱為c1;那么c1層中的6個同尺寸圖再經由下面的子采樣2×2尺寸,再演變成特征圖,數量還是6個,尺寸卻變成了14×14,具體運算如公式(2):

通過表2我們可以使xi生成的和與采樣系數0.25相乘,那么采樣層的生成也就是由加上了一個偏置,從而使函數被激活形成了采樣層的第1個層次,以下我們簡要稱為s1;這種過程我們可反復運用,從而呈現出卷積層中的第2層,可以簡要稱之為c2,第2層簡稱s2;到目前為止,我們對特征的提取告一段落。

神經網絡的識別,我們可以看到它是由激活函數而形成的一個狀態,這一狀態是由每個單元的輸出而得;那么分類器在這里起到的作用是將卷積層全部連接起來,這種通過連接而使1層與上面1層所有特征圖進行了串連,簡要稱之為c5;因而2層得到了退變與簡化效應,從而使該神經網絡成為經典,簡要稱之為F6,向量及權值是由F6 輸送,然后由點積加上偏置得到結果的有效判定。

1.2 改進的隨機DropoutCNN網絡

1.2.1 基本Dropout方法

神經網絡泛化能力能夠得到提升,是基于Dropout方法的深入學習。固定關系中存在著節點的隱含,為使權值不再依附于這種關系,上述方法可隨機提取部分神經元,這一特性是通過利用Dropout在網絡訓練階段中隨機性而得,對于取值能夠有效的存儲及保護存留,這一特性在輸出設定方面一定要注重為0,這些被選擇的神經元隨然這次被抽中應用,但并不影響下次訓練的過程,并具還可以恢復之前保留的取值,那么每兩個神經元同時產生作用的規避,可以通過重復下次隨機選擇部分神經元的過程來解決;我們通過這種方法,使網絡結構在每次訓練階段中都能呈現不同變化,使一些受限制的特征,不再受到干擾,使其真正能展現自身的優點,在基于Dropout方法中,我們可以將一些神經元的一半設為0來進行輸出,隨機神經元的百分比可控制在50%,有效的避免了特征的過度相似與穩合。

1.2.2 隨機Dropout方法

Dropout方法就是隨機輸出為0的設定,它將一定比例神經元作為決定的因素,其定義網絡在構建模型時得到廣泛采用。神經元基于隨機Dropout的方法是該文的重要網絡輸出途徑,通過設定輸出為0,使其在網絡中得到變。圖2是隨機Dropout的加入神經元連接示意圖,其在圖中可知兩類神經元:一類是分類器的神經元,這一階段的神經元可分榱講悖渙硪煥嗌窬元是由輸出而形成的層次。模型在首次訓練的階段會使神經元隨機形成凍結狀態,這一狀態所占的百分比為40%、60%,我們還可以看到30%及50%的神經元可能在網絡隨機被凍結,那么這次凍結可以發生在模型第二次訓練,那么第三次神經元的凍結可從圖示中得出70%及40%,還可以通過變化用人工設置,其范圍值宜為35%~65%,那么網絡神經元連接次序的多樣化,也因此更為突出與精進,網絡模型的泛化能力也得到了跨越勢的提高。

2 實驗及結果分析

2.1 實驗方法

卷積神經網絡通過實驗,通過輸入層呈現一灰色圖像,該圖像尺寸被設定成28×28的PNG格式,這里我們以圖像框架圖得到雙線性差值,用來處理圖像及原視頻中的影像,將框架圖的卷積核設定為5×5的尺寸,子采樣系數控制值為0.25,采用SGD迭代200次,樣本數量50個進行設定,一次誤差反向傳播實現批量處理,進行權值調整。實驗采用交叉驗證留一法,前四層為特征提取層,C1-S1-C2-S2按順序排列,6-6-12-12個數是相應特征,通過下階段加入隨機Dropout,這階段為雙層也就是兩層,進行連接,連接層為全體,從而可知結果由分類得出,又從輸出層輸出。

2.2 實驗結果分析

識別錯誤率可通過卷積神經網絡模型,及訓練過程與檢測過程中可查看到的。在訓練階段中,我們可以將Dropout的網絡中融入200次訓練,在將沒有使用該方法的網絡進行相互比較分析,我可以得知,后者訓練時的識別錯誤率稍高于前者,前者與后的相比較所得的差異不是很大,進而我們可知使用Dropout方法,對卷積神經網絡在泛化能力上得到有效的提升,從而有效的防止擬合。

3 結語

筆者基于Dropout卷積神經網絡,人體行為識別在視頻中進行, 通過Weizmann數據集檢測實驗結果,隨機Dropout在分類器中加入。通過實驗可以得知:隨機Dropout的加入,使卷積神經構建了完美網絡模型,并且使其在人體行為識別中的效率贏得了大幅度的提升,近而使泛化能力可以通過此類方法得到提高,可以防止擬合。

參考文獻

[1] 其它計算機理論與技術[J].電子科技文摘,2002(6).

卷積神經網絡的優點范文2

【關鍵詞】人工智能 圖像識別 深度學習

1 概述

圖像識別技術是人工智能研究的一個重要分支,其是以圖像為基礎,利用計算機對圖像進行處理、分析和理解,以識別不同模式的對象的技術。目前圖像識別技術的應用十分廣泛,在安全領域,有人臉識別,指紋識別等;在軍事領域,有地形勘察,飛行物識別等;在交通領域,有交通標志識別、車牌號識別等。圖像識別技術的研究是更高級的圖像理解、機器人、無人駕駛等技術的重要基礎。

傳統圖像識別技術主要由圖像處理、特征提取、分類器設計等步驟構成。通過專家設計、提取出圖像特征,對圖像M行識別、分類。近年來深度學習的發展,大大提高了圖像識別的準確率。深度學習從大量數據中學習知識(特征),自動完成特征提取與分類任務。但是目前的深度學習技術過于依賴大數據,只有在擁有大量標記訓練樣本的情況下才能夠取得較好的識別效果。本文認為研究如何在標記數據有限的情況下繼續利用深度學習完成物體識別任務具有重要意義。這也是未來人工智能研究的重要方向之一。

2 傳統圖像識別技術

傳統的圖像識別技術包括:圖像獲取、預處理、特征提取、分類。在圖像輸入后,需要先對圖像進行預處理。一幅標準灰度圖像,如果每個像素的像素值用一個字節表示,灰度值級數就等于256級,每個像素可以是0~255之間的任何一個整數值。一幅沒有經過壓縮處理的640×480分辨率的灰度圖像就需要占據300KB的存儲空間。通常我們需要將圖片的亮度及對比度調整合適,才能使圖片更加清晰、便于觀察。

許多采集到的圖片帶有或多或少的噪聲,需要對圖片的噪聲進行消除。對圖片噪聲的消除可以使用不同的去噪方法,如中值濾波、算數平均濾波、平滑線性濾波和高斯濾波等。不同濾波器分別適用于不同情況的噪聲。如椒鹽噪聲便適合使用中值濾波器,高斯噪聲便適合使用平滑線性濾波和高斯濾波。有時候,我們需要對圖像細化處理(如指紋細化,字符細化等),以便獲取主要信息,減少無關信息。細化操作,可以得到由單像素點組成的圖像輪廓,便于后續特征提取操作。

基本的圖像特征提取包括邊緣、角點等提取。一般使用不同的特征提取算子結合相應的閾值得到這些關鍵點。另一類在頻域中進行特征提取的方法主要是通過傅里葉變換,將圖像基于頻率分為不同的部分,從而可以在頻譜中反映出原始圖像的灰度級變化,便可得到圖像的輪廓、邊緣。

在完成圖像的預處理和特征提取之后,我們便能夠對圖像進行識別、分類。常用的分類器有K-近鄰(KNN),支持向量機(SVM),人工神經網絡(ANN)等等。K-近鄰算法原理是,當一個樣本的k個最相鄰的樣本中大部分屬于某一類別時,該樣本也應當屬于同一類別。支持向量機是通過尋找支持向量,在特征空間確定最優分類超平面,將兩類樣本分開。人工神經網絡模仿生物大腦中的神經網絡結構,通過誤差反向傳播不斷優化參數,從而得到較好的分類效果。

3 基于深度學習的圖像識別技術

一般認為深度學習技術是由Hinton及其學生于2006年提出的,其屬于人工神經網絡分支。深度神經網絡模仿人腦的神經機制來分析樣本,并盡可能地對樣本的特征進行更深度的學習。以圖片為例,利用深度學習技術對樣本的特征進行學習時,由低層特征到高層特征越來越抽象,越來越能表達語義概念。當樣本輸入后,首先對圖像進行卷積與下采樣操作,卷積和下采樣操作是為了進行特征提取和選擇。以原始像素作為輸入,深度學習技術可以自動學習得到較好的特征提取器(卷積參數)。深度學習的訓練過程,首先將當前層的輸出作為下一層的輸入,進行逐層分析,使得每一層的輸入與輸出差別盡可能小。其后,再聯合優化,即同時優化所有層,目標是分類誤差最小化。

傳統的深度神經網絡往往網絡中的節點數太過龐大,難以訓練。人們構造出卷積神經網絡,以權值共享的方式減少了節點數量,從而能夠加深學習的深度,使系統能學習到更抽象、更深層的特征,從而提高識別正確率。目前較成功的深度學習網絡結構有AlexNet、GoogLeNet、ResNet等。

與傳統識別技術相比,深度學習技術具有以下優勢:

(1)無需人工設計特征,系統可以自行學習歸納出特征。

(2)識別準確度高,深度學習在圖像識別方面的錯誤率已經低于人類平均水平,在可預見的將來,計算機將大量代替人力進行與圖像識別技術有關的活動。

(3)使用簡單,易于工業化,深度學習由于不需要領域的專家知識,能夠快速實現并商業化,國內較知名的深度學習創業公司有專注人臉識別的Face++、研究無人車的馭勢科技等。

4 存在問題與未來展望

雖然深度學習具備諸多優點,但目前來看深度學習仍有許多不足之處。首先,由于深度學習模型為非凸函數,對其的理論研究十分困難,缺乏理論保證。在對數據進行調整時,仍是簡單的“試錯”,缺少理論支撐。

同時,由于深度學習過于依賴數據量和計算資源。對一個新概念的學習,往往需要數百個甚至更多有標記的樣本。當遇到有標記的樣本難以獲取或者代價太大時,深度學習就無法取得好的學習效果。并且深度學習需要十分昂貴的高性能GPU,這使得深度學習難以平民化。目前深度學習訓練速度較慢,往往需要幾天甚至一個月。其模型擴展性差,缺少“舉一反三”的能力,樣本稍加變化,系統性能便會迅速下降。目前的深度學習屬于靜態過程,與環境缺乏交互。

對其的解決方案目前主要有兩點:

(1)針對于模型擴展性差的問題,通過引入遷移學習,研究不同任務或數據之間的知識遷移,提高模型的擴展能力、學習速度,同時降低學習成本,便于冷啟動。

(2)與強化學習結合,研究在動態環境下進行深度學習,提高深度學習與環境交互的能力。

參考文獻

[1]蔣樹強,閔巍慶,王樹徽.面向智能交互的圖像識別技術綜述與展望[J].計算機研究與發展,2016:113-122.

[2]張翠平,蘇光大.人臉識別技術綜述[J].中國圖象圖形學報,2000:885-894.

[3]梅園,趙波,朱之丹.基于直線曲線混合Gabor濾波器的指紋增強算法[J].計算機科學,2016.

[4]孫志軍,薛磊,許陽明,王正.深度學習研究綜述[J].計算機應用研究,2012:2806-2810.

[5]莊福振,羅平,何清,史忠植.遷移學習研究進展[J].軟件學報,2015:26-39.

[6]高陽,陳世福,陸鑫.強化學習研究綜述[J].自動化學報,2004:86-100.

卷積神經網絡的優點范文3

關鍵詞:視覺注視;移動端;數據集;行為推測

中圖分類號:TP391 文獻標識碼:A 文章編號:1009-3044(2017)01-0254-03

Abstract: With the development of computer vision application technology, the behavior prediction of eye gaze has been widely concerned by many scholars at home and abroad, and also has important research significance in the field of biological information recognition. In the era of smart phone tablet popularity to improve human-computer interaction and accurate prediction of the mobile side of the user gaze behavior becomes particularly important. Based on the existing research on visual technology, this paper proposes a scheme to solve the gaze behavior of mobile users by using large data combined with machine learning and convolution neural network knowledge, and analyzes the importance of large-scale data sets in visual application.

Key words: visual gaze; mobile end; data set; behavior conjecture

1 概述

伴S著計算機軟硬件性能和互聯網技術的迅猛發展,大規模的并行計算技術突飛猛進,不斷地發展使各種現有技術變得越來越成熟,同時機器學習和計算機視覺領域也都得到了飛速發展。視覺技術的發展變得越來越重要,并且可以應用到實際生活中的很多方面。人類大量的視覺信息現在可以利用計算機來輔助處理,并完成相關的一些工作。相對于生物信息識別技術這一計算機視覺領域的熱點技術來說,也已廣泛應用于日常生活中[1]。比如指紋識別器,人臉考勤器等平時在許多地方可以經常見到,還有居民家用的攝像頭智能報警系統以及近期炒得火熱的運用支付寶進行刷臉而完成的支付技術等,這些都是運用了生物信息識別技術?,F實中的種種跡象已經表明運用生物信息識別的計算機技術已漸漸的滲透到人們的日常生活中并成為不可或缺的組成部分。時下發展較快也比較常見的生物特征有視網膜、指紋、人臉和人眼等。這些生物信息比如人臉具有個體差異性和自身穩定性特點,從用戶的角度來看該特征具有便攜和低侵入等一些優點。而人眼作為人臉中最顯著的特征,又是人們獲取外界信息最直接最方便的途徑。都說眼是心靈的窗戶,因為眼睛中蘊含著表情、意圖等多種信息。因此,眼睛注視的行為預測受到了國內外眾多學者的廣泛關注,同時在生物信息識別領域中也具有重要的研究意義[2]。

2 注視預測問題

2.1 問題的背景

在心理、認知和用戶交互研究中的注視跟蹤最近已朝向移動解決方案發展,因為它們使得可以直接評估用戶在自然環境中的視覺注意。 除了注意,注視還可以提供關于用戶的動作和意圖的信息:用戶正在做什么以及接下來將做什么。然而,在自然狀態下非結構化的任務中注視行為是相當復雜的,并且不能使用在受控的實驗室環境中創建的模型來得到令人滿意的解釋。自然條件下和實驗室環境有著很大的不同。為了演化在自然環境中對注視行為的推斷,需要一種更加整體的方法,將從認知科學到機器學習的許多學科結合在一起[3]。

從人機交互技術到醫學診斷到心理學研究再到計算機視覺,眼睛注視跟蹤在許多領域都有應用。注視是外部可觀察的人類視覺注意的指標,許多人試圖記錄它。對于眼睛視線方面的研究可以追溯到十八世紀后期。而現如今已經存在各種解決方案(其中許多是商業化的),但是所有的解決方案都具有以下一個或多個方面的問題:高成本(例如,Tobii X2-60),定制或侵入性硬件(例如,Eye Tribe,Tobii EyeX)。然而在現實中的自然條件下,這些因素對實際的應用會造成一些障礙影響,使得眼睛注視跟蹤不能成為任何具有合理的相機(例如,智能手機或網絡攝像頭)的人應該可以使用的普及技術。如何才能使得這種技術普及并且得到應用,提出了一種解決方案。

2.2問題的提出

研究中首先要解決的就是用戶的約束問題,也就是自然條件下使用過程中所受到的各種限制問題。到目前為止,基于注視數據推斷用戶動作的研究受到許多的限制,特別是在自然環境中。限制因素可能包括可用的商業解決方案的昂貴性,其專有性和封閉性以及缺乏實時交互能力等方面。目前的注視跟蹤系統,只是盡量在移動設置中設置各種條件進行補救。商業化定制化的解決方案都有其獨自的閉合性質,因此阻礙了注視跟蹤算法的發展,并且使得不同方法之間的客觀比較變得不可能[4]。此外,注視是一種復雜的現象,涉及認知過程的相互作用。這些過程在設置計算上的建模是非常困難的,尤其是涉及一些未知因素,使得構建實驗設置成為一個很大的挑戰。此外,來自跟蹤實驗的數據因為其商業化的原因很少共享,即使共享數據很大部分也是有其獨立的實驗條件。這些方面的問題都阻礙了跨學科方法在分析和利用注視數據和實驗的相關研究與發展。

2.3 解決問題的研究方向

對基于注視的推斷的個體貢獻通常保持孤立,不能形成更大的整體以促進對注視動作行為的研究。隨著這方面的技術發展和應用,最近出現了一些開源的解決方案。雖然在不同的應用和用戶界面中使用注視已經相當有限,但是移動注視跟蹤的新穎應用開始出現并得到了很快的發展。然而使用移動注視跟蹤來推斷用戶動作的問題是高度多學科的,需要深入理解各個研究領域,包括人眼的功能,數學建模,計算機視覺,機器學習,信息技術,認知過程,用戶交互以及心理學。任何一個研究員或甚至任何研究小組都不可能擁有所有研究領域的專家,因此需要相互的協作共同推進技術的發展[5]。

目前的研究主要是從以下幾個方面進行:

1)研究移動注視跟蹤的認知方面,例如增強對任務中的注視行為的理解或識別不同任務的特征和階段;

2)開發用于從注視數據推斷用戶動作的計算方法,諸如應用機器學習用于行為推斷,優選地實時地;

3)增強用于改善移動注視跟蹤方法和性能的技術軟件/硬件解決方案,并使得設備更容易訪問;

4)發現注視數據在自然環境和虛擬和增強現實應用中的潛在用途,以及定義任務,其中注視可以是用戶動作的有用的預測器。

3 解決方案

首先選擇移動端進行研究,因為目前比較普遍的移動設備比如智能手機、平板電腦都有自己可靠的工作系統,且不需要外部附件。移動設備相對于其他平臺具有以下優勢:

1)使用的廣泛性。據估計,到2019年,世界上超過三分之一的人口擁有智能手機,遠遠超過臺式機/筆記本電腦用戶;

2)軟硬件技術升級的采用率較高。大部分的移動設備具有允許使用擁有計算復雜數據方法的實時的最新軟硬件;

3)移動設備上相機的大量使用已經導致相機技術的快速開發和部署;

4)相機相對于屏幕的固定位置減少了未知參數的數量,潛在地允許開發高精度的校準跟蹤應用。

3.1 注視類型分析

注視估計方法可以分為基于模型或基于外觀[6]?;谀P偷姆椒ㄊ褂醚劬Φ膸缀文P?,并且可以被細分為基于角膜反射和基于形狀的方法。另一方面,基于形狀的方法從觀察到的眼睛形狀觀察注視方向。這些方法傾向于具有低的圖像質量和可變的照明條件。基于外觀的方法直接使用眼睛作為輸入,并可能在低分辨率圖像上工作。相比基于模型的方法,基于外觀的方法被認為需要更大量的用戶特定的訓練數據。通過使用深度學習和大規模數據不必依賴于視覺,以實現準確的無校準注視估計。這種方案提出建立一個基于外觀的數據模型,而不使用任何手工設計的功能,例如頭部姿勢或眼球中心位置。

3.2 技術方案

深度學習的最近成功在計算機視覺的各種領域中是顯而易見的,但是它對改善眼睛跟蹤性能的影響還是相當有限。因為深度學習是需要大量的數據作為支持,而視線追蹤這方面的數據集還比較少,普通的研究所得到的稻菁比較有限,最大的數據集通常只是具有50個受試者左右,由于缺乏大規模數據的可用性,因此發展比較緩慢。因而提出了使用深度學習進行研究的一套方案,就是構造大規模的數據集。利用網絡資源構造一個大規模的基于移動的眼動跟蹤數據集,它包含來自各種背景的大量的受試者,在可變照明條件和不受限制的頭部運動下記錄[7]。運用現有的智能算法得到一個可以進行卷積神經網絡學習端到端的注視預測的后臺決策網絡。不依賴任何預先存在的系統,不需要頭部姿態估計或其他手動設計的特征用于預測。使用只有雙眼和臉部的特征訓練網絡,在這個領域的性能優于現有的眼睛跟蹤方法。雖然現在的決策網絡在精度方面實現了很先進的性能,但是數據輸入的大小和參數的數量使得難以在移動設備上實時使用。 為了解決這個問題,需要培養學習得到一個更小更快的網絡,在移動設備上實現實時性能,使得精度損失進一步降低。

3.3 大規模數據集

為了達到這一方案的預測效果,首先要進行的是數據集的建立。網絡上相關的研究中有許多公開的注視數據集[8]??偨Y對比這些相關的數據集,分析出有些早期的數據集不包含顯著性的頭部姿勢變化或具有粗略的注視點采樣密度。需要對這些數據進行篩選,使得到的數據具有隨機分布特點。雖然一些現代數據集遵循類似的方法,但它們的規模(尤其是參與者的數量)相當有限。大多數現有的眼動追蹤數據集已經由邀請實驗室參與者的研究人員收集,這一過程導致數據缺乏變化,并且成本高且效率不高。因此需要大量的進行數據收集和篩選分析。大規模數據可以通過卷積神經網絡有效地識別人臉(他們的眼睛)上的細粒度差異,從而做出準確的預測。

收集眼動跟蹤數據應該注意的方面:

1)可擴展性。數據應該是自然條件下的使得用戶具有靈活性;

2)可靠性。運用現有的智能移動設備真實的應用圖像而非設計處理過的圖像;

3)變異性。盡量使數據具有較大的變異性,使得模型更加穩健,適應各種環境下的操作。

4 結束語

文章介紹了一種針對移動設備的用戶注視行為推測解決方案。首先建立一個大規模眼動跟蹤數據集,收集大量的注視數據。大型數據集的重要性,以及具有大量各種數據以能夠訓練用于眼睛跟蹤的魯棒模型。然后,訓練得到一個深層卷積神經網絡,用于預測注視。通過仔細的評估,利用深度學習可以魯棒地預測注視,達到一個較好的水平。此外,雖然眼睛跟蹤已經存在了幾個世紀,相信這種新方案的策略可以作為下一代眼動跟蹤解決方案的關鍵基準。希望能通過這方面的研究,使人機交互得到更好的發展。

參考文獻:

[1] 崔耀 視控人機交互系統技術研究與實現[D].西安,西安電子科技大學,2013.

[2] 遲健男, 王志良, 張闖.視線追蹤[M].北京: 機械工業出版社, 2011.

[3] Alireza Fathi, Yin Li, and James M Rehg 2012 Learning to recognize daily actions using gaze In Computer VisionCECCV 2012. Springer, 314-327.

[4] Makeroni Labs 2016 Eye of Horus. https://hackaday.io/project/

6638-eye-of-horus-open-source-eye-tracking-assistance (2016) Accessed: 2016-02-26.

[5] Francisco J Parada, Dean Wyatte, Chen Yu, Brandi Emerick, and Thomas Busey,2015.Expert Eyes: Open-source, high-definition eyetracking Behavior research methods ,2015.

[6] 楊彩霞.基于近紅外光源的非接觸式視線跟蹤技術研究 [D].山東:山東大學,2012.

卷積神經網絡的優點范文4

人工神經網絡作為一種智能化的方法近年來在圖像數據壓縮領域得到了一定的研究與應用[6]?;谌斯ど窠浘W絡的數據壓縮主要有2個步驟:①學習訓練,將數據送入輸入層作為訓練樣本,不斷調整各層間的連接權值,從而使得網絡的輸出均方差達到最??;②壓縮編碼,將數據輸入到訓練好的網絡,壓縮后的數據通過隱含層輸出。DEM數據具有相關性和連續性的特點,即DEM數據反映的是地形連續變化的特征,高程劇烈變化的部分是少有的并且DEM網格中某一點的高程值可以通過鄰域值用非線性函數表示,這實質上非線性函數逼近或地形曲面擬合的過程?;谝陨咸攸c,學者們將人工神經網絡引入到DEM數據壓縮領域,馮琦等[7]采用BP神經網絡實現DEM數據壓縮,該研究特色在于:①采用L-M訓練算法提高單隱層網絡(SHLN)運算速率[8-9];②基于DEM數據相關性特點設置相對誤差精度指標實現對最優BP訓練網絡的選取,在減少結點數的同時獲得較高的壓縮比;③該方法解壓過程對于計算機硬件依賴性不高,能夠進行數據的離線壓縮處理。根據DEM數據的連續性特征,趙鴻森等[10]提出了一種基于RBF神經網絡的壓縮方法,該方法將山脊線、山谷線等地形特征作為樣本點訓練集,能夠根據地形特征自適應確定網絡結構,神經網絡權值是通過網格點高程值獲得,可獲得較高的壓縮比。

基于小波變換的DEM數據壓縮

1.基于DWT的DEM數據壓縮

DWT(DiscreteWaveletTransform)適合于處理各種冗余度低、相關性低的非平穩信號的壓縮處理,對于不穩定、相關性差的DEM數據壓縮具有較好的效果。DWT對于信號的壓縮是基于其他具有多分辨率分析(MRA)這一特性,即根據Mallat算法[11]原始信號能夠被逐級分解為高頻和低頻信號,由于高頻分解信號含有絕大都數信息并且幅值小,通過設定一定的比例將最小幅值的分解系數置為0,再通過小波系數重構達到信號壓縮的目的。經過理論分析,原始信號經過DWT,重構信號與原始信號具有高度的一致性。事實上重構信號與原始信號的差別往往不可忽略,特別是對于DME數據的壓縮,壓縮后數據相對于原始數據而言存在著嚴重的邊界畸變、失真等問題,必須加以解決。針對這一問題,CHANG[12]等將二維離散小波變換的邊界問題轉變為一維離散小波變換來進行處理,研究結果表明該方法大大減小了邊界失真區域,在提高壓縮比的同時DEM重建數據精度也得以提高。

2.基于IWT的DEM數據壓縮

DWT是通過將信號分解系數直接置0的方式來進行壓縮處理,重構信號與原始信號不可避免地出現誤差,而基于IWT(IntegerWaveletTransform)信號壓縮,由于小波分解系數通過有限精度數(FinitePrecisionNumber)來進行精確描述,因而適合于對信號進行無損壓縮處理[13]?;贗WT的數據壓縮具有以下特點:①壓縮處理很大程度上依賴于多相矩陣因式分解的選擇,而因式分解能否對壓縮后圖像給定一個適當的誤差尺度,取決于圖形迭代函數;②IWT采用提升方案,并且均為整數運算,數據處理的速率得以提高;③IWT完全可逆,既可以實現有損編碼也可以實現無損編碼。陳仁喜等[14]將整形小波變換用于DEM數據壓縮處理,該方法首先將經過預處理的DEM數據進行整形小波變換,然后對變換系數進行閾值化處理,最后進行量化編碼。該方法最大特點是實現了數據壓縮比和質量以及數據質量和傳輸速度的很好折中,具體為:①量化方法基于SPIHT算法平面傳送思想,重要信息主要集中于高位,將小波變換后的系數直接去掉后面的n個平面位,該方法在保證數據壓縮質量的同時提高了壓縮比;②采用基于位平面掃描的算法對量化后的數據進行壓縮編碼,這使得壓縮后的數據具有質量漸進傳輸特性;③小波變換后各子帶分別進行編碼,在解碼過程中可以不對高頻子帶解碼,得到的恢復數據分辨率較低,這有利于對大型DEM數據進行快速檢索和瀏覽。

3.基于SPIHT小波編碼算法

EMZ(EmbeddedZerotreeWavelet)算法由Shaprio[15]于1993年提出,該算法包括嵌入式和零樹,在零樹結構與逐次逼近量化方法(SAQ)相結合的基礎上實現嵌入式編碼。該算法能充分利用小波系數特點使得輸出的碼流具有嵌入的優點,因而在圖像處理[16-17]、生物醫學[18]等領域得到廣泛的應用研究。但該算法也存在著如在相互獨立的零樹進行編碼時浪費大量字節等缺陷,研究者們也做了一些改進[19]。在EMZ算法基礎上發展而來的SPIHT(SetPartitioninginHierarchicalTrees)[20]算法具有能夠在保證數據壓縮質量的前提下提高壓縮比,能夠進行優化嵌入式編碼,均方根誤差和計算復雜度低等優點,并且數據壓縮后具有很好的漸進傳輸特性,目前該算法在圖像壓縮領域得到廣泛應用。地形特征是影響DEM壓縮質量的一個重要因素,平坦地區數據冗余量大而山地地勢高低起伏,數據冗余則較小,但就現有的研究方法而言將這兩種地形采用同樣地壓縮比,壓縮結果不盡如人意,李毅等[21]提出了一種基于SPIHT小波的DEM自適應壓縮方法,該方法特點在于:①考慮地形特征,根據地形的復雜度進行分析以確定數據壓縮比,從而確保數據可視化質量;②自適應性編碼,通過才用表征不同尺度的小波高頻系數和地形尺度特征向量對地形復雜度進行評估,根據評估結果自適應調節編碼算法。但該研究中數據壓縮比是根據地形視覺效果選擇,存在一定的經驗性,在實際應用中很難得到較為理想的壓縮比。

4.基于M進制小波的DEM數據壓縮

多分辨率分析是傳統二進制小波變換的基本特性,即能夠獲得信號在時間域和頻率域局部化特征,這有利于對圖像局部信息進行有效地識別和分析。當圖像經過多層小波分解時,隨著分解層數的增加,圖像信息會出現不同程度的丟失,這成為二進制小波變換的主要缺陷。在二進制小波變換基礎上發展的M進制小波變換具有如下特點:①能夠對圖像信號進行更加細致地分解,分解次數不受限制;②圖像信息更加集中,并能夠精確描述圖像的頻率分布;③圖像重構具備較高的精度;④具有對圖像信號相對狹窄的高頻部分進行放大處理和對圖像信號壓縮的特性,這克服了正交小波分解所存在的缺陷.DME由于具有海量化數據,以及復雜的地形信息等特點一直是DEM數據壓縮的難點,近年來研究者們將M進制小波變換引入DME數據壓縮領域,王宇宙等[22]提出了一種基于多進制小波變換的DEM數據壓縮方法,顧及DEM地形因素,將高頻和低頻信息分別進行編碼處理是其主要特色,具體化為:①低頻系數采用差分映射編碼,這充分顧及地面變化的連續性以及大量數據冗余的情形,能夠對低頻信息進行無損的壓縮編碼;②并未直接舍棄系數值較小的高頻小波系數,而是通過自適應對數量化表,對各個高頻小波系數子塊分別加以量化處理,能夠獲得較好的壓縮效果。但該方法不足之處在于:對數量化位數是根據壓縮率來進行確定,而事實上壓縮率不能預先得知,從而量化位數也就無法精確得獲得,基于具體地形信息的DEM數據精確壓縮也就難以實現。多進制小波函數和尺度函數的構造是基于多進制小波DEM數據壓縮的難點之一,對此呂??萚23]構造了一種具有插值性質的多進制小波函數和尺度函數,將DEM數據轉變為二維圖像壓縮問題,能夠在保持地形特征基本不變的前提下提高壓縮比。但基于多進制DEM數據壓縮本質上是有損壓縮,細節信息的損失不可避免。#p#分頁標題#e#

基于組合算法的DEM數據壓縮

1.SPHIT算法與小波變換相結合的DEM數據壓縮

整形小波變換(IWT)采用了提升方案(LS),避免了傳統小波的卷積運算,并且計算過程完全在空間域進行,計算復雜度明顯降低,便于硬件實現。因此,IWT能夠對于冗余度較大的DEM數據進行有效地去相關性處理,實現對DEM數據的無損或近似無損的壓縮。將IWT與新型編碼方法的代表——SPIHT算法有機結合,為DEM數據壓縮提供了一種有效方法。田繼輝等[24]提出一種能夠用于應急三維GIS的DEM數據壓縮方法,該方法特點在于:①根據壓縮精度要求,實現DEM數據單位轉換;②對于每塊DEM數據均減去其最小值,在降低了小波變換級數的同時使得SPIHT編碼級數也得到降低;③通過設定一個小波系數閾值,將高于和低于該閾值的小波系數,分別進行SevenZip和SPIHT算法進行處理;④選用Int5/3實現對DEM數據壓縮處理。該方法充分發揮IWT和SPIHT算法的優勢,能夠顧及到地形平坦和起伏較大情形下的壓縮編碼,研究表明該方法取得了較好的壓縮效果,但對于DEM數據的邊界問題并未提及,仍需要進一步加以研究。

2.基于小波變換與熵編碼相結合的DEM壓縮算法

該算法實現主要有3個步驟:①小波變換,即選擇恰當的小波基函數對DEM數據進行小波變換;②量化,經過小波變換后數據相比原始數據而言更加集中,但其數量大小并未改變,必須采用一定的量化方法進行數據量化;量化通常有矢量和標量量化兩種方法;③編碼,通過將小波變換后的量化數據進行編碼,將其轉化為字符流。就整個小波壓縮流程而言,數據經過壓縮后邊界失真現象的克服,數據壓縮比的提高,以及在于量化和編碼方法的選擇是該壓縮算法的難點所在。DEM數據具有不穩定、相關性差、信息熵高,并且DEM在平原地區具有較大的冗余,而在山區則冗余度較低等特點,這使得數據壓縮比難以得到提高,常占強等[25]利用具有線性相位的雙正交小波變換與混合熵編碼相結合的方法對山區DEM數據進行壓縮處理,具體來說:首先對DEM數據進行小波變換,通過選取最大分解系數的1/6作為自適應閾值并與硬閾值函數相結合,對小波分解后的高頻系數進行處理,能夠使得大約95﹪小波系數為0;然后將高頻和低頻分解系數分別采用游程編碼和Huffman編碼;最后再次通過游程解碼和Huffman解碼進行數據解壓。該研究充分發揮了小波變換與編碼方法各自的優勢,在提高數據重建精度的同時獲得了較高的壓縮比,但小波閾值的選取局限于單一的情形,對多種情形的小波閾值的自適應確定規則的研究仍有待于進一步深入。

3.紋理優化技術與其他方法相結合的DEM數據壓縮

紋理數據作為一種重要的場景數據,在對三維DEM數據進行渲染時一般存在兩個問題:①由于采用分辨率高而且顏色豐富的紋理,從而存消耗急劇增加;②無法有處理決紋理分辨率與視距之間的關系,即相機與圖的距離較近時,圖形分辨率較大,相機與圖形距離較大時,圖形分辨率較小。Mipmap(Multi-imagepyramidmap)技術能夠很好解決以上問題,該技術由Willams提出,并很快得到了廣泛的研究和應用。從廣義角度上分析,DME數據壓縮、傳輸與顯示是一個有機整體,同屬于DEM數據壓縮范疇,即廣義DEM數據壓縮。楊曉東等[26]結合Mipmap紋理優化技術與頂點法向量編碼方法對DEM數據進行壓縮處理,該研究主要實現如下功能:①數據的漸進傳輸和顯示:通過對DEM數據進行小波變換,分別采用標量量化器和EZW對小波系數進行量化和編碼;②DEM數據優化顯示,采用頂點法向量的計算和編碼方法并結合Mipmap紋理優化技術,能夠對模型數據進行光照效果的計算。該研究突破了將DEM數據的壓縮、傳輸以及優化顯示有機結合,突破了現有的DEM數據壓縮的固有模式,為該領域提供了一個較好的研究思路。

4.基于判別規則(指標)的DEM數據壓縮

TIN由于采用不規則的空間分布高程采樣點描述地形,在數據結構、三角網生成算法等方面相對于排列規則且結構簡單的Grid數據而言,數據壓縮方面難度較大。通過預先定義某一判別規則(指標)來對數據量進行適當的取舍,從而實現對DEM數據的壓縮,是實現DEM數據壓縮處理的一種有效方法。蔡先華等[27]提出DEM數據壓縮地形描述誤差(Ep)這一判別指標來實現對DEM數據壓縮,該方法首先在充分考慮DEM高程采用點、地形描述以及數據壓縮等誤差相互影響的基礎上,確定數據壓縮誤差限值EP0;然后對不是TIN邊界的高程點產生的地形誤差Ep與所給限值進行比較,剔除小于該值的高程點,從而實現DEM數據的壓縮。三角網在地形起伏較大的情況下,相鄰法線向量之間夾角較大,而當地形平坦時,相鄰法線向量近乎平行。劉春[28]等提出一種基于TIN的DEM數據壓縮方法,該方法將相鄰三角形法線間的夾角作為判別依據,判別閾值步驟如下:①確定大概閾值T,采用該閾值進行TIN壓縮;②計算DEM采樣點高程差的方差S;③將S與壓縮誤差允許值進行比較,如果大于該值則適當減少閾值T,并重新計算;反之則增大閾值T并重新計算直到滿足要求為止。該方法間接地顧及地形特征,并且閾值的選擇是根據所給點的壓縮誤差指標進行迭代選擇的,研究表明該方法對TIN數據壓縮較為有效,但對于特殊地面模型的壓縮處理仍有待于進一步研究。

結束語

卷積神經網絡的優點范文5

關鍵詞 近紅外光譜;茶葉;品質測定;真偽鑒別

中圖分類號 O657.3 文獻標識碼 A 文章編號 1007-5739(2016)04-0289-02

Recent Advance on the Application of Near-infrared Spectroscopy in Tea

NIE Yu-hong ZHOU Xiao-wei ZHANG Bei

(School of Food and Bioengineering,Zhengzhou University of Light Industry,Zhengzhou Henan 450002)

Abstract The main approaches of near infrared reflectance spectroscopy were introduced in this paper. Recent advance of near infrared reflectance spectroscopy on identification and detection of tea were presented.With the recent developments reviewed,the problems encountered were also discussed.The application prospects of near infrared reflectance spectroscopy in tea detection were analyzed.

Key words near-infrared reflectance spectroscopy;tea;determination of the quality;identification

隨著社會發展和消費水平的提高,人們越來越注重身體健康,而茶葉作為一種良好的保健飲品也越來越被人們喜歡。當前對茶葉質量的檢測多采用感官檢驗評審的方式。這種方式的弊端是評審的結果受評審場地,以及評審人員的知識水平、健康狀況等因素的影響[1]。隨著當前茶葉產業的迅猛發展,利用科學儀器對產業品質進行檢測十分必要。目前,近紅外光譜分析技術在茶葉的定性和定量檢測中被廣發應用[2]。

1 近紅外光譜分析技術背景簡介與發展現狀

英國天文學家William Herschel在天文觀察中發現了近紅外光譜(near infrared reflectance spectroscopy,NIRS)[3]。美國材料檢測協會(ASTM)將近紅外光譜區定義為波長780~2 526 nm(波數為12 820~3 959/cm)的光譜區。近紅外光譜具有吸收頻率特征性強、受分子內外環境影響小、光譜特性更穩定的特點。近紅外光譜主要反映的是有機物分子中含氫基團的倍頻吸收與合頻吸收。NIRS技術的優點主要有以下幾個:一是能夠分析的對象數量較多、涵蓋門類較多。二是在分析前對樣品不需要進行復雜的前處理,分析的操作簡單、速度較快。三是分析不破壞樣品,通過光譜掃描完成。四是對環境污染較小[4]。NIRS技術使用方便、對環境污染小、檢測速度快、效率高,在農業[5]、食品工業[6]、中醫藥[7-10]、和石油化工[11]等領域中得到了非常廣泛的應用。

日本是最早利用NIRS技術對茶葉開展研究的國家,目前已研制出專用的近紅外分析儀來快速檢測茶葉中的水分、全氮量、粗纖維、茶多酚、咖啡堿、氨基酸等主要成分[12]。但是由于國外的茶葉種類少,因此NIRS技術在茶葉產地、真偽鑒別等定性分析方面的研究較少。

國內NIRS技術應用于茶葉檢測方面,主要集中在綠茶理化成分的測定方面,茶葉、茶湯、茶提取物中的理化成分測定,茶葉品質評價的研究等。因為我國茶葉的種類繁多,所以NIRS技術在茶葉的產地、品種及真偽鑒定等方面的研究也較為廣泛。

2 近紅外光譜分析方法簡介

近紅外光譜分析中常用的數據處理計量方法主要有以下幾類。

2.1 多元線性回歸法(MLR)

多元線性回歸是化學計量學中最基本的分析方法[4],是分析一個隨機變量與多個變量之間線性關系的統計方法。當變量Y的影響因素有多個而不止1個時,可以建立多元線性回歸模型:Yi=β0+β1X1+β2X2+...+βkXk+ε。利用變量Y與X的n組樣本數據,按照一定準則,可求得估值b0,b1,...,bk,建立起樣本回歸模型:Y=b0+b1X1+b2X2+...+bkXk+ε。

2.2 主成分分析法(PCA)

數據降維后進行多元統計分析是主成分分析的基本原理[13-15]。在研究的過程中,采用多指標變量的方法,得到的結果在一定程度上出現了重疊。主成分分析法避免了多變量測定方法測定結果容易出現重疊的弊端,將原變量進行轉換,使少數幾個新變量成為原變量的線性組合,新變量之間互不相關。同時,這些變量也能夠盡可能多地表征出原變量的數據結構特征。

2.3 偏最小二乘法(PLS)

就目前的研究情況來看,偏最小二乘法是逐漸發展,已經成為近NIRS技術中應用最多的回歸方法[16]。利用非線性迭代方法對吸光度矩陣X和濃度矩陣Y進行分解,以特征向量的相關性來建立X和Y之間的內部聯系。偏最小二乘法最適合運用在多組分復雜樣品的分析過程中,檢測速度快、結果準確度高、預測性強、能消除一定的非線性的能力。

2.4 人工神經網絡法(ANN)

人工神經網絡屬于非線性校正算法,是由大量簡單處理單元(神經元)廣泛互連而成的非線性動力學系統。它不僅結構可變,還有自學習、自適應、巨量并行性、存儲分布性的特點。與偏最小二乘法方法相比,人工神經網絡更加準確和抗干擾[17]。

2.5 極限學習法(ELM)

極限學習機法是從單隱含層前饋神經網絡發展而來的一種新型算法。隨機產生輸入層與隱含層的連接權值和隱含層神經元的閾值,只需要設置隱含層神經元的個數,便可以獲得唯一的最優解。

3 近紅外光譜分析技術在茶葉檢測方面的研究

3.1 茶葉水分含量的測定

茶葉水分含量的高低對茶葉品質的影響非常大。當水分含量小于5%時,茶葉香氣變化比較??;而當水分含量高于6.5%時,則茶葉品質下降得比較快。劉輝軍等[18]利用徑向基函數和趨勢變換法,建立了綠茶的水分檢測模型,預測的相關系數達到0.933。張月玲[19]利用偏最小二乘法和9階卷積平滑結合二階導數法,建立綠茶的含水量模型,相關系數達到了0.99以上。王勝鵬等[20]通過交叉驗證和偏最小二乘法,建立了茶鮮葉的含水量近紅外光譜模型,當主成分數為7時,相關系數為0.92。

3.2 茶多酚和兒茶素含量的測定

茶葉中,茶多酚的含量為18%~36%,在人體內能夠清除自由基,是茶葉中最重要的成分之一。Chen Q S等[21]利用偏最小二乘法,建立茶多酚總量的檢測模型,相關系數為0.93。徐立恒等[22]利用二階導數和偏最小二乘法,建立茶多酚模型,預測的相關系數為0.989。吳瑞梅等[23]利用GA法和偏最小二乘法,建立綠茶湯中茶多酚的模型,避開了水的強吸收峰影響,模型預測集均方根誤差為0.685%,相對標準差為5.26%。

兒茶素類物質是茶多酚中最主要的活性物質,占茶葉干重的12%~24%。陳華才等[24]使用偏最小二乘法和標準歸一化處理的方式,建立兒茶素類物質的預測模型,相關系數達到0.997。同時,又采用徑向基函數神經網絡法,優化了的茶多酚總兒茶素含量的模型,相關系數達到了0.992[25]。蘆永軍等[26]使用偏最小二乘法和定標波長的方式(選取6 000~5 200 /cm波數范圍內的光譜數據點),建立了定標精度很高的檢測模型,相關系數達到0.994 7。

3.3 咖啡堿含量的測定

咖啡因是茶葉中的重要滋味物質之一,能夠刺激中樞神經,起到提神醒腦的作用。孫耀國等[27]利用偏最小二乘法,直接對完整茶葉中的咖啡堿的含量建模,相關系數達到0.92。羅一帆等[28]和Chen Q S等[29]利用相同的方法構建獲咖啡堿的含量的模型,相關系數也分別達到了0.96和0.968的高精確度。

3.4 氨基酸含量的測定

茶葉中的氨基酸具有降壓、拮抗由咖啡堿引起的對神經系統的興奮等作用,其組成、含量以及其降解產物和轉化產物均與茶葉的香氣和滋味密切相關。徐立恒等[22]使用偏最小二乘法和定標波長的方式(選取5 000~4 000/cm波數范圍內的光譜數據點),建立了炒青綠茶的氨基酸模型,相關系數達到0.99。孫耀國等[27]在優化波長范圍的基礎上,利用二階導數預處理方式得到不同綠茶的氨基酸模型,相關系數達到0.99。

3.5 茶葉的種類鑒定和真偽鑒別

NIRS不但能夠對茶葉進行定量分析,還能夠對茶葉進行定性分析,確定茶葉的種類,實現茶葉產地、品種、生產時間等信息的精確判別。趙杰文等[30]通過多元散射校正預處理方法和定標波長的方式(選取6 500~5 300/cm波數范圍內的光譜數據點),結合馬氏距離識別模式鑒別了龍井、碧螺春、毛峰和鐵觀音這4種中國名茶,就鑒別率而言,校正集樣本達到了98.75%,預測集樣本達到了95%。利用NIRS技術對碧螺春[31]、西湖龍井[32-33]等茶葉進行了真偽鑒定。CHEN Q S等[34]運用NIRS技術對4個地區的烘青綠茶進行了產地鑒別,選出了最優的支持向量機模型,預測率高達到100%。

4 問題與展望

目前,NIRS技術在茶葉上已經得到比較廣泛的應用,但是仍然還存在一些需要解決的問題。在NIRS技術中選取代表性樣品來建模時,受到建模樣品生產季節、外形、產地等因素的影響。為了保證模型的全面性和完整性,在建模過程中需要大量的樣品,導致模型建立需要采集的樣本數量大、成本高、地域廣,給模型建立設置了難題。因為我國茶葉種類繁多,建立適合所有茶類的、精確度和準確度達到檢測要求的通用性模型是十分困難的。

隨著光學技術、計算機技術的快速發展,NIRS技術在茶葉品質檢測、茶類產地鑒別和茶葉真假鑒定等方面還會有更大的發展前景。同時,利用NIRS技術對原料生產的過程進行在線分析和實時監測也將會是一個重要的發展方向。

5 參考文獻

[1] 楊丹,劉新,王川丕,等.近紅外光譜技術在茶葉及茶制品上應用[J].浙江農業科學,2012(9):1290-1294.

[2] 曹干.現代近紅外光譜分析技術在農業研究中的應用[J].廣州農業科學,2004(3):9-10.

[3] BLANCO M,VILLARROYA I.NIR spectroscopy:a rapid-response anal-ytical tool[J].Trends in analytical chemistry,2002,21(4):240-250.

[4] 嚴衍祿.近紅外光譜分析技術與應用[M].北京:中國輕工業出版社,2005.

[5] SUBEDI P P,WALSH K B.Assessment of potato dry matter concentration using short-wave near-infrared spectmscopy[J].Potato Research,2009,6(52):67-77.

[6] IRUDAYARAJ J,XU F,TEWARI J.Rapid detemination of invert cane sugar adulteration in honey using FTIR spectroscopy and multivariate analysis[J].Joumal of Food science,2003,6(68):2045.

[7] 曾煥俊,韓瑩.維U顛茄鋁膠囊Ⅱ近紅外判別模型的建立[J].中國藥品標準,2011,4(12):303-306.

[8] LAASONEN M,HARMIA-PULKKINEN T,SIMARD CL,et al.Fast ide-ntification of Echinacea parpareadried roots using near-infraredspectros-copy[J].Anal Chem,2002(74):2493-2499.

[9] SERGIO H,FRASSON S,CELIO P.Identification of counterfeit drugs using near infrared spectroscopy[J].Analyst,2001(126):2218-2224.

[10] HAILEY P,DOHERTY P,TAPSELL P,et al.Automated system for the on-line monitoring of powder blending processes using near-infrared spectroscopy.Part I.System development and control[J].Journal of Phar-maceutical&Biomedical Analysis,1996,14(5):551-559.

[11] 張宇佳,徐曉軒,宋寧,等.基于近紅外漫反射光譜的烴源巖生烴潛量的確定[J].光譜學與光譜分析,2011,4(12):955-959.

[12] 吉川聰一郎.用近紅外光光度法進行茶葉品質評價:蒸青玉露茶和鍋炒玉露茶主要成分的分析[J].[日]茶葉研究報告,1997,85(增刊1):88-89.

[13] 吳建國.作物種子品質研究中近紅外光譜分析模型的創建和應用[D].杭州:浙江大學,2004.

[14] 夏柏楊,任竿.近紅外光譜分析技術的一些數據處理方法的討論[J].光譜實驗室,2005,22(3):629-634.

[15] BLANCO M,COELLO J,ITURRIAGA H,et al.Calibration in non-linear near infrared reflectance spectroscopy:a comparison of several methods[J].Analytica Chimica Acta,1999,384(2):207.

[16] GELADI P,KOWALSK B R.An example of 2-block predictive partiall east-squares regression with simulated data[J].Analytica Chimica Acta,1986,185:19-32.

[17] 夏賢明,丁寧.用近紅外光譜法檢測綠茶中品質成分的研究[J].分析化學,1991,19(8):945-948.

[18] 劉輝軍,呂進,林敏,等.基于RBF網絡和NIRS的綠茶水分含量分析模型[J].中國計量學院學報,2005,16(3):88-190.

[19] 張月玲.綠茶品質相關成分的近紅外定標模型的初步建立[D].杭州:浙江大學,2006.

[20] 王勝鵬,宛曉春,林茂先,等.基于水分、全氮量和粗纖維含量的茶鮮葉原料質量近紅外評價方法[J].茶葉科學,2011,31(1):66-71.

[21] CHEN Q S,ZHAO J W,ZHANG H D,et al.Feasibility study on qualita-tive and quantitative analysis in tea by nearinfrared spectroscopy with multivariate calibration[J].Analytica Chimica Acta,2006,572(1):77-84.

[22] 徐立恒,呂進,林敏,等.茶葉中3類主要組分的近紅外光譜分析作為茶葉質量的快速評定方法[J].理化檢驗:化學分冊,2006(5):334-336.

[23] 吳瑞梅,岳鵬翔,趙杰文,等.特征變量篩選在近紅外光譜測定綠茶湯中茶多酚的應用[J].農業機械學報,2011,12(42):154-157.

[24] 陳華才,呂進,俸春紅,等.近紅外光譜法測定茶多酚中總兒茶素含量[J].中國計量學院學報,2005,16(1):17-20.

[25] 陳華才,呂進,陳星旦,等.基于徑向基函數網絡的茶多酚總兒茶素近紅外光譜檢測模型的研究[J].光學精密工程,2006,14(1):58-62.

[26] 蘆永軍,陳華才,呂進,等.茶多酚中總兒茶素的近紅外光譜分析[J].分析化學研究簡報,2005,33(6):835-837.

[27] 孫耀國,林敏,呂迸.近紅外光譜法測定綠茶中氨基酸、咖啡堿和茶多酚的量[J].光譜實驗室,2004,21(5):940-943.

[28] 羅一帆,郭振飛,朱振宇.近紅外光譜測定茶葉中茶多酚和茶多糖的人工神經網絡模型研究[J].光譜學與光譜分析,2005,25(8):1230-1233.

[29] CHEN Q S,ZHAO J W,HUANG X Y,et al.Simultaneous determination of total polyphenols and caffeine contents of green tea by near-infrared reflectance spectroscopy[J].Microchemical Journal,2006,83:42-47.

[30] 趙杰文,陳全勝,張海東,等.近紅外光譜分析技術在茶葉鑒別中的應用研究[J].光譜學與光譜分析,2006,26(9):1601-1604.

[31] 周健,成浩,賀巍,等.基于近紅外的PLS量化模型鑒定西湖龍井真偽的研究[J].光譜學與光譜分析,2009,29(5):1251-1254.

[32] 周健,成浩,葉陽,等.滇青、青餅和普洱茶(熟餅)近紅外指紋圖譜分析[J].核農學報,2009,23(1):110-113.

卷積神經網絡的優點范文6

為了更準確地估計散焦模糊點擴散函數的散焦半徑,提出了一種基于階躍邊緣的參數估計方法。首先利用Canny算子對散焦模糊圖像進行邊緣檢測,然后利用Hough變換方法提取邊緣圖像中存在的邊緣直線,最后對沿直線法線方向的各像素,計算其灰度級的二階導數,導數值中的最大值則對應模糊階躍邊緣的邊界,進而計算出點擴散函數的參數。實驗表明,該方法能夠快速準確地計算出散焦模糊參數。

【關鍵詞】散焦模糊 參數辨識 階躍邊緣 點擴散函數

散焦模糊是因調焦不準確而造成的圖像模糊,并丟失了一些重要的高頻成分,而這些高頻成分恰恰蘊含著圖像中最重要的信息,使得人們對圖像的辨識能力下降。散焦模糊廣泛存在于圖像應用的各個領域,它造成的圖像信息丟失,嚴重影響了應用效果,制約了這些領域的進一步發展。因此,對散焦模糊點擴散函數參數的估計方法進行研究有著重要的實用價值和意義。

對散焦模糊點擴散函數參數估計的研究是圖像復原的一個重要研究領域,并已提出多種估計散焦模糊PSF參數的算法,這些方法大概可分為三類:(1)基于空域的參數估計。(2)基于變換域的參數估計。(3)基于迭代技術的參數估計。隨著人工神經網絡和遺傳算法等新興技術的出現,人們將其應用到圖像處理領域,提出了基于這些知識的參數估計算法?;谝陨系睦碚撗芯?,本文提出了一種新的估計散焦模糊點擴散函數參數的方法。

2 散焦模糊理論分析

2.1 散焦模糊點擴散函數

通過對成像的原理和過程的分析,通常認為成像系統具有空間移不變行,因此一幅降質圖像的降質過程在空間域可用如下過程來表示:

(2-1)

式中g(x,y)為降質圖像,f(x,y)為原始清晰圖像,h(x,y)為點擴散函數,即成像系統對點光源的響應,n(x,y)表示加性噪聲,*表示二維卷積操作。在上述表達式中,通常假設噪聲為高斯白噪聲,尤其是在噪聲不明顯的情況下,可忽略。那么在上式中,點擴散函數就是惟一未知項。

在散焦模糊點擴散函數的幾種模型中,由于圓盤模型只需估計出散焦半徑便可計算出PSF,在計算上更容易、更簡便,因此在參數估計時通常選用圓盤模型。其表達式如下所示:

(2-2)

其中,r表示散焦半徑,決定了散焦模糊的程度,即是參數估計方法所需要估計的參數。

2.2 階躍邊緣

圖像中的邊緣對應著相鄰的兩個類型區域的分界線,表示一個區域的結束和另一個區域的開始。設s(y)為一條沿x軸的理想階躍邊緣,可用下式來表示:

(2-3)

系統對s(y)的響應稱為邊緣擴散函數。

在計算出散焦階躍邊緣區域的左右邊界LI和Lr后,可根據下式計算出散焦半徑r,即散焦模糊點擴散函數的參數:

(2-4)

3 散焦模糊點擴散函數參數估計算法

3.1 模糊階躍邊緣圖像分析

經過散焦模糊后的階躍邊緣,其在圖像中呈現為一個模糊區域,稱之為模糊階躍邊緣?;陔A躍邊緣的散焦模糊圖像的點擴散函數參數估計,其關鍵是根據直線邊緣確定模糊階躍邊緣的模糊區域的邊界寬度,進而計算出散焦模糊點擴散函數的模糊半徑。在散焦模糊圖像中,階躍邊緣的模糊區域與檢測到的直線邊緣的關系如圖1所示:

圖1中,設為檢測到的模糊階躍邊緣的任意一條直線,長度為;定義以為高、區間為寬的區域為階躍邊緣的支撐區域;定義以為高、區間為寬的區域為模糊階躍邊緣的支撐區域;和分別為直線到模糊階躍邊緣左側和右側邊界的距離。

3.2 確定模糊階躍邊緣的邊界

以計算圖3-1中直線的右側邊界為例,介紹利用二階導數確定邊界的方法。設散焦模糊圖像為f(x,y),其沿x軸方向的一階偏導為,在離散情況下可以用差分來表示。為了處理上的方便,本文對計算出的一階導數值執行取絕對值操作。根據階躍邊緣的散焦模糊圖像的特點可知,在范圍內,直線右側沿其法線方向的灰度值的變化率即導數值會在模糊階躍邊緣區域的邊界兩側出現較大的變化,因此可根據相鄰導數值出現較大變化的點的位置確定其右邊界。

為了找到相鄰兩個點的差值的最大值,可以對計算出的一階導數值再對進行一次一階偏導操作,即對執行對的二階偏導操作,對計算出的導數值依然取絕對值。同理,可以用二階導數值確定直線的左邊界。

3.3 計算散焦模糊PSF的參數

在計算出散焦階躍邊緣的左右邊界和后,便可根據(2-4)計算出散焦半徑r,即散焦模糊點擴散函數的參數。

4 結論

本文提出了一種基于階躍邊緣的散焦參數估計方法,對于存在階躍邊緣的散焦模糊圖像,能夠快速準確地估計出散焦半徑。該方法不但對階躍邊緣有良好的估計效果,對于輕度平滑的邊緣也同樣適用。該方法的優點是計算簡便、時間復雜度低,比較適合于實時應用系統。

亚洲精品一二三区-久久