前言:中文期刊網精心挑選了卷積神經網絡的一般步驟范文供你參考和學習,希望我們的參考范文能激發你的文章創作靈感,歡迎閱讀。
卷積神經網絡的一般步驟范文1
【關鍵詞】人工智能 圖像識別 深度學習
1 概述
圖像識別技術是人工智能研究的一個重要分支,其是以圖像為基礎,利用計算機對圖像進行處理、分析和理解,以識別不同模式的對象的技術。目前圖像識別技術的應用十分廣泛,在安全領域,有人臉識別,指紋識別等;在軍事領域,有地形勘察,飛行物識別等;在交通領域,有交通標志識別、車牌號識別等。圖像識別技術的研究是更高級的圖像理解、機器人、無人駕駛等技術的重要基礎。
傳統圖像識別技術主要由圖像處理、特征提取、分類器設計等步驟構成。通過專家設計、提取出圖像特征,對圖像M行識別、分類。近年來深度學習的發展,大大提高了圖像識別的準確率。深度學習從大量數據中學習知識(特征),自動完成特征提取與分類任務。但是目前的深度學習技術過于依賴大數據,只有在擁有大量標記訓練樣本的情況下才能夠取得較好的識別效果。本文認為研究如何在標記數據有限的情況下繼續利用深度學習完成物體識別任務具有重要意義。這也是未來人工智能研究的重要方向之一。
2 傳統圖像識別技術
傳統的圖像識別技術包括:圖像獲取、預處理、特征提取、分類。在圖像輸入后,需要先對圖像進行預處理。一幅標準灰度圖像,如果每個像素的像素值用一個字節表示,灰度值級數就等于256級,每個像素可以是0~255之間的任何一個整數值。一幅沒有經過壓縮處理的640×480分辨率的灰度圖像就需要占據300KB的存儲空間。通常我們需要將圖片的亮度及對比度調整合適,才能使圖片更加清晰、便于觀察。
許多采集到的圖片帶有或多或少的噪聲,需要對圖片的噪聲進行消除。對圖片噪聲的消除可以使用不同的去噪方法,如中值濾波、算數平均濾波、平滑線性濾波和高斯濾波等。不同濾波器分別適用于不同情況的噪聲。如椒鹽噪聲便適合使用中值濾波器,高斯噪聲便適合使用平滑線性濾波和高斯濾波。有時候,我們需要對圖像細化處理(如指紋細化,字符細化等),以便獲取主要信息,減少無關信息。細化操作,可以得到由單像素點組成的圖像輪廓,便于后續特征提取操作。
基本的圖像特征提取包括邊緣、角點等提取。一般使用不同的特征提取算子結合相應的閾值得到這些關鍵點。另一類在頻域中進行特征提取的方法主要是通過傅里葉變換,將圖像基于頻率分為不同的部分,從而可以在頻譜中反映出原始圖像的灰度級變化,便可得到圖像的輪廓、邊緣。
在完成圖像的預處理和特征提取之后,我們便能夠對圖像進行識別、分類。常用的分類器有K-近鄰(KNN),支持向量機(SVM),人工神經網絡(ANN)等等。K-近鄰算法原理是,當一個樣本的k個最相鄰的樣本中大部分屬于某一類別時,該樣本也應當屬于同一類別。支持向量機是通過尋找支持向量,在特征空間確定最優分類超平面,將兩類樣本分開。人工神經網絡模仿生物大腦中的神經網絡結構,通過誤差反向傳播不斷優化參數,從而得到較好的分類效果。
3 基于深度學習的圖像識別技術
一般認為深度學習技術是由Hinton及其學生于2006年提出的,其屬于人工神經網絡分支。深度神經網絡模仿人腦的神經機制來分析樣本,并盡可能地對樣本的特征進行更深度的學習。以圖片為例,利用深度學習技術對樣本的特征進行學習時,由低層特征到高層特征越來越抽象,越來越能表達語義概念。當樣本輸入后,首先對圖像進行卷積與下采樣操作,卷積和下采樣操作是為了進行特征提取和選擇。以原始像素作為輸入,深度學習技術可以自動學習得到較好的特征提取器(卷積參數)。深度學習的訓練過程,首先將當前層的輸出作為下一層的輸入,進行逐層分析,使得每一層的輸入與輸出差別盡可能小。其后,再聯合優化,即同時優化所有層,目標是分類誤差最小化。
傳統的深度神經網絡往往網絡中的節點數太過龐大,難以訓練。人們構造出卷積神經網絡,以權值共享的方式減少了節點數量,從而能夠加深學習的深度,使系統能學習到更抽象、更深層的特征,從而提高識別正確率。目前較成功的深度學習網絡結構有AlexNet、GoogLeNet、ResNet等。
與傳統識別技術相比,深度學習技術具有以下優勢:
(1)無需人工設計特征,系統可以自行學習歸納出特征。
(2)識別準確度高,深度學習在圖像識別方面的錯誤率已經低于人類平均水平,在可預見的將來,計算機將大量代替人力進行與圖像識別技術有關的活動。
(3)使用簡單,易于工業化,深度學習由于不需要領域的專家知識,能夠快速實現并商業化,國內較知名的深度學習創業公司有專注人臉識別的Face++、研究無人車的馭勢科技等。
4 存在問題與未來展望
雖然深度學習具備諸多優點,但目前來看深度學習仍有許多不足之處。首先,由于深度學習模型為非凸函數,對其的理論研究十分困難,缺乏理論保證。在對數據進行調整時,仍是簡單的“試錯”,缺少理論支撐。
同時,由于深度學習過于依賴數據量和計算資源。對一個新概念的學習,往往需要數百個甚至更多有標記的樣本。當遇到有標記的樣本難以獲取或者代價太大時,深度學習就無法取得好的學習效果。并且深度學習需要十分昂貴的高性能GPU,這使得深度學習難以平民化。目前深度學習訓練速度較慢,往往需要幾天甚至一個月。其模型擴展性差,缺少“舉一反三”的能力,樣本稍加變化,系統性能便會迅速下降。目前的深度學習屬于靜態過程,與環境缺乏交互。
對其的解決方案目前主要有兩點:
(1)針對于模型擴展性差的問題,通過引入遷移學習,研究不同任務或數據之間的知識遷移,提高模型的擴展能力、學習速度,同時降低學習成本,便于冷啟動。
(2)與強化學習結合,研究在動態環境下進行深度學習,提高深度學習與環境交互的能力。
參考文獻
[1]蔣樹強,閔巍慶,王樹徽.面向智能交互的圖像識別技術綜述與展望[J].計算機研究與發展,2016:113-122.
[2]張翠平,蘇光大.人臉識別技術綜述[J].中國圖象圖形學報,2000:885-894.
[3]梅園,趙波,朱之丹.基于直線曲線混合Gabor濾波器的指紋增強算法[J].計算機科學,2016.
[4]孫志軍,薛磊,許陽明,王正.深度學習研究綜述[J].計算機應用研究,2012:2806-2810.
[5]莊福振,羅平,何清,史忠植.遷移學習研究進展[J].軟件學報,2015:26-39.
[6]高陽,陳世福,陸鑫.強化學習研究綜述[J].自動化學報,2004:86-100.
卷積神經網絡的一般步驟范文2
關鍵詞: 機器人視覺; 定位跟蹤系統; 系統設計; 控制模塊
中圖分類號: TN802.4?34; TP242 文獻標識碼: A 文章編號: 1004?373X(2016)14?0080?04
Design and implementation of robot vision locating and tracking system
CAO Qingmei1, WANG Xuelian2, MA Zhanfei3
(1. Vocational and Technical College of Inner Mongolia Agricultural University, Baotou 014100, China;
2. College of Public Administration, Inner Mongolia Normal University, Hohhot 010000, China;
3. School of Information Science and Technology, Normal College of Inner Mongolia University of Science and Technology, Baotou 014030, China)
Abstract: In view of the problems existing the design of the traditional robot locating and tracking system, such as incomplete tracking region acquired by image preprocessing module and incomplete noise elimination, a tracking system location according to robot vision was designed and implemented. In the system, the tracking region is acquired with the image preprocessing module, various modules of the whole system are coordinated and controlled with the control module to acquire the image of the target in the region, and then the acquired information is sent to the image processing module to complete the information exchange among the system modules. In the process of software design, the system locating program code is given while image processing to realize the robot visual positioning and tracking. The experimental results show that the designed system has the high feasibility and practicability.
Keywords: robot vision; locating and tracking system; system design; control module
0 引 言
近年來,機器人視覺被廣泛應用在工業、圖像處理等眾多領域,而在定位跟蹤領域的使用是最好的,也是最突出的[1?2]。隨著科學技術的發展,設計并實現了很多定位跟蹤系統,如基于人臉特征設計的定位跟蹤系統,通過體型特征設計的定位跟蹤系統,通過DNA檢測設計的定位跟蹤系統以及通過機器人視覺設計的定位跟蹤系統。其中,最常用、效果最好的就是通過機器人視覺設計的定位跟蹤系統[3?5],相比其他的定位跟蹤系統,該系統應用前景廣泛,跟蹤效果好,已經成為很多學者研究的重點課題,受到越來越廣泛的關注,是相關領域的前沿方向[6?9]。
本文設計并實現了一種通過機器人視覺進行定位的跟蹤系統,通過機器人視覺進行區域目標信息的采集及分析,為視覺監控等領域提供有效依據。
1 機器人視覺定位跟蹤系統總體設計
設計的機器人視覺定位跟蹤系統主要由控制模塊、圖像預處理模塊、信號采集模塊、通信模塊和視覺定位模塊構成。首先通過圖像預處理模塊將需要的區域圖像中的噪聲進行干擾去除,經過控制模塊對整個系統各個模塊進行協調和控制,將區域圖像信息進行采集及存儲,并通過通信模塊進行信息的傳輸,最后通過機器人視覺進行定位,最終根據定位完成跟蹤。其中,圖像預處理的好壞,直接影響后面機器人視覺定位的準確度,定位出現誤差,跟蹤效率就會降低,因此圖像預處理模塊是整個機器人視覺定位跟蹤系統的基礎。詳細的機器人視覺定位跟蹤系統結構如圖1所示。
2 機器人視覺定位跟蹤系統硬件設計
2.1 控制模塊
控制模塊是本文設計系統的核心,主要用來協調和控制整個機器人視覺定位跟蹤系統各個模塊,其主要由C8051F206單片機、UART和SPI串行接口、片內FLASH存儲器等構成。選擇C8051F206單片機為系統的核心芯片,它是集成的MCU芯片,具有12位多通道ADC,依據系統整體設計的需求,選用UART和SPI的串行接口,該串行接口共有32個通用I/O引腳,部分引腳用于數字外設接口。所有端口引腳均能夠被配置ADC模擬輸入,片內還集成有VDD監視器、硬件看門狗定時器以及時鐘振蕩器。片內FLASH存儲器還可用于部分數據存儲。通過設計的這個控制模板可以及時有效地對其余各個模塊進行調控并獲取區域圖像,為定位跟蹤提供了先決條件。
2.2 圖像預處理模塊
獲取區域圖像之后,需要進一步對圖像進行預處理,圖像預處理模塊主要負責獲取相對比較完整的、最大程度的不含陰影與噪聲的區域圖像。其中,圖像信息主要通過LT1959CS8、視頻解碼芯片、SRAM進行預處理。SRAM需采用精度和穩定性較高的雙電源供電,以消除機器人視覺定位跟蹤系統各模塊存在的電磁噪聲,因此,本文選用兩片Linear公司生產的LT1959CS8進行供電。視頻解碼芯片選用Trident Microsystem公司生產的SAA7113H芯片。圖像存儲選擇兩片IDT71V424異步SRAM芯片實現,其芯片容量是512 KB。這樣通過圖像預處理模板,可以去除噪聲對定位跟蹤產生的干擾,為信息采集模塊提供最“純凈”的信息。
2.3 信息采集模塊
信息采集模塊主要用于對經過處理后的目標圖像信息進行采集,同時將采集的信息發送至通信模塊進行處理。信息采集模塊主要包括MMA7260QT芯片、信息調理、單極低通濾波器以及溫度補償單元等。設計該模塊時,將MMA7260QT芯片作為核心,對處理后的圖像信息進行采集。該模塊不但需達到信息采集的功能要求,同時體積需盡可能的小,以節省資源。MMA7260QT是美國Freescale公司生產的一款低成本的單芯片,該芯片融合了信息調理、單極低通濾波器以及溫度補償技術,同時可提供四種采集范圍,具有噪音低、靈敏度高的優點。因此,該模塊使用MMA7260QT芯片可達到更好、更全面的圖像信息。
2.4 通信模塊
通信模塊主要用于整個系統模塊之間的信息交換,是整個系統設計成敗的關鍵樞紐,因此,本文選擇CAN總線進行通信。和其他總線相比,CAN總線具有節點間不分主次,通信速率高的特點。除此之外,該模塊還采用Microchip公司的MCP2515控制器和TJA1040驅動器輔助實現,不僅能夠達到系統所需的要求,還能節約成本。
2.5 機器人視覺定位模塊
機器人視覺定位模塊是整個系統的關鍵模塊,采集到的信息通過預處理去除噪聲干擾,再經過通信模塊傳輸到視覺定位模塊,在此模塊經過圖像智能化定位處理,使得要跟蹤的信息更加清楚、明了,增加了跟蹤的精度。
3 機器人視覺定位跟蹤軟件算法的設計
3.1 算法的設計思路
在上述機器人視覺定位跟蹤系統各個模塊的設計的基礎上,設計軟件算法,具體步驟如下:
(1) 獲取定位圖像特征,為動態估計提供依據。假如,區域圖像信息集為[φkζ],[k=1,2,…,M],則第[k]個圖像的特征可通過下式求出:
式中:[Fkx;pk]用于描述圖像信息的動態變化;[vkx;pk]用于描述圖像不確定項;[pk]用于描述各參數向量。
(2) 動態估計值的計算,為獲取定位誤差值提供有利條件。通過利用RBF神經網絡對一般動態信息圖像特征[φkx;pk=Fkx;pk+vkx;pk]進行局部分類,同時將獲取的信息用常值神經網絡[WkTSx]權值的形式進行保存,并獲取[M]階的動態估計值:
式中:[k=1,2,…,M]用于描述第[k]個參數;[χk=χ1k,χ2k,…,χnkT]用于描述圖像信息個數;[B=diagb1,b2,…,bn]用于描述對角矩陣。
(3) 定位誤差值的計算及誤差范數的獲取。在測試過程中,通過式(2)獲取的動態估計值,即可獲取定位誤差值,計算公式如下:
式中,[χki=χki-xi]用于描述狀態估計誤差。
通過式(4)求出誤差[χkit]的[L1]范數:
式中,[TC]用于描述圖像信息獲取周期。
(4) 完成機器人視覺定位,其基本思想為:若信息動態模式為[s]([s∈1,2,…,k]),則動態模式[s]中常值RBF的神經網絡[WkTiSix]值,可通過定位誤差值獲取。所以,相應的誤差[χsit1]在全部誤差[χsit1]中最小。依據最小誤差原則,實現快速定位。
依據上述定位過程給出系統用于定位的主流程圖,如圖2所示。
(5) 在定位的基礎上完成跟蹤,則具體的跟蹤結果如下:
式中:[Ii,j]代表目標圖像邊緣上的像素點;[S]代表圖像邊緣梯度向量;[t]代表目標濾波值。
3.2 源代碼設計
本文設計的機器人視覺定位跟蹤系統軟件,是在Windows XP環境下,通過Visual C++ 6.0實現的,其關鍵跟蹤部分的源代碼如下:
4 仿真實驗分析
為了驗證本文設計的機器人視覺定位跟蹤系統的有效性,需要進行相關的實驗分析。實驗將基于確定學習的跟蹤系統作為對比進行分析,本文實驗在Windows XP環境下,LabVIEW構建系統平臺上完成。分別采用本文系統和基于確定學習的跟蹤系統對測試區域目標進行跟蹤,測試區域目標圖像如圖3所示,兩種系統測試得到的結果分別如圖4、圖5所示。
由圖4、圖5可知,改進算法進行多人視覺定位中的防丟失效果要優于傳統算法,這主要是因為本文設計的跟蹤系統,通過控制模塊對整個系統的各個模塊進行協調和控制,再經過圖像預處理模塊對目標區域圖像進行處理,并對區域目標圖像信息進行采集,將采集的信息發送至圖像預處理模塊進行處理,完成整個系統模塊之間的信息交換,最終達到跟蹤的目的。采用本文系統對區域目標圖像進行跟蹤,從側面視角的角度,對本文系統和基于確定學習的跟蹤系統的跟蹤準確率進行比較,得到的結果如表1所示。分析表1可以看出,本文系統的準確率一直高于基于確定學習的跟蹤系統,且準確率一直在90%以上,說明本文系統具有很高的跟蹤性能。
5 結 論
本文設計并實現了一種機器人視覺定位跟蹤系統??刂颇K作為系統的核心,主要負責整個系統各個模塊的協調和控制,通過圖像預處理模塊進行處理,再用信息采集模塊對目標圖像信息進行采集;并通過通信模塊在整個系統模塊之間進行信息的交換。在軟件設計過程中,在圖像處理的同時給出定位跟蹤程序代碼,實現目標的定位跟蹤。仿真實驗結果表明,本文設計的系統具有很高的可行性和實用性。
參考文獻
[1] 梁棟,高瑋瑋,張艷,等.基于足底壓力圖像的靜態觸覺步態識別[J].華中科技大學學報(自然科學版),2013,41(10):25?29.
[2] 王欣,唐俊,王年.基于雙層卷積神經網絡的步態識別算法[J].安徽大學學報(自然科學版),2015(1):32?36.
[3] 賁燁,張鵬,潘婷婷,等.線性插值框架下矩陣步態識別的性能分析[J].智能系統學報,2013(5):415?425.
[4] 范玉紅,梁棟,鮑文霞.改進的譜特征和足底邊緣距離的步態識別[J].安徽大學學報(自然科學版),2014(6):37?43.
[5] 李一波,李昆.雙視角下多特征信息融合的步態識別[J].智能系統學報,2013,8(1):74?79.
[6] 王蒙,孫運強,姚愛琴.基于PCA和BP神經網絡的步態識別系統研究[J].電子質量,2014(3):83?85.
[7] 鄭偉南,曲娜,程鳳芹,等.基于步態識別技術的熱釋電紅外安防預警系統研究[J].中國新通信,2014(23):96?97.
卷積神經網絡的一般步驟范文3
關鍵詞:裂紋實時監測系統;Linux操作系統;ARMS3C2440開發板;QT
中圖分類號:TP29 文獻標識碼:A
文章編號:1004-373X(2009)21-138-03
Development and Research of Intelligent Building Crack′s Real-time
Measuring System Based on ARMS3C2440
ZUO Yongbo
(Electrical College,Hunan University,Changsha,410082,China)
Abstract:With the enhancement of variety of embedded processor′s speed and the development of integrated circuits,a large number of embedded devices are increasingly being applied in each aspects of people's living.In this study,with Linux operating system ARMS3C2440 development board for the development platform,the building crack monitoring system for real-time algorithm implementation and the final software development is completed.Different from the general crack detecting system,adopting edge of the crack detection and crack width measurement separately,making crack and measuring the results of locking position is more accurate.Using QT for interface design,making the software developed by a more intelligent,user-friendly and so on.
Keywords:crack real-time monitoring system;Linux operating system;ARMS3C2440 development board;QT
0 引 言
在建筑業中,評價墻體裂紋,地面裂紋是評價房屋質量的一項重要指標。由于傳統的利用手工標尺進行裂紋寬度測量的方法既不準確又不方便,于是將嵌入式應用于自動測量建筑裂紋寬度成為了許多研究者的重要研究內容。
本研究將問題劃分為以下兩個部分:
(1) 裂紋寬度測量算法;
(2) 將以上所開發軟件移植到ARM開發板,并優化算法提高軟件運行速度。
1 裂紋寬度測量算法
計算裂縫寬度關鍵是要利用圖像分割技術得到裂縫的真正邊緣。雖然已有文獻介紹了多種分割方法[1-4],但是未見有針對裂縫測試儀采集到的裂縫圖像進行處理的方法。因此,本文針對裂縫圖像,提出了結合OTSU圖像分割與Sobel邊緣檢測的混合算法進行裂紋檢測與寬度測量。
1.1 圖像獲取
圖像獲取過程如圖1所示:被檢測的裂縫通過光學系統在CMOS圖像傳感器上成像,然后通過USB接口將裂縫圖像輸出到ARM上進行處理。
裂縫圖像如圖2所示。裂縫寬度分布范圍較廣,自幾十至幾百像素不等,但遠遠小于圖像的寬度值。裂縫周圍有部分噪聲,有的圖像含有大量污染區域,這成為裂縫位置鎖定的難點。
1.2 OTSU圖像分割
通過與已有圖像分割方法如:直方圖法、OTSU法、區域分割法等進行比較發現,OTSU在最后的效果上占有明顯的優勢。因此采用OTSU方法進行圖像的分割。
圖像分割的結果如圖3所示。觀察結果,很容易發現圖像的邊緣很大區域被錯分為與裂縫一樣。于是直接計算裂縫寬度時會導致將錯分的區域計算成裂縫。因此除了計算裂縫寬度外,對候選裂縫集合進行有效剔除是另一個重要任務。對選裂縫集合進行有效剔除將會在下一小節中進行討論。
分割完圖像后,計算所有可能成為裂縫的區域的寬度。采用從圖像給定行的起始位置開始計算裂縫寬度,當發現像素灰度由0變為255,記為一個裂縫的左邊緣起始位置;當查找到像素灰度由255變為0,記為一個裂縫的右邊緣結束位置。通過這種方法可以獲取給定行的所有可能的裂縫寬度。但是在具體試驗中發現,計算對單行的裂縫進行寬度測量還是存在比較大的誤差。于是采用求取給定行上下5行共10行的平均值的方法。這樣可以有效地去除毛刺的干擾。通過這種方法,得到一個裂縫的候選集合,并且計算出候選集合中每一個位置的寬度。
1.3 Sobel邊緣檢測
以上小節得出了裂縫的候選集合,但是事實上這個候選集合含有大量的非裂縫區域。這一節中的主要內容是設計算法剔除這些干擾裂縫,獲取更小的裂縫候選集合。在試驗中,由于裂縫具有明顯的邊緣,而干擾圖像區域有比較模糊的邊緣或者僅有一個邊緣等,通過分析,提出采用Sobel邊緣檢測的方法進行裂縫位置的鎖定。Sobel算子由兩個卷積核組成,如圖4所示,圖像中的每個點都用這兩個核做卷積,一個核對通常的垂直邊緣相應最大,而另一個對水平邊緣相應最大。兩個卷積的最大值作為該點的輸出位。運算結果是一幅邊緣幅度圖像。
通過對原始圖像采用Sobel邊緣檢測得到如圖5所示結果。
但是,這個結果很明顯存在很多微小的干擾,這些干擾必須予以剔除,否則將對鎖定裂縫邊緣沒有任何效果。通過對邊緣檢測結果圖像仔細分析發現,雖然存在微小干擾,但是他們的灰度值普遍偏小,針對這一發現,對緣檢測結果圖像做與上一節中一樣的圖像分割,這會將微小的干擾有效地剔除。實際的實驗結果也驗證了這一點,如圖6所示。
同過對分割后的邊緣圖像進行觀察,圖像仍然存在一些微小的干擾,但這些干擾相對于未處理的緣檢測結果圖像已經很少,將在后續的處理中對圖像裂縫添加附加約束,從而取出這些干擾的影響。
1.4 基于裂縫特征的附加約束
通過對大量的裂縫圖像進行分析,發現圖像裂縫有如下特點:
(1) 裂縫灰度值低于墻體的灰度值。
(2) 裂縫的寬度相對于整個圖像不超過圖像寬度的1/3。
(3) 污染的墻體區域一般呈大的塊狀出現,且很多僅含有一個邊界,另一邊界延伸至圖像外面。
(4) 墻體的一些微小的干擾呈小塊狀出現。
(5) 裂縫一般為帶狀。
使用ARM處理器處理圖像,由于其速度慢且有實時性要求,故不能處理整張的圖像,換句話說,必須處理局部圖像。這就很明顯增加了剔除候選裂縫的難度。該系統顯然是無法使用特點(4)、特點(5)的。因此僅使用了前三個特點,并提出了約束:剔除寬度高于圖像寬度1/3的裂縫候選集,剔除寬度低于1/10的裂縫候選集。
通過添加以上約束,實驗效果有了明顯的提高。圖7是PC機的結果,由于同時使用了5個約束效果比較好。圖8是ARM系統運行的截圖,由于在ARM上不方便分步計算出每一個步驟,故直接給出了帶有測量結果的截圖。
2 基于Linux的QT界面設計算法
前文討論的是主要的算法部分,完整的裂紋測量系統還包括用戶接口部分,即圖形界面接口。在ARM上采用QT進行界面設計已經比較成熟,它具有以下主要特點:
(1) 入門容易、學習成本低。了解基本概念后就可以邊查文檔邊寫程序。
(2) 跨平臺效果好。本來是Linux下的工具庫,在Windows下默認觀感也很好。
3 軟件移植與程序優化
由于最終的程序是運行在ARM系統上,而由于ARM處理圖像時的速度慢與裂縫測量儀器的實時性要求,必須對程序進行優化,并將算法移植到ARM系統上,使之可以正確運行。
軟件的移植比較容易。由于一開始很注重將PC機上仿真成功的算法及時移植到ARM上,故程序的移植變得比較容易。
但是程序的優化是一個問題,雖然現在的ARM速度已經提高了很多,但是在處理圖像時還是很吃力,加上算法中需要對原圖像兩次獨立處理,相當于加倍了ARM的負擔。通過對大量裂縫圖像的分析,針對前文中提出的裂縫特點以及結合ARM本身的運算速度條件,提出剔除處理全部圖像的算法。采用了只處理給定行位置上下10行的區域。通過只處理這20行圖像,極大地提高了程序的運行速度。以上方法并行,還采用多線程編程方法,通過將圖像采樣與圖像的處理分為兩個進程完成,有效地提高了程序的運行速度。
4 實驗結果分析
該程序分別在PC機和ARM開發板上運行,效果如圖7,圖8所示。
通過大量的實驗發現該算法能較好地檢測出裂縫的分布和寬度。在算法中采用了結合OTSU圖像分割與Sobel邊緣檢測的混合算法進行裂紋檢測與寬度測量。這種算法能分別有效利用邊緣檢測與圖像分割兩種方法各自的優點。另外在該算法中加入了一些分析獲得的約束條件,這能極大地彌補邊緣檢測與圖像分割混合方法的不足,從而有效地提高了裂紋位置鎖定與裂縫寬度測量的精度。
5 結 語
針對墻體裂紋測量,設計出了一套適用于裂縫寬度檢測的算法。該算法能較好地檢測出裂縫的分布和寬度。采用邊緣檢測與圖像分割混合的方法并通過對大量圖像進行分析,對算法添加了一系列符合圖像裂縫特征的約束條件,極大地提高了算法的準確性與健壯性。分別將程序運行于PC機系統與ARM系統,并針對ARM系統的特點對算法進行了一系列優化,引入了并行處理技術,在提高ARM運行速度的同時,使得ARM系統檢測出的結果達到與PC機系統幾乎同等的效果。
參考文獻
[1]施樹明,初秀民,王榮本.瀝青路面破損圖像測量方法研究 [J].公路交通科技,2004,24(7):12-16.
[2]陸玲,陳國明,戴揚.水下結構物裂縫特征定量分析與測量 [J].計算機測量與控制,2004,12(1):10-12.
[3]甘玲,李濤,趙輝,等.CP神經網絡在圖像邊緣檢測中的應用 [J].四川大學學報:自然科學版,2003,35(3):93-96.
[4]王大志,黃劫,徐樹英.采用灰度直方圖的孔型識別和二值化閾值自動匹配 [J].測控技術,2005,24(2):48-49.
[5]耿飛,錢春香.圖像分析技術在混凝土收縮裂縫定量測試與評價中的應用研究 [J].東南大學學報:自然科版,2003,33(6):773-776.
[6]Kima K S,Kangb K S,Kangc Y J,et al.Analysis of an Internal Crack of Pressure Pipeline Using ESPI and Hearography[J].Optics&Laser Technology,2003,35(8):639-643.
[7]陳果,左洪福.圖像閾值分割的兩種新技術[J].模式識別與人工智能,2002,15(4):468-473.
[8]胡霞.國內外路面快速檢測技術的現狀與發展[J].中外公路,2003(6):95-99.
[9]張娟.基于數字圖像處理的路面裂縫自動識別與評價系統[J].長安大學學報,2004(2):18-22.
[10]付忠良.圖像閾值選取方法――OTSU方法的推廣[J].計算機應用,2000,20(5):37-39.