前言:中文期刊網精心挑選了計算機視覺的展望范文供你參考和學習,希望我們的參考范文能激發你的文章創作靈感,歡迎閱讀。
計算機視覺的展望范文1
關鍵詞:計算機;視覺檢測技術;原理;應用
中圖分類號:TP391.41
受到CIMS的推動和影響,諸多企業的發展趨勢逐步趨向于個性化以及自動化,這種大的發展趨勢間接的對我國的計算機輔助技術提出了更高的要求,計算機相關技術的發展面臨著更加嚴峻的挑戰。就現階段分析來看,計算機輔助檢測技術在現代諸多企業中得到了廣泛的應用。隨著柔性制造系統的不斷進步與發展,驅動圖像處理軟件、現場總線技術的日趨成熟,檢測系統的靈敏性、智能化特點愈發受到人們的關注,在這種大的發展趨勢之下,計算機視覺檢測技術得到了較快的發展。基于計算機視覺系統現已經廣泛應用于現場監控、工況監視等諸多環境之中。
1 關于對視覺技術的相關研究
1.1 基于計算機的視覺檢測技術的原理分析和探究
圖像技術主要指的就是通過各種途徑所實現的對圖像的獲取以及進一步的深入加工和處理技術。根據視覺檢測技術的抽象程度以及對圖像處理方式的不同,可以大致將圖像的處理和加工技術劃分為三個最主要的層次,這三個層次分別是圖像的加工處理、圖像的分析以及對于圖像的理解。將這三個層次進行進一步的結合,便是圖像工程。計算機視覺檢測技術是一門新興的計算機檢測技術,該技術建立在對計算機視覺研究的基礎之上,吸收和借鑒相關的研究成果,借助于傳感器來實施三維測量,進而有效獲得被測物體的空間具置信息,故而可以很好的滿足當代制造業的發展需求。區別于一般的圖像處理系統,計算機視覺檢測技術所獲取的相關數據信息更為精準和迅速,其環境適應性更強。
基于計算機的視覺檢測技術注重計算理論的輔導作用,以應用為目標進行視覺技術分析。自上世紀七十年代以來,我國關于對計算機視覺檢測技術的研究又取得了顯著的進步,并且逐步邁入更為實質性的研究階段,在該階段中,逐步開始從通過從多個角度(諸如光學角度、生理學角度以及投影射影角度等等)對其成像問題加以分析。以Marr為代表的專家更是建立了一些一般性的視覺性處理模型來輔助該技術的研究。
1.2 視覺檢測技術中傳感器的作用
在計算機的控制下配有相關的視覺檢測系統,在該視覺檢測系統中,主要有三個主要方面的主要作用:第一,對于視覺傳感器模型的分析以及確定;第二,進行圖像數據分散與整理的相關工作;第三,CAD模型的建立。傳感器的主要作用就是對測量棒材的多個截面進行分析,將所收集得到的數據經由圖像采集卡采集后,傳到相關的圖像處理系統中,進而進一步輔助準確的模型的建立。
2 基于計算機的視覺檢測技術的應用研究分析
2.1 基于計算機的視覺檢測技術的發展狀況研究
在研究的初步階段,相關技術人員借助于數字化的圖像處理技術,主要就是為了進一步提高所獲得的數字照片的清晰度和質量要求,進而更為精準、科學、規范的對照片所提供的信息加以辨別,為航空衛星圖片的讀取、識別和分類做準備。在這一系列的視覺工作中,其中最為主要和常見的工作主要是包括分類、識別判讀以及三維結構的構建。
基于計算機的視覺檢測技術借助于對計算機視覺技術,將所獲得的被觀察物品的相關信息加以信號轉換,并傳遞給圖像處理系統,圖像處理系統通過甄別和判斷不同照片像素的分布和亮度等訊息,將其進一步轉換成為數字化信號,接下來由計算機的圖像系統抽出符合目標特征的信號加以運算,對下一步的設備動作加以決定和執行。
就現階段而言,我國的計算機視覺檢測技術系統在諸多領域均有所應用,最為典型的領域諸如醫學的輔助診斷、機器人的感應系統、智能化的人機接口等均是建立在該技術的基礎之上。借助于計算機視覺技術這一手段,可以有效提高對產品檢測的效率,提高精準度,這種新型的視覺檢測技術相比較于傳統的人眼在流水線上的跟進,其具有顯著的優越性,其獲取測量結構迅速、檢測結果可以直接被觀察、可以進行自動識別以及定位準確和實時性的特點,這就很好的避免了由于人的一些主觀性因素所導致的誤差出現。
二十世紀以來,基于生物特性的計算機視覺檢測技術得到了空前的發展,具體表現在人臉識別、生硬識別、指紋識別以及虹膜的識別中,形式日趨靈活和復雜多變。借助于計算機的視覺檢測技術,可以有效對用戶的身份進行鑒定和識別、判定用戶的特殊信息等。除此之外,還可以將基于計算機的視覺識別技術逐步推廣到其他領域,如海關的安全檢查以及出口、入口的安全控制等領域。
2.2 基于計算機的視覺檢測技術的相關應用分析
2.2.1 數碼相機中所采用的圖像采集技術
視覺檢測技術的一個顯著特點就是有效提高了生產的柔性和自動化程度,本世紀以來,數碼相機憑借其高分辨率,快速成像、顯像,功能豐富多變以及性價比較高的特定風靡全球,逐步取代了傳統的照相機,傳統的照相機主要采用的是CCD 攝像頭,其主要的核心及時采集卡,顯然這種采集系統已經逐步落后于時展的腳步,現已逐步被淘汰。
2.2.2 微文字識別系統的相關研發和設計
隨著科學技術的不斷進步與發展,大規模集成電路得到了較快的進步,基于計算機的視覺檢測系統的成本得到了極大的降低,基于計算機視覺檢測技術的微文字識別系統的研發也被提到了日程中來。微文字識別系統的處理芯片大多是借助于數字信號處理芯片來實現圖像的識別,進而借助先進的語音合成技術將朗讀變為可能。此外,為了便于使用,該系統的體積被盡可能的縮小,并且可根據美觀度和實用性等設計為各種形狀。
2.2.3 特殊用紙水印在線檢測系統
基于計算機的視覺檢測技術可以在某一特定領域代替人的主觀判斷,諸如水印質量的自動檢測方面。區別于普通的工作人員,計算機可以實現長時間工作,對于誤差范圍的控制可以通過設置等實現,而且在計算機執行任務期間,所受到的客觀和主觀因素相對較少,這就極大程度上避免了由于人的因素所導致的失誤性操作,進而有效提高了工作效率以及檢測的精準度。這一優點,在水印質量標準的認定中具有十分重要的意義和作用,通過研發一定的程序和軟件,可以制定出一套操作性強、權威性較高的水印清晰度量化標準。
3 基于計算機的視覺檢測技術的發展展望
綜合分析來看,計算機視覺檢測技術現已有大約四十年的歷史,作為一種新興的檢測技術,該技術的顯著優越性不言而喻,該檢測技術以其高精度、反應靈敏迅速、智能化、自動化等特點被廣泛應用于諸多領域和行業之中,并取得了顯著的成,可以說,該技術具有十分廣闊的發展前景。但是,不可否認,基于計算機的視覺檢測技術并不是十分的成熟,在其設計和研發過程中仍然存在著諸多不足,而且視覺檢測技術是一項設計到心理、生理等多方面知識的復雜性技術,涉及領域眾多,更強大功能的實現需要人類知識的不斷拓展和延伸,因此,必須意識到該檢測技術發展道路上的困難和挑戰。
4 結束語
隨著科學技術的不斷進步與發展,經濟的發展對于新技術的研發提出了更高的挑戰,再者由于廣大人民群眾生活質量的不斷提高,對于生活水平也有了進一步的認識和了解?;谟嬎銠C的視覺檢測技術的研發和進步,無疑更好推動了高速發展的經濟,不斷滿足了人民群眾日益提高生活需求。由此來看,深入對視覺檢測技術的研究和探究無疑具有十分重要的作用,筆者衷心希望,以上關于對我國基于計算機的視覺檢測技術的相關探究能夠被相關負責人合理的吸收和采納,進而更好的推動科學技術的創新和進步,推動經濟的不斷進步與發展。
參考文獻:
[1]李旭港.計算機視覺及其發展與應用[J].中國科技縱橫,2010(06):42.
[2]張江明,張娟.淺談制造業中計算機視覺檢測技術的應用與發展[J].科技創新導報,2011(24):1.
計算機視覺的展望范文2
摘要:介紹了數據融合技術的基本概念和內容,分析了該技術在森林防火、森林蓄積特征的估計和更新、森林資源調查等方面的應用,提出該技術可應用于木材無損檢測及精確林業。融合機器視覺、X射線等單一傳感器技術檢測木材及木制品,可以更準確地實時檢測出木材的各種缺陷;集成GPS、GIS、RS及各種實時傳感器信息,利用智能決策支持系統以及可變量技術,能夠實現基于自然界生物及其賴以生存的環境資源的時空變異性的客觀現實,建立基于信息流融合的精確林業系統。
多傳感器融合系統由于具有較高的可靠性和魯棒性,較寬的時間和空間的觀測范圍,較強的數據可信度和分辨能力,已廣泛應用于軍事、工業、農業、航天、交通管制、機器人、海洋監視和管理、目標跟蹤和慣性導航等領域。筆者在分析數據融合技術概念和內容的基礎上,對該技術在林業工程中的應用及前景進行了綜述。
一、數據融合
1.1概念的提出
1973年,數據融合技術在美國國防部資助開發的聲納信號理解系統中得到了最早的體現。70年代末,在公開的技術文獻中開始出現基于多系統的信息整合意義的融合技術。1984年美國國防部數據融合小組(DFS)定義數據融合為:“對多源的數據和信息進行多方的關聯、相關和綜合處理,以更好地進行定位與估計,并完全能對態勢及帶來的威脅進行實時評估”。
1998年1月,Buchroithner和Wald重新定義了數據融合:“數據融合是一種規范框架,這個框架里人們闡明如何使用特定的手段和工具來整合來自不同渠道的數據,以獲得實際需要的信息”。
Wald定義的數據融合的概念原理中,強調以質量作為數據融合的明確目標,這正是很多關于數據融合的文獻中忽略但又是非常重要的方面。這里的“質量”指經過數據融合后獲得的信息對用戶而言較融合前具有更高的滿意度,如可改善分類精度,獲得更有效、更相關的信息,甚至可更好地用于開發項目的資金、人力資源等。
1.2基本內容
信息融合是生物系統所具備的一個基本功能,人類本能地將各感官獲得的信息與先驗知識進行綜合,對周圍環境和發生的事件做出估計和判斷。當運用各種現代信息處理方法,通過計算機實現這一功能時,就形成了數據融合技術。
數據融合就是充分利用多傳感器資源,通過對這些多傳感器及觀測信息的合理支配和使用,把多傳感器在空間或時間上的冗余或互補信息依據某些準則進行組合,以獲得被測對象的一致性解釋或描述。數據融合的內容主要包括:
(1)數據關聯。確定來自多傳感器的數據反映的是否是同源目標。
(2)多傳感器ID/軌跡估計。假設多傳感器的報告反映的是同源目標,對這些數據進行綜合,改進對該目標的估計,或對整個當前或未來情況的估計。
(3)采集管理。給定傳感器環境的一種認識狀態,通過分配多個信息捕獲和處理源,最大限度地發揮其性能,從而使其操作成本降到最低。傳感器的數據融合功能主要包括多傳感器的目標探測、數據關聯、跟蹤與識別、情況評估和預測。
根據融合系統所處理的信息層次,目前常將信息融合系統劃分為3個層次:
(l)數據層融合。直接將各傳感器的原始數據進行關聯后,送入融合中心,完成對被測對象的綜合評價。其優點是保持了盡可能多的原始信號信息,但是該種融合處理的信息量大、速度慢、實時性差,通常只用于數據之間配準精度較高的圖像處理。
(2)特征層融合。從原始數據中提取特征,進行數據關聯和歸一化等處理后,送入融合中心進行分析與綜合,完成對被測對象的綜合評價。這種融合既保留了足夠數量的原始信息,又實現了一定的數據壓縮,有利于實時處理,而且由于在特征提取方面有許多成果可以借鑒,所以特征層融合是目前應用較多的一種技術。但是該技術在復雜環境中的穩健性和系統的容錯性與可靠性有待進一步改善。
(3)決策層融合。首先每一傳感器分別獨立地完成特征提取和決策等任務,然后進行關聯,再送入融合中心處理。這種方法的實質是根據一定的準則和每個決策的可信度做出最優的決策。其優點是數據通訊量小、實時性好,可以處理非同步信息,能有效地融合不同類型的信息。而且在一個或幾個傳感器失效時,系統仍能繼續工作,具有良好的容錯性,系統可靠性高,因此是目前信息融合研究的一個熱點。但是這種技術也有不足,如原始信息的損失、被測對象的時變特征、先驗知識的獲取困難,以及知識庫的巨量特性等。
1.3處理模型
美國數據融合工作小組提出的數據融合處理模型,當時僅應用于軍事方面,但該模型對人們理解數據融合的基本概念有重要意義。模型每個模塊的基本功能如下:
數據源。包括傳感器及其相關數據(數據庫和人的先驗知識等)。
源數據預處理。進行數據的預篩選和數據分配,以減輕融合中心的計算負擔,有時需要為融合中心提供最重要的數據。目標評估。融合目標的位置、速度、身份等參數,以達到對這些參數的精確表達。主要包括數據配準、跟蹤和數據關聯、辨識。
態勢評估。根據當前的環境推斷出檢測目標與事件之間的關系,以判斷檢測目標的意圖。威脅評估。結合當前的態勢判斷對方的威脅程度和敵我雙方的攻擊能力等,這一過程應同時考慮當前的政治環境和對敵策略等因素,所以較為困難。
處理過程評估。監視系統的性能,辨識改善性能所需的數據,進行傳感器資源的合理配置。人機接口。提供人與計算機間的交互功能,如人工操作員的指導和評價、多媒體功能等。
二、多傳感器在林業中的應用
2.1在森林防火中的應用
在用MODIS(ModerateResolutionImagingSpectroradiometer)數據測定森林火點時的20、22、23波段的傳感器輻射值已達飽和狀態,用一般圖像增強處理方法探測燃燒區火點的結果不理想。余啟剛運用數據融合技術,在空間分辨率為1000m的熱輻射通道的數據外加入空間分辨率為250m的可見光通道的數據,較好地進行了不同空間分辨率信息的數據融合,大大提高了對火點位置的判斷準確度。為進一步提高衛星光譜圖像數據分析的準確性與可靠性,利用原有森林防火用的林區紅外探測器網,將其與衛星光譜圖像數據融合,可以使計算機獲得GPS接收機輸出的有關信息通過與RS實現高效互補性融合,從而彌補衛星圖譜不理想的缺失區數據信息,大大提高燃燒區火點信息準確度和敏感性。
2.2森林蓄積特征的估計
HampusHolmstrom等在瑞典南部的試驗區將SPOT-4×S衛星數據和CARABAS-IIVHFSAR傳感器的雷達數據進行了融合,采用KNN(knearestneighbor)方法對森林的蓄積特征(林分蓄積、樹種組成與年齡)進行了估計。
KNN方法就是采用目標樣地鄰近k個(k=10)最近樣地的加權來估計目標樣地的森林特征。研究者應用衛星光譜數據、雷達數據融合技術對試驗區的不同林分的蓄積特征進行估計,并對三種不同的數據方法進行誤差分析。試驗表明,融合后的數據作出的估計比單一的衛星數據或雷達數據的精度高且穩定性好。
2.3用非垂直航空攝像數據融合GIS信息更新調查數據
森林資源調查是掌握森林資源現狀與變化的調查方法,一般以地面調查的方法為主,我國5年復查一次。由于森林資源調查的工作量巨大,且要花費大量的人力、物力和資金。國內外許多學者都在探索航空、航天的遙感調查與估計方法。
TrevorJDavis等2002年提出采用非垂直的航空攝影數據融合對應的GIS數據信息實現森林調查數據的快速更新,認為對森林資源整體而言,僅某些特殊地區的資源數據需要更新。在直升飛機側面裝上可視的數字攝像裝置,利用GPS對測點進行定位,對特殊地區的攝像進行拍攝,同時與對應的GIS數據進行融合,做出資源變化的估計或影像的修正。
試驗表明,融合后的數據可以同高分辨率矯正圖像相比,該方法花費少,精度高,能充分利用影像的可視性,應用于偏遠、地形復雜、不易操作、成本高的區域,同時可避免遙感圖像受云層遮蓋。
三、數據融合在林業中的應用展望
3.1在木材檢測中的應用
3.1.1木材缺陷及其影響
木材是天然生長的有機體,生長過程中不可避免地有尖削度、彎曲度、節子等生長缺陷,這些缺陷極大地影響了木材及其制品的優良特性,以及木材的使用率、強度、外觀質量,并限制了其應用領域。在傳統木制品生產過程中,主要依靠人的肉眼來識別木材缺陷,而木材板材表面缺陷在大小、形狀和色澤上都有較大的差異,且受木材紋理的影響,識別起來非常困難,勞動強度大,效率低,同時由于熟練程度、標準掌握等人為因素,可能造成較大的誤差。另外在集成材加工中,板材缺陷的非雙面識別嚴重影響了生產線的生產節拍。因此必須開發一種能夠對板材雙面缺陷進行在線識別和自動剔除技術,以解決集成材加工中節子人工識別誤差大、難以實現雙面識別、剔除機械調整時間長等問題。
3.1.2單一傳感器在木材檢測中的應用
對木材及人造板進行無損檢測的方法很多,如超聲波、微波、射線、機械應力、震動、沖擊應力波、快速傅立葉變換分析等檢測方法。超聲技術在木材工業中的應用研究主要集中在研究聲波與木材種類、木材結構和性能之間的關系、木材結構及缺陷分析、膠的固化過程分析等。
隨著計算機視覺技術的發展,人們也將視覺傳感器應用于木材檢測中。新西蘭科學家用視頻傳感器研究和測量了紙漿中的纖維橫切面的寬度、厚度、壁面積、壁厚度、腔比率、壁比率等,同時準確地測量單個纖維和全部纖維的幾何尺寸及其變化趨勢,能夠區分不同紙漿類型,測定木材纖維材料加固結合力,并動態地觀察木材纖維在材料中的結合機理。
新西蘭的基于視覺傳感器的板材缺陷識別的軟件已經產業化,該軟件利用數碼相機或激光掃描儀采集板材的圖像,自動識別板材節子和缺陷的位置,控制板材的加工。該軟件還具有進行原木三維模型真實再現的計算機視覺識別功能,利用激光掃描儀自動采集原木的三維幾何數據。
美國林產品實驗室利用計算機視覺技術對木材刨花的尺寸大小進行分級,確定各種刨花在板中的比例和刨花的排列方向;日本京都大學基于視覺傳感器進行了定向刨花板內刨花定向程度的檢測,從而可以通過調整定向鋪裝設備優化刨花的排列方向來提高定向刨花板的強度。在制材加工過程中,利用計算機視覺技術在線實時檢測原木的形狀及尺寸,選擇最佳下鋸方法,提高原木的出材率。同時可對鋸材的質量進行分級,實現木材的優化使用;在膠合板的生產過程中,利用計算機視覺技術在線實時檢測單板上的各種缺陷,實現單板的智能和自動剪切,并可測量在剪切過程中的單板破損率,對單板進行分等分級,實現自動化生產過程。Wengert等在綜合了大量的板材分類經驗的基礎上,建立了板材分級分類的計算機視覺專家系統。在國內這方面的研究較少,王金滿等用計算機視覺技術對刨花板施膠效果進行了定量分析。
X射線對木材及木質復合材料的性能檢測已得到了廣泛的應用,目前該技術主要應用于對木材密度、含水率、纖維素相對結晶度和結晶區大小、纖維的化學結構和性質等進行檢測,并對木材內部的各種缺陷進行檢測。
3.1.3數據融合在木材檢測中的應用展望
單一傳感器在木材工業中已得到了一定程度的應用,但各種單項技術在應用上存在一定的局限性。如視覺傳感器不能檢測到有些與木材具有相同顏色的節子,有時會把木板上的臟物或油脂當成節子,造成誤判,有時也會受到木材的種類或粗糙度和濕度的影響,此外,這種技術只能檢測部分表面缺陷,而無法檢測到內部缺陷;超聲、微波、核磁共振和X射線技術均能測量密度及內部特征,但是它們不能測定木材的顏色和瑕疵,因為這些缺陷的密度往往同木板相同。因此,一個理想的檢測系統應該集成各種傳感技術,才能準確、可靠地檢測到木材的缺陷。
基于多傳感器(機器視覺及X射線等)數據融合技術的木材及木制品表面缺陷檢測,可以集成多個傳統單項技術,更可靠、準確地實時檢測出木材表面的各種缺陷,為實現木材分級自動化、智能化奠定基礎,同時為集裁除鋸、自動調整、自動裁除節子等為一身的新型視頻識別集成材雙面節子數控自動剔除成套設備提供技術支持。
3.2在精確林業中的應用
美國華盛頓大學研究人員開展了樹形自動分析、林業作業規劃等研究工作;Auburn大學的生物系統工程系和USDA南方林業實驗站與有關公司合作開展用GPS和其他傳感器研究林業機器系統的性能和生產效率。
目前單項的GPS、RS、GIS正從“自動化孤島”形式應用于林業生產向集成技術轉變。林業生產系統作為一個多組分的復雜系統,是由能量流動、物質循環、信息流動所推動的具有一定的結構和功能的復合體,各組分間的關系和結合方式影響系統整體的結構和功能。因此應該在計算機集成系統框架下,有效地融合GPS、GIS、RS等數據,解決這些信息在空間和時間上的質的差異及空間數據類型的多樣性,如地理統計數據、柵格數據、點數據等。利用智能DSS(決策支持系統)以及VRT(可變量技術)等,使林業生產成為一個高效、柔性和開放的體系,從而實現林業生產的標準化、規范化、開放性,建立基于信息流融合的精確林業系統。
南京林業大學提出了“精確林業工程系統”。研究包括精確林業工程系統的領域體系結構、隨時空變化的數據采集處理與融合技術、精確控制林業生產的智能決策支持系統、可變量控制技術等,實現基于自然界生物及其所賴以生存的環境資源的時空變異性的客觀現實,以最小資源投入、最小環境危害和最大產出效益為目標,建立關于林業管理系統戰略思想的精確林業微觀管理系統。
[參考文獻]
[1]高翔,王勇.數據融合技術綜述[J].計算機控制與測量,2002,10(11):706-709.
[2]龔元明,蕭德云,王俊杰.多傳感器數據融合技術(上)[J].冶金自動化,2002(4):4-7.
[3]錢永蘭,楊邦杰,雷廷武.數據融合及其在農情遙感監測中的應用與展望[J].農業工程學報,2004,20(4):286-290.
[4]高德平,黃雪梅.多傳感器和數據融合(一)[J].紅外與激光工程,1999,28(1):1-4.
計算機視覺的展望范文3
關鍵詞:多源圖像;融合技術;棉花;病蟲害;識別診斷
中圖分類號:TP391.43;S435.6 文獻標識碼:A 文章編號:0439-8114(2013)11-2555-03
隨著城市化進程不斷加快,從事農業勞作的勞動力總數急劇減少,農業生產與加工的逐步自動化是社會發展和進步的需求。特別是對于農作物病蟲害監測從傳統的根據農業部的病蟲害監測調查規范進行調查,通過人工調查、人工記錄,到微小昆蟲自動計數技術、昆蟲誘捕自動記錄裝置來對農作物病蟲害進行監測,這些信息收集和數據管理都存在勞動量大、效率低、數據誤差大的問題。隨著計算機技術和傳感器技術的快速發展,圖像融合技術在軍事、氣象、醫學、土地資源管理等方面得到了廣泛的應用,而如何將圖像融合技術應用在農作物病蟲害中是極具有研究價值的課題。
1 棉花病蟲害診斷技術研究意義及發展趨勢
棉花作為主要的經濟作物一直在中國和湖北省農業生產中占有重要地位,但由于品種、栽培制度、生態環境等變化及棉花生長環境日益惡化,病蟲害有不斷加重趨勢。危害棉花的主要病害有炭疽病、黑斑病、枯萎病、黃萎病等,炭疽病在長江流域棉區的發生尤為嚴重,一般苗期發病率為20%~70%,嚴重時可達90%;黑斑病在陰濕多雨年份往往猖獗流行,給棉花生產造成毀滅性災害;而枯萎病在棉區一直發生較多,死苗嚴重,造成的危害主要表現在產量降低,品質變劣方面;自上世紀80年代末枯萎病得到控制后,黃萎病上升為棉花第一病害。目前黃萎病發病面積達到全國棉田面積的50%以上,發病后棉苗減產30%~70%,有的甚至絕產,而且嚴重影響棉花品質。采用先進技術提高棉花病蟲害有效防治及控制已迫在眉睫。
1.1 棉花病蟲害診斷技術的研究意義
在進行植物保護和防治農作物病蟲害的各類方法中,化學防治是投入少、見效快、收效大的有效方法,特別是針對在大生態區域內可能暴發成災的重要病蟲草害,化學防治迄今仍是最快速而有效的方法,一般可以挽回15%~30%的農作物產量損失。使用農藥(各種殺菌劑、除草劑等)進行化學防治在世界各國一直占主導地位,它投入較少,防治迅速,特別是當大面積、暴發性病害發生時,只有化學防治才能取得較好的防治效果。同樣,在棉花病蟲害綜合防治中,化學防治仍然是及時有效地控制病蟲對棉花危害的最后一道把關防治措施。但長期大量使用農藥不僅污染環境,而且這些農藥會通過空氣、水等途徑進入人體,對人類的身體健康構成危害;又由于棉花病蟲害癥狀的復雜性和模糊性,農業生產者受個體素質和人為主觀因素的影響,往往不能正確合理地判斷病情,導致濫用農藥、化肥等引起更大的危害;此外,由于中國正步入老齡化社會,從事農業勞動的人口在減少,由勞動力不足帶來的農業減產問題已日趨嚴重。所以,精確作物病蟲害管理和機械化變量施藥技術的研究和應用勢在必行。為實現精確的棉花病蟲害管理和變量施藥,首先要能夠準確地識別棉花病蟲害種類及其危害程度。傳統的方法主要依靠生產者或專家經驗來判斷病蟲害原因及其危害程度,由于個體素質的差異以及其他因素的影響,往往很難做到對病蟲害做出精確定量分析和判斷,因而容易造成不合理的病蟲害防治,也對生產管理者的農技水平要求較高。一些智能決策支持系統雖然能識別診斷棉花病蟲害,但是過程復雜,不能進行實時處理。隨著信息技術、光譜技術和計算機視覺技術的發展使基于生物信息的作物病蟲害智能識別診斷成為可能。通過多源圖像融合技術快速準確地獲取棉花病蟲害信息,對已發生病蟲害的棉花區域根據病蟲害程度實行定量噴施農藥。這樣既可大量節省農藥,提高效率,降低成本,降低對勞動力的依賴,同時大幅度減輕農藥對農業生態環境的污染,提高棉花病蟲害防治水平。研究多源圖像融合技術對農作物病蟲害診斷具有重要的學術意義和經濟價值。
1.2 棉花病蟲害診斷技術發展趨勢
縱觀近幾年國內對作物病蟲害智能識別診斷的研究,目前對棉花作物病蟲害識別診斷主要集中在以專家系統為代表的智能化信息技術和光譜技術上,應用計算機視覺技術對棉花作物病蟲害識別的研究報道較少[1,2],而結合光譜技術和計算機視覺技術進行研究的則未見報道。目標的高分辨率和高識別率是對獲取目標信息的基本要求,僅僅利用可見光范圍或在近紅外范圍的計算機視覺技術進行作物病蟲害識別診斷,其單一光譜不足以準確、全面反映作物病蟲害的差異,還需利用其他生物信息對其補充和加強,以達到全面地反映作物病蟲害的差異[3]。
為了實現對低探測性目標的探測和識別,必須大力發展先進的目標探測系統,而由多源傳感器組成的光電成像系統是最為常見的目標探測系統。圖像融合就是利用各種成像傳感器得到的同一目標或同一場景的圖像,綜合這些不同圖像的冗余信息和互補信息,以獲得更為全面準確的圖像描述。為此,針對湖北省主要經濟作物棉花,綜合利用光譜技術、計算機視覺技術及多源信息融合技術,基于多源圖像信息(可見光和近紅外視覺圖像信息)融合棉花病害(炭疽病和黑斑?。┳R別診斷技術。深入研究作物在不同病蟲害危害下的反射光譜特性及變化規律,確定光譜敏感波段及其特征表現,提取可以有效表征作物不同病蟲害條件、不同危害程度下的計算機視覺圖像的灰度、紋理、形態特征信息和近地光譜特征信息,探索基于多傳感信息融合的病蟲害識別診斷方法,構建病蟲害智能識別系統,為精確作物病蟲害管理和機械化變量施藥技術提供理論基礎。
2 多源圖像融合技術
圖像融合[4]是對多幅源自同一場景的圖像進行綜合,以獲得更好的視覺效果和易于機器識別為目的,產生比單一信息源更為精確、更完善、更可靠的圖像。多源傳感器圖像是由成像機理不同的多種傳感器獲得的圖像。由于每種成像傳感器都是為了適應某些特定的環境和使用范圍而設計的,具有不同成像機理的多種傳感器獲得的圖像之間存在信息的冗余性和互補性,通過對其進行融合,能夠提高系統可靠性和圖像信息的利用率。隨著科學發展和技術進步,采集圖像數據的手段不斷完善,出現了各種新圖像獲取技術。如今圖像融合技術廣泛應用于圖像處理、遙感、計算機視覺以及軍事等領域[5]。利用圖像融合技術可以準確地獲取檢測數據,如在醫學圖像分析中的超聲成像、核磁共振、計算機層析、血液細胞自動分類計數、癌細胞識別等極大地提高了準確率[6,7];圖像融合技術在遙感雷達衛星的發展后,已成為遙感圖像處理和分析的重要研究熱點,應用于土地資源調查、環境監測、地形測繪等[8]。圖像融合技術應用在農業生產中,目前研究方向主要集中在對農產品的無損檢測和農作物生長態勢及產量評估方面。如采用互信息最佳閾值迭代優化分割法對可見光和近紅外圖像進行融合來對番茄成熟度進行無損檢測研究[9];通過加權平均融合法對紅外和可見光圖像實現對蘋果進行無損檢測研究[10];采用蟻群算法的模糊C均值聚類圖像分割算法的圖像融合技術對作物幾何參數進行測量。
多源傳感器圖像融合系統一般有3種類型:像素級融合、特征級融合和決策級融合。
2.1 像素級圖像融合
像素級圖像融合是通過對源圖像進行預處理和空間配準,對處理后的圖像采取適當的算法進行融合,得到融合圖像后再進行顯示和后續處理。簡單的像素級融合方法主要有:像素灰度值平均或加權平均,像素灰度值選大,像素灰度值選小。簡單的像素級融合方法結構簡單、易于實現,但應用范圍有限,融合結果不理想。故現在的融合方法多采用基于對源圖像的多尺度分解。這種分解方法是一種多尺度、多分辨率的圖像融合方法,是在不同尺度、不同空間分辨率、不同分解層上分別進行融合。這種融合方法能明顯改進融合效果[11]。
2.2 特征級圖像融合
特征級圖像融合是從不同的成像傳感器所獲得的同一對象圖像中提取一些特征,產生特征矢量,然后對這些特征矢量進行融合。特征級圖像融合是中間層的圖像融合,精度一般。其融合方法有基于假設前提及統計分析的方法和基于知識的方法。
2.3 決策級圖像融合
決策級圖像融合是最高層次的融合,是首先依據每一個成像傳感器所獲得的同一對象圖像各自進行預處理、特征提取、識別和判決后,做出獨立的決策,然后將這些獨立的決策綜合起來,給出最終決策。決策級圖像融合適合于多類不同傳感器圖像的融合,但融合結果精度較差。其融合方法有多重邏輯推理方法、統計方法、信息論方法等都可用于決策層的圖像融合。
特征級圖像融合和決策級圖像融合方法通常應用于某些特殊場合,像素級圖像融合的應用更普及,融合所得圖像更有利于人眼的判讀、欣賞和機器識別。對于已經配準好的圖像,像素級圖像融合方法不需要顯式地提取圖像特征,在速度和魯棒性上有明顯優勢。為此采取像素級圖像融合方法對農作物病蟲害的可見光和近紅外圖像進行融合處理,使其符合人類視覺特征,融合結果更有利于對圖像作進一步分析、理解和識別。
3 多源圖像融合技術對棉花病蟲害診斷的方法
1)在特定栽培條件下,培育不同棉花病蟲害的試驗樣本及正常的對比樣本。
2)對棉花病蟲害樣品的葉片和冠層進行光譜分析。利用便捷式光譜儀測量葉片和冠層的光譜,尋找棉花病蟲害種類的敏感光譜波段及其反射率特征,分析不同病蟲害種類和病蟲害程度的敏感光譜波段反射率特征的變化規律。
3)根據光譜分析結果,構建多源圖像計算機視覺采集系統,采集棉花作物樣本多光譜圖像,用VC或MATLAB編寫計算機圖像處理軟件對圖像進行處理和特征提取。
4)對所獲取的特征應用模糊特征優選、主成分分析(PCA)和獨立分量分析(ICA)進行優化組合和篩選,通過各種統計方法尋求作物病癥與特征對應關系。建立圖像特征與病種、病蟲害程度的關系模型,利用模式識別方法進行棉花病蟲害種類及程度的模式識別檢測試驗[12]。
4 展望
棉花是中國和湖北省主要的經濟作物,長期以來棉田病蟲害對棉花生產帶來極大危害,因此,對棉花病蟲害防治方法與技術的研究至關重要。對棉花作物病蟲害防治的各種方法中,傳統的方法是依靠人們的經驗確認病蟲害的發生時間、區域、種類和發生程度等,且是進行手工或機械噴灑農藥,這不僅勞動效率低,勞動成本高,而且常規施藥技術會帶來農藥利用率低下、水資源浪費、環境污染、農藥在作物及其產品中的殘留導致對人類的危害等。所以,結合光譜技術和計算機技術開展棉花病蟲害的識別診斷研究具有重要的學術意義和經濟價值。
參考文獻:
[1] 周小燕,史 巖,李道亮,等.棉花病蟲害診斷專家系統的研究與設計[J].萊陽農學院學報,2005,22(1):9-11.
[2] 嚴智燕,廖桂平,高必達.植物病蟲害防治中農業專家系統的研究進展[J].中國農學通報,2005,21(5): 415-417.
[3] YUTAKA S,TSUGUO O.Automatic diagnosis of plant disease recognition between healthy and diseased leaf[J].農業機械學會雜志,1999,61(2):119-126.
[4] 何 友,王國宏,陸大金,等.多傳感器信息融合及應用[M].北京:電子工業出版社,2000.
[5] 王 宏,敬忠良,李建勛.多分辨率圖像融合的研究與進展[J].控制理論與應用,2004,21(1):145-151.
[6] ZHENG Y F, ESSOCK E A, HANSEN B C.Advanced discrete wavelet transform fusion algorithm and its optimization by using the metric of image quality index[J].Optical Engineering,2005,44(3):1-12.
[7] 李秋華.基于紅外圖像信息融合的目標檢測和識別技術研究[D].長沙:國防科學技術大學,2002.
[8] 吉 微.多源氣象衛星圖像融合技術應用研究[D].南京:南京信息工程大學,2009.
[9] 李明喜.基于多源圖像融合的收獲目標準確定位研究[D].江蘇鎮江:江蘇大學,2008.
[10] 楊萬利,沈明霞,嚴 君.紅外圖像處理技術在蘋果早期淤傷檢測中的應用[J].計算機工程與設計,2010(1):149-152.
計算機視覺的展望范文4
10月21日,2016英特爾中國行業峰會在珠海召開,來自醫療、金融、交通、零售、能源、教育等行業的企業代表分享了他們對于數字化變革的理解與實踐。這本該是英特爾中國行業峰會的主旋律,但是實際是與會嘉賓對人工智能的話題表現出更大的熱情,有點喧賓奪主的味道。
得AI者得未來
2015年底,許多機構在展望2016年度科技領域時幾乎會不約而同地將人工智能列為重點方向之一?,F在來看,人工智能的火爆程度讓最樂觀的預測者都大跌眼鏡,這得歸結于AlphaGo的推波助瀾。
正如文章開始所說,人工智能的使命便是完成海量物聯網數據的商業價值轉化。根據相關預測,2021年,全球將會擁有18億臺PC,86億臺移動設備,157億臺物聯網設備。而到2035年,物聯網設備的數量將會超過1萬億臺,相應的數據數量將會增長2400倍,從1 EB增長到2.3ZB。如何有效管理、控制和利用如此浩瀚的數據,人工智能是解決之道。
所以說,得物聯網者得未來,而得人工智能者將執物聯網之牛耳。只有人工智能才能為“萬物互聯”之后的應用問題提供最佳的解決方案。
2016英特爾中國行業峰會上,英特爾與科大訊飛公司簽署合作備忘錄,雙方將在人工智能領域展開為期三年的基于英特爾至強處理器+英特爾至強融核處理器,以及英特爾至強處理器+FPGA為基礎的機器學習/深度學習研究項目??拼笥嶏w聯合創始人,訊飛研究院副院長王智國博士非常到位地點評了這一合作:“一直以來,我們雙方都致力于人工智能技術的創新和行業的推動,一方擅長底層計算架構,一方擅長算法及應用。我們期待雙方在人工智能技術上的深度合作能夠推動硬件和軟件的協同設計及優化,共同發現人工智能計算平臺創新的解決方案,推動人工智能產業的發展,并通過這些創新的技術支持更多行業用戶進行業務轉型?!?/p>
作為全球最大的半導體芯片制造商,英特爾的公司定位正在悄然發生變化。如今,英特爾將自己定位為“一家致力于驅動云計算和智能互聯計算的公司”??梢娙斯ぶ悄芤呀洺蔀橛⑻貭柟镜奈磥響鹇苑较蛑?。
人工智能對計算力資源的需求到底有多大,現在誰也無法預判,這就像是個“計算黑洞”。但有一點可以肯定,人工智能是高性能計算在現在和未來的進一步延展和進化,而這恰好是英特爾的優勢所在。
對英特爾而言,進入人工智能領域是水到渠成的事情,也是技術上的自然演進。從另一個角度看,物聯網和人工智能是歷史擺在英特爾公司面前一次前所未有機遇,其空間和舞臺遠大于PC時代和互聯網時代。送上門的蛋糕(要知道,當今世界90%以上的數據都是由英特爾處理器來承載的),豈能讓它從嘴邊溜走。
從資本到技術,從硬件到軟件
基于新的公司定位,英特爾開始從資本層面進行帝國的戰略布局。作為硅谷最大的企業風司,英特爾投資總裁Wendell Brooks 說“會把未來的投資聚焦于那些能夠更好拓展公司業務發展的領域”,人工智能毫無疑問是重中之重。
9月宣布將收購計算機視覺創業公司Movidius,后者致力于研發低功耗的計算機視覺芯片;8月將Nervana收入囊中,后者主攻半導體、軟件和AI深度學習技術;5月宣布將收購專注于計算機視覺技術開發的俄羅斯公司Itseez;4月收購意大利半導體功能性安全方案廠商Yogitech;2015年12月完成了對可編程邏輯器件廠商Altera的收購;2015年10月收購了人工智能公司Saffron Technology……
針對某一業務領域展開如此高密度地集中收購,無論是在英特爾公司歷史還是整個IT行業都是十分罕見的??梢?,英特爾布局人工智能的決心之大。
由于技術因素,專用領域的智能化是人工智能未來5到10年的主要應用方向,比如自動駕駛。在更遠的將來,隨著技術的進一步突破,通用領域的智能化有望實現。但無論是專用還是通用領域,人工智能都將圍繞“基礎資源-技術平臺-業務應用”這三層基本架構形成生態圈。
在人工智能上,英特爾能做些什么?僅僅是提供計算平臺嗎?當然不是,這從英特爾的瘋狂收購中也看得出。
計算機視覺的展望范文5
[關鍵詞] 數字圖像、編碼編碼方法
中圖分類號:TN131+.4 文獻標識碼:A 文章編號:
1 引言
數字圖像處理又稱為計算機圖像處理,它是指將圖像信號轉換成數字信號并利用計算機對其進行處理的過程。早期圖像處理的目的是改善圖像的質量,它以人為對象,以改善人的視覺效果為目的。圖像處理中,輸入的是質量低的圖像,輸出的是改善質量后的圖像。常見的圖像處理有圖像數字化、圖像編碼、圖像增強、圖像復原、圖像分割與圖像分析等。圖像編碼是對圖像信息進行編碼,可以壓縮圖像的信息量,以便滿足傳輸與存儲的要求。本文主要介紹了圖像編碼的基本原理和技術方法。
一幅二維數字圖像可以由一個二維亮度函數通過采樣和量化后而得到的一個二維數組表示。這樣一個二維數組的數據量通常很大,從而對存儲、處理和傳輸都帶來了許多問題,提出了許多新的要求。為此人們試圖采用對圖像新的表達方法以減少表示一幅圖像需要的數據量,這就是圖像編碼所要解決的主要問題。壓縮數據量的主要方法是消除冗余數據,從數學角度來講是要將原始圖像轉化為從統計角度看盡可能不相關的數據集。這個轉換要在圖像進行存儲、處理和傳輸之前進行,然后將壓縮了的圖像解壓縮以重建原始圖像,即通常所稱的圖像編碼和圖像解碼。
2 傳統編碼方法
傳統的編碼方法可以分成兩大類,預測編碼方法(對應空域方法)和變換編碼方法(對應頻域編碼方法)。預測編碼方法的優點是:算法一般較簡單,易于用硬件實現;缺點是:壓縮比不夠大,承受誤碼的能力較差。由于它采用的最小均方誤差準則不能反映人眼的視覺心理特性,近年來已較少單獨采用,而是與其他方法混合使用。另外,由于DPCM編碼系統會引起斜率過載、界線繁忙、顆粒噪聲和輪廓噪聲,在使用中應加以考慮。變換編碼方法的優點是:壓縮比高、承受誤碼能力強;缺點是:算法較復雜。
3 現代編碼方法
31 第二代圖像編碼方法
第二代圖像編碼方法[2]是針對傳統編碼方法中沒有考慮人眼對輪廓、邊緣的特殊敏感性和方向感知特性而提出的。它認為傳統的第一代編碼技術以信息論和數字信號處理技術為理論基礎,出發點是消除圖像數據的統計冗余信息,包括信息熵冗余、空間冗余和時間冗余。其編碼壓縮圖像數據的能力已接近極限,壓縮比難以提高。第二代圖像編碼方法充分利用人眼視覺系統的生理和心理視覺冗余特性以及信源的各種性質以期獲得高壓縮比,這類方法一般要對圖像進行預處理,將圖像數據根據視覺敏感性進行分割。
按處理方法的不同,第二代圖像編碼方法可分為兩種典型的編碼技術[3]:一種是基于分裂合并的方法,先將圖像分為紋理和邊緣輪廓,然后各自采用不同的方法編碼;另一種是基于各向異性濾波器的方法,先對圖像進行方向性濾波,得到不同方向的圖像信息,再根據人眼的方向敏感性對各個通道采用特定的方法單獨編碼。
32 分形圖像編碼
分形圖像編碼是在分形幾何理論的基礎上發展起來的一種編碼方法。分形理論是歐氏幾何相關理論的擴展,是研究不規則圖形和混沌運動的一門新科學。它描述了自然界物體的自相似性,這種自相似性可以是確定的,也可以是統計意義上的。這一理論基礎決定了它只有對具備明顯自相似性或統計自相似性的圖像,例如海岸線、云彩、大樹等才有較高的編碼效率。而一般圖像不具有這一特性,因此編碼效率與圖像性質學特性有關,而且分形圖像編碼方法實質上是通過消除圖像的幾何冗余來壓縮數據的,根本沒有考慮人眼視覺特性的作用。
33 基于模型的圖像編碼
基于模型的圖像編碼技術[4]是近幾年發展起來的一種很有前途的編碼方法。它利用了計算機視覺和計算機圖形學中的方法和理論,其基本出發點是在編、解碼兩端分別建立起相同的模型,針對輸入的圖像提取模型參數,或根據模型參數重建圖像。模型編碼方法的核心是建模和提取模型參數,其中模型的選取、描述和建立是決定模型編碼質量的關鍵因素。為了對圖像數據建模,一般要求對輸入圖像要有某些先驗知識。
基于模型的圖像編碼方法是利用先驗模型來抽取圖像中的主要信息,并以模型參數的形式表示它們,因此可以獲得很高的壓縮比。然而在模型編碼方法的研究中還存在很多問題,例如:①模型法需要先驗知識,不適合一般的應用;②對不同的應用所建模型是不一樣的;③在線框模型中控制點的個數不易確定,還未找到有效的方法能根據圖像內容來選?。虎苡捎诶媚P头▔嚎s后復原圖像的大部分是用圖形學的方法產生的,因此看起來不夠自然;⑤傳統的誤差評估準則不適合用于對模型編碼的評價。
34小波圖像編碼
一維連續小波變換可看成原始信號和一組不同尺度的小波帶通濾波器的濾波運算,從而可把信號分解到一系列頻帶上進行分析處理。將其離散化后即為離散小波變換。小波變換圖像編碼壓縮[6]的核心問題是要對子帶圖像進行小波分解系數的量化和編碼。低頻子帶圖像包含原圖像的大部分能量,即包含圖像的基本特性。它在圖像重構算法中起主導作用,對重建圖像的質量有很大影響,因此這部分信號應精確保留。
高頻子圖像的系數分布符合廣義高斯分布,對其系數進行粗量化編碼較為有效。這也完全符合人的視覺特性,根據對人眼視覺系統的研究可知,人眼視覺靈敏度具有明顯的低通特性,而且對不同方向上的敏感度也不一樣,尤其是對傾斜方向的刺激不太敏感,如人眼對對角線方向子圖像系數誤差敏感度較低,因此可對對角線方向子圖像進行粗量化高壓縮。
小波變換后的能量主要集中在低頻系數分量,而其他高頻系數分量大多為零值,這為高倍率壓縮提供了可能。通過選擇合適的具有平滑特性小波基,就可消除重建圖像中出現的方塊效應,減小量化噪聲,獲得較好的重建圖像質量。
小波變換圖像編碼壓縮方法可分為如下兩大類:基于傳統的圖像編碼方法和基于分形理論的小波變換圖像編碼方法。
基于傳統的圖像編碼方法[7]包括:零樹小波編碼、基于塔式網絡矢量量化的小波變換編碼、基于LBG算法的小波變換編碼、基于標量量化的小波變換編碼等。
由于不同分辨率級子圖像之間存在著相似性,因此,利用此相似性,可提高壓縮比[8]。J.M.Shapiro采用零樹自嵌套編碼方法,對小波分解系數進行壓縮,在PSNR=27.54dB的情況下,獲得壓縮比為128∶1。這是最著名的一種小波變換圖像編碼壓縮方法。該方法的優點是:與傳統的DCT編碼相比,它既可以克服方塊效應,又可以在低比特率下獲得較好的圖像主觀質量。缺點是:由于它對各子帶采用相同的門限量化,因此不能充分利用人眼的視覺特性,限制了圖像壓縮比的進一步提高。對此,A.Said等人提出了改進算法。
針對分形圖像編碼尚存在的缺點,如編碼算法的耗時、自然圖像不一定具有嚴格的分形結構而無法達到預期的高壓縮比、高壓縮倍率時的方塊效應等,有人提出了基于小波變換的分形編碼[9]。它具有以下特點:①采用平滑小波可去除傳統分形變換中存在的方塊效應;②小波表示使圖像的四叉樹分割十分自然;③可將零樹算法看成是該算法的一個特例。圖像經過金字塔形離散小波變換后的系數在小波域內可組成分層樹狀數據結構小波樹。這些跨越不同分辨率的小波樹之間存在一定的相似性,可通過分形變換來描述?;谛〔ㄗ儞Q的分形壓縮過程就是一個由分層樹狀結構的頂部開始一層層地向下預測其余系統的過程,而這個由上至下、由粗至細的預測過程是通過分形編碼來實現的?;谛〔ㄗ儞Q的圖像編碼壓縮的特點是[10]:壓縮比高、壓縮速度快,壓縮后能保持信號與圖像的特征不變,且在傳遞過程中就可以抗干擾。從現在的研究結果可看到,該方法已獲得了較好的編碼效果,是現代圖像壓縮技術研究的熱點之一,也是十分有前途的一種方法。
4結束語
本研究介紹了圖像編碼的基本原理,傳統的圖像編碼方法和幾種比較新的編碼方法。第二代圖像編碼將視覺特性引入到圖像編碼技術,分形圖像編碼是以分形幾何理論為基礎,基于模型的圖像編碼是利用了計算機視覺和計算機圖形學中的理論,而小波變換圖像編碼則引入了小波分析理論。盡管它們理論基礎不同,但它們均在不同情況下不同程度地提高了編碼質量。相比之下,小波變換圖像編碼是一種性能更佳的圖像編碼方法,僅從去除冗余信息的角度而言,它的性能就遠遠優于其他幾種編碼方法。另外,將小波變換與其他的新型編碼方法結合,也是小波圖像編碼方法的重要研究方向。
參考文獻
1 萬建偉,黃埔堪,周良柱,梁甸農圖像編碼技術的發展系統工程與電子技術,1996,5:31~38
2 張雪松,倪國強,周立偉,金偉其圖像編碼技術發展綜述光學技術,1997,3:37~41
3 曹寧,吳琰,馮曄模型基方法在圖像編碼中的應用與改進河海大學學報,1997,25(6):97~102
4 陳紅麗幾種新型的圖像編碼技術淮北煤師院學報,2001,22(2):28~30
5 吳謹圖像編碼與小波變換圖像編碼武漢科技大學學報(自然科學版),2000,23(3):289~292
6 陳雷霆,吉家成,傅志中,梁福成小波圖像編碼與JPEG圖像編碼的比較研究計算機應用,2000,20(增刊):273~277
7 唐良瑞小波圖像編碼技術的研究北方工業大學學報,2001,13(3):9~13
計算機視覺的展望范文6
關鍵詞:運動檢測;;相鄰幀差法;車輛視頻
中圖分類號:TP391文獻標識碼:A文章編號:1009-3044(2011)01-0187-02
Video-based Vehicle Motion Detection Method with
GONG Cheng-ying1,3, HE Hui2
(1.School of Electronic and Information Engineering, Lanzhou Jiaotong University, Lanzhou 730070, China; 2.School of Automation and Electrical Engineering, Lanzhou Jiaotong University,Lanzhou 730070, China; 3.Department of Electronic and Information Engineering,Lanzhou Polytechnic College, Lanzhou 730070, China)
Abstract: The purpose of motion detection is to detect moving objects in surveillance video quickly and accurately.This article introduces a common motion detection method,using library, achieve a vehicle motion detection methods with frame difference methods.The use of image intensity Absolute difference is greater than the threshold for detection to take,as a result,the method can quickly detect the moving objects in video sequences.
Key words: motion detection; ; frame difference; vehicle video
在車輛的運動視頻分析中,運動目標的檢測是研究的熱點問題之一,它直接影響車輛運動分析和跟蹤的精度。交通場景中的任何可察覺的運動都會體現在場景圖像流的變化上 ,檢測出運動目標的變化,就可以分析出其運動特性。基于視頻的車輛運動檢測的首要任務就是從視頻圖像序列中提取運動目標,過濾掉無用的靜止信息,為隨后的要進行的運動目標分析和跟蹤等奠定基礎[1]。對于如何從視頻中提取運動目標,有許多研究者進行了大量的研究工作,針對不同的環境,得到了多種適合不同情況的方法,但是由于環境中存在各種復雜因素(如天氣的變化、背景運動、陰影等),運動目標的檢測是一項比較困難的問題。
1 常見運動檢測方法
目前常用的運動目標檢測方法有三種:背景差法、相鄰幀差法和光流法[2]。
1.1 幀差法
相鄰幀差法是將運動圖像序列中相鄰的兩幀或三幀圖像相減 ,判斷所得圖像灰度差的絕對值是否大于所取閾值 ,以確定監控場景有無物體運動。這種檢測法一般不能完整提取出所有相關的特征像素點 ,但它對光照等場景變化不太敏感 ,能夠適應動態環境 ,而且運算簡單 ,檢測速度快 ,適用于實時性要求較高的監控環境。因此作為一種快速地判別是否有目標入侵算法基本原形常被應用。
1.2 背景差法
通過背景建模,利用相鄰序列圖像估計視頻中不變的背景,背景差法是將輸入圖像與背景模型進行比較,通過判定灰度等特征的變化,或用直方圖等統計信息的變化來判斷是否有異常情況發生。在背景已知的情況下,背景差法是一種有效的運動目標檢測方法,但是它易受光線、天氣等外界條件的影響。
1.3 光流法
光流是空間運動物體被觀測面上的像素點運動產生的瞬時速度場,包含了物體3D表面結構和動態行為的重要信息。當場景中有獨立的運動目標時,通過光流分析可以確定運動目標的數目、運動速度、目標距離、和目標的表面結構,光流法的優點是能夠檢測獨立運動的對象,不需要預先知道場景的任何信息 ,并且可用于攝像機運動的情況 ,但是由于噪聲、 多光源、 陰影、 透明性和遮擋性等原因 ,使得計算出的光流場分布不是十分可靠和精確;而且 ,多數光流法計算復雜、耗時多 ,除非有特殊的硬件支持 ,否則很難實現實時檢測。
2 基于的運動檢測
2.1 簡介
是一個用C#實現的開源框架,利用該框架,可以方便地對計算機視覺、機器學習、圖像處理、遺傳算法等領域的進行輔助研究,是一個不斷完善和發展的計算機視覺和圖像處理庫,目前的最新版本是2.1.4[3]。
2.2 檢測方法原理
在序列圖像中,通過逐像素比較可直接求取前后兩幀圖像之間的差別,假定照明等環境條件在多幀圖像間基本不變化,那么差圖像的不為零處標明該處的像素發生了移動。換句話說,對時間上相鄰的兩幅圖像求差可以將圖像中運動目標的位置和形狀變化突現出來,處理流程如圖1所示。
設在相鄰時刻ti和ti+1采集到幀,f(x,y,ti)和f(x,y,ti+1),
(1)
(2)
(1)、(2)式中bi(x,y)和bi+1(x,y)為i與i+1時刻的圖像背景,m(x,y)和m(x+Δx,y+Δy)分別為兩時刻的運動目標,ni(x,y)與ni+1(x,y)分別是序列在i與i+1時刻的噪聲[4]。
可得ti+1時刻與ti時刻的差圖像:
(3)
(3)式中,m(x+Δx,y+Δy)-m(x,y)為運動目標引起的圖像變化,bi+1(x,y)-bi(x,y)是背景差, ni+1(x,y)-ni(x,y)為殘留噪聲。根據噪聲的統計特性,可以用高斯分布對噪聲分布進行比較好的描述。從而進一步確定Tg為灰度閾值,當差圖像大于閾值時,認為有運動事件發生。
(4)[5]
(4)式中,Tg為灰度閾值,用來確定ti+1時刻與ti時刻圖像的灰度是否存在比較明顯的差異。差圖像為0的像素對應在前后兩時刻間沒有發生變化的地方;差圖像為1的像素對應兩圖像間發生變化的地方,通常是由于運動目標的運動而產生的。
2.3 檢測方法改進
實際情況中,由于隨機噪聲的影響,沒有發生像素移動的地方也會出現差圖像不為0的情況,為把噪聲的影響和像素的移動區分開來,可對差圖像取較大的閾值。對于慢速運動的目標而言,根據幀差法運動檢測的特點,可以采取加大幀間時間差的方法,以檢測出足夠的運動信息。
3 實驗
實驗用的主機配置是Intel Core Duo CPU P8700@2.53GHz,2G內存,視頻采集設備為USB2.0攝像頭Webcam,位置固定;程序在Microsoft Visual Studio 2008下以 庫為基礎實現,主要用到了的AForge.Vision.Motion庫,該庫包含了基本的運動檢測和處理算法類,通過實例化這些類,可以很容易的實現視頻中運動目標的檢測,這里用到的基本類有:
MotionDetector類:運動目標檢測的封裝類,執行各種運動檢測和處理算法。
TwoFramesDifferenceDetector類:用來實現幀差法運動檢測的算法類,默認的閾值Tg為15,也可以在的源碼中進行更改。
MotionAreaHighlighting類:將檢測到得運動區域進行高亮顯示的運動處理類。
VideoSourcePlayer控件:視頻播放控件,通過VideoSource屬性初始化并使用Start()方法播放視頻,通過NewFrame 事件進行新幀顯示前的處理。
……
// 定義運動目標檢測實例
MotionDetector detector = new MotionDetector(
new TwoFramesDifferenceDetector( ),
new MotionAreaHighlighting( ) );
……
//幀差法 運動檢測
detector.MotionDetectionAlgorthm = new TwoFramesDifferenceDetector( );
……
// 高亮顯示運動目標
detector.MotionProcessingAlgorithm = new MotionAreaHighlighting( ) ;[6]
……
圖2為檢測前的運動視頻,圖3是對車輛運動視頻進行檢測的結果,并對運動目標進行了高亮顯示,從而達到了運動檢測的基本目的,利用AForge的視頻運動庫,方便的實現基于幀差法的視頻檢測,AForge的視頻運動庫也提供了其他運動檢測的類,如背景差減運動檢測類等。
4 結語
本文利用類庫,基于幀差法對車輛運動目標進行實時檢測,實驗結果證明,利用可以很方便的實現運動目標的基本檢測功能,當然,基于C#的庫也存在一些問題,如占用系統資源較大,算法庫還不夠完備等, 庫是開放源碼并不斷發展的,在車輛運動檢測的研究過程中也可以對AForge的算法進行改進,對于更進一步的問題將在后續工作中繼續研究。
參考文獻:
[1] 代科學,李國輝,涂丹,等.監控視頻運動目標檢測減背景技術的研究現狀和展望[J].中國圖象圖形學報,2006(7):919-920.
[2] 章毓晉.圖像工程(中冊)[M].北京:清華大學出版社,2005:349-354.
[3] Andrew ::Framework[EB/OL].(2010-03-02)[2010-12-20]..
[4] 張睿萍.基于運動檢測的視頻監控系統[J].計算機與現代化,2008(10):27-29.