計算機視覺處理技術范例6篇

前言:中文期刊網精心挑選了計算機視覺處理技術范文供你參考和學習,希望我們的參考范文能激發你的文章創作靈感,歡迎閱讀。

計算機視覺處理技術

計算機視覺處理技術范文1

關鍵詞:雙目視覺;匹配算法;計算機視覺;立體匹配;相位一致性

1.計算機視覺系統分析研究

1.1計算機視覺技術及雙目立體視覺

計算機視覺是通過計算機技術實現對視覺信息處理的整個過程,是一門新的學科。視覺是人們認知事物的重要途徑,視覺是人們對視覺信息獲取、處理和存儲的過程。隨著計算機技術的發展,信號處理技術的應用,人們通過照相機來把實際的事物拍攝下來轉變為數字信息,并通過計算機信號處理技術隊獲取的視覺信號進行處理。計算機視覺技術對圖像的處理分為獲取圖像、特征抽象選取、事物識別及分類和對三維信息的理解。獲取圖像主要是通過攝像機和紅外線等技術對周圍視覺事物進行獲取,并通過計算得到和真實事物相應的二維圖像,二維圖像主要是數字圖像。計算機視覺系統的最基本的功能是數字圖像的獲取??梢钥闯鲇嬎銠C視覺研究最基本內容是三維場景距離信息的獲取。在計算機被動測量距離方法中,有一種重要的距離感知技術叫作雙目立體視覺。雙目立體視覺技術是其他計算機視覺技術無法取代的一種技術,對雙目立體視覺技術的研究在計算機視覺技術和工程應用方面都是非常重要的。

1.2計算機視覺理論框架

第一個視覺系統理論框架的提出是以信息處理為基礎,綜合了圖像處理和神經生理學等研究內容而建立的。這個視覺系統理論框架是計算機視覺系統的基本框架,與計算機視覺技術有著密切的關系。視覺系統的研究是以信息處理為基礎的,從理論層次、算法層次和硬件層次3個層次進行研究。計算機理論層次主要是表達系統各個部分計算的目的和方法,對視覺系統的輸入和輸出進行規定,輸入作為二維圖像,輸出是以二維圖像為基礎建立起來的三維物體,視覺系統的目的就是對三維物體進行分析和識別,通過計算對二維物置和形狀進行重新建立。算法層次對計算機規定的目標進行計算,算法和計算機表達有關,不同的表達可以通過不同的算法進行實現,在計算機理論的層次上,算法和表達比計算機理論的層次要低。硬件層次是通過硬件來實現算法的一種表達方法。計算機理論層次在計算機信息處理中時最高的層次,取決于計算機的本質是解決計算機的自身問題,不是取決于計算問題的計算機硬件。要更好地對計算機系統和框架進行理解最好的方法就是要區分3個不同的層次,計算機理論的含義和主要解決的問題是計算機的目的,表達算法含義和主要解決的問題是實現計算理論的方法和輸入輸出的表達,硬件的實現的含義和主要解決的問題是如何在物理上對表達和算法進行實現。計算機視覺處理的可以分為3個階段,對視覺信息的處理過程從最初的二維圖像的原始數據,到三維環境的表達。第一階段基元圖的構成,基元圖是用來表示二維圖像中的重要信息,主要是圖像中亮度變化位置及其幾何分布和組織結構,圖像中每點的亮度值包括零交叉、斑點、端點和不連續點、邊緣等。第二階段2.5維圖描述,在以觀測者為中心的坐標中,表示可見表面的方向、深度值和不連續的輪廓,基元是局部表面朝向離觀測者的距離深度上的不連續點表面朝向的不連續點。第三階段三維模型表示,在以物體為中心的坐標系中,有由體積單元和面積單元構成的模塊化多層次表示,描述形狀及其空間組織形式,分層次組成若干三維模型,每個三維模型都是在幾個軸線空間的基礎上構成的,所有體積單元或面積形狀基元都附著在軸線上。視覺理論框架圖如圖1所示。

2.基于計算機的視覺立體匹配算法研究

視覺立體匹配算法是基于人類視覺系統的一種計算機算法。立體匹配算法作為計算機立體視覺問題研究的重點,快速地實現圖像對應點的匹配來獲得視差圖是當今研究的熱點問題。立體視覺匹配算法根據基元匹配的不同可以分為相位匹配、區域匹配和特征匹配3種,其中區域匹配算法可以減少計算負擔,區域匹配算法實時性高,應用前景廣闊。計算機立體視覺通過對人的雙眼進行模仿,在雙眼的立體感知中獲得信息,從攝像機拍攝的圖像中獲取物體的三維深度信息,這就是深度圖的獲取,把深度圖經過處理得到三維空間信息數據,二維圖像到三維空間實現轉換。深度的獲取在雙目立體成像視覺系統中分為兩步,首先在雙目立體圖像與圖像之間建立點對點的對象關系,雙目立體視覺算法研究的重點問題是解決對應點之間的匹配問題。其次以對應點之間的視差為依據對深度值進行計算。雙目成像是獲取同一場景中兩幅不同的圖像,兩個單目成像模型構成一個雙目成像模型。雙目成像示意圖如圖2所示。系統的基線B是兩個鏡頭中心的連接線,空間點w(z,y,z)作為世界坐標的值由(x1,y1)與(x2,y2)進行確定,如果攝像機的坐標位置和空間點w世界坐標的位置重合,圖像平面和世界坐標軸xY的平面就是平行的。如果兩個攝像機在坐標系統中的原點不同但是它們的光軸平行,那么雙目成像計算人們可以看圖3所示,圖3表示的是兩個攝像頭連線在平臺xY的示意。

立體視覺的成像過程是成像的逆過程,具有一定的不確定性。大量的數據信息在從三維影像向二維圖像進行投影的過程會出現丟失的現象,所以視覺系統要通過自然的約束條件才能保證獲取正確的解。這些約束條件在減少匹配的計算量方面可以提供有利的幫助。針對基于區域匹配快速算法,還可以應用基于視差梯度的匹配算法,這種匹配算法應用較大的搜索范圍在邊緣的特征點上進行搜索,采用視差梯度在非邊緣區減少搜索范圍。應用計算機視覺立體匹配算法可以減少成像匹配時間,大大提高了工作效率。計算機立體匹配算法征點的提取是算法的關鍵問題,今后的研究方向重點是對有效特征點提取方法的研究。

計算機視覺處理技術范文2

近年來,經濟的發展和人們生活水平的提升也使得人們的出行更加便捷,越來越多的人都是自己駕車出行,這樣導致公路上的交通流量不斷增加,如何保障交通的順暢性和安全性成為人們關注的重點問題。信息技術的發展推動了計算機視覺技術的出現,為交通安全性的提升提供了一定的保障。本文主要對計算機視覺技術進行分析,進一步探討計算機視覺技術在智能交通系統中的應用。

【關鍵詞】計算機 視覺技術 智能交通 系統 應用

智能交通系統簡稱ITS,這是一種新型的交通管理系統。該系統主要結合了信息化技術、計算機技術以及數據傳輸技術等多種技術,用來對整個交通運輸體系進行管理,可以實現人、車、路的全面監控和管理。計算機視覺藝術作為智能交通系統中的一個重要環節,受到相關工作人員的高度重視。隨著計算機視覺技術的發展,不僅為交通行業的發展提供了更多的便捷,同時還能夠篩選道路交通的各種信息,進一步增強了智能交通系統的靈活性和準確性。

1 計算機視覺技術的概述

計算機視覺也被稱為圖像分析和圖解理解,其包括的理論主要有攝影幾何學、概率論、圖像處理理論以及人工智能理論等部分。計算機視覺技術主要是用二維投影圖像實現三維物體重構。這種技術的應用范圍比較廣泛,不僅應用于二維圖像識別方面,同時還用于三維物體的識別和重建上面。通過計算機視覺技術能夠獲取專業化的三維信息,對三維信息的獲取一般有兩種方法,其中一種是直接獲取法,還有一種是間接獲取法。直接獲取法主要是通過計算機視覺技術的效果來確定三維運動中產生的各種參數,這一過程對攝像機運動問題的關注程度較高;間接獲取的方式就是將單幅圖像和攝像機焦距相結合,來判斷被測量位置視覺上的信息。計算機視覺技術的關鍵就是實現特別匹配,在特殊情況下可以利用不同的攝像C同時收集運動信息,從而提高相關控制的精確度。

2 計算機視覺技術在智能交通系統中的應用

計算機視覺技術在智能交通系統中的應用可以實現道路交通的監控,同時還能夠實現自動收費、智能導航等功能,主要應用有以下幾個方面的內容。

2.1 交通監控中對計算機視覺技術的應用

基于計算機視覺技術的交通監控系統主要分為三個步驟,首先是對車輛和行人進行跟蹤和分割,其次是對車流量進行分析和計算,并且計算車輛的平均速度和道路上車輛的隊列長度,最后根據道路的交通狀況來規劃形式線路,從而有效緩解道路交通擁堵的現狀,方便人們減少出行時間。車輛和行人作為道路中運動的主要目標,在監控場合下,需要對運動時間進行有效分割,常用到的分割方式包括光流法和幀差法兩種,其中前一種分割方式主要是依據圖像中不同的運動用映射參數正確的表達,這樣可以將具有同樣映射參數的光流量進行分配,從而完成參數分割。計算機視覺在交通監控中的應用主要是對車輛速度、車輛數目、車輛分類進行檢測。隨著計算機通信技術的發展,計算機視覺技術也是日新月異,基于計算機視覺的交通監控系統具有較強的實時工作性,能夠快速的適應高度公路以及城市道路交通的監控。

2.2 車輛導航中對計算機視覺技術的應用

實現車輛的智能導航是計算機視覺技術在智能交通中應用的典型案例。這種技術主要為駕駛人員提供道路信息和車輛運行狀況兩大信息。通過車輛智能導航系統的運行能夠對道路兩邊的界限進行有效的識別,將車輛引向規定的行駛車道,在車輛行駛過程中,該系統能夠自動檢測車輛與前方其他車輛之間的距離,從而提醒駕駛人員保持車輛的安全距離,最終實現安全導航駕駛。通過該系統的攝像機運動能夠識別其他車輛的行駛狀況,并且通過計算檢測點的方式計算車輛的模擬匹配點。車倆智能導航系統中就使用了計算機視覺技術,可以從中提取相關信息,計算車輛行駛的安全距離和速度。

2.3 計算機視覺技術用于車輛輔助駕駛

計算機視覺技術在車輛輔助駕駛中的應用主要是幫助駕駛人員對外界的變化做出反應。具體表現為車輛在市內行駛時,計算機視覺技術的應用能夠識別周邊道路的標記,并且對交通標志、其他車輛和行人進行識別,然后篩選相關信息進行計算,讓駕駛人清楚外界的具體狀況,從而避開其他的車輛和行人,能夠從根本上減少交通事故的發生,增強車輛的安全運行。輔助駕駛的形式轉變為人機交互的方式,一定程度上能夠滿足駕駛人員對信息的需求。

2.4 計算機視覺技術用于車輛智能收費

車輛收費是車輛在公共交通位置行駛中的一個關鍵環節。隨著科學技術的發展,車輛收費系統逐漸向著計算機技術的應用方向發展,計算機視覺技術在各地區交通發展中的應用是現代化交通發展的一個重要突破口。很多地區的智能化收費都是通過識別車牌的方式來實現收費,我國在車牌識別這方面僅僅限制于單目車牌和雙目車牌的識別,其中單目車牌識別的核心就是將車牌照位置作為核心部分,我國大部分地區都是將單目系統作為核心部分來使用。采用雙目系統對車牌進行識別,也可以對車輛的型號進行識別,通過大量的實踐發現,雙目系統進行車牌識別的實用性較強。但是這種識別方式在實際應用過程中仍然存在著信息獲取難度大、車牌照定位難度大等多種問題,尤其是車輛在高速路上行駛時,對于車牌信息的獲取更為困難,因此,在這方面還需要加大研究和實踐。

3 結束語

隨著計算機視覺技術的智能化發展,其在智能交通系統中的應用能夠解決多方面的問題。該技術的應用不僅能夠實現車輛的實時監控,同時還能夠實現車輛導航以及車輛收費,幫助駕駛人員識別車輛行駛中存在的障礙物,這樣一來,可以增強車輛行駛的安全性,同時還能夠提高我國道路交通系統的整體管理水平。但是該技術應用中也存在不足之處,未來發展中需要降低視覺系統的價格,減少系統的尺寸,從而增強系統對車輛信息的處理速度,最終實現對道路交通的全面監測。

參考文獻

[1]王春波,張衛東,許曉鳴.計算機視覺技術在智能交通系統中的應用[J].測控技術,2000(05):22-24.

[2]郁梅,蔣剛毅,郁伯康.智能交通系統中的計算機視覺技術應用[J].計算機工程與應用,2001(10):101-103+121.

[3]顧晶. 基于計算機視覺的智能交通監控系統的研究[D].東南大學,2006.

[4]謝萍萍,黃傳春.計算機視覺技術在智能交通系統中的應用[J].福建電腦,2008(10):77+133.

計算機視覺處理技術范文3

關鍵詞:數字攝影測量 計算機視覺 多目立體視覺 影像匹配

引言

攝影測量學是一門古老的學科,若從1839年攝影術的發明算起,攝影測量學已有170多年的歷史,而被普遍認為攝影測量學真正起點的是1851―1859年“交會攝影測量”的提出。在這漫長的發展過程中,攝影測量學經歷了模擬法、解析法和數字化三個階段。模擬攝影測量和解析攝影測量分別是以立體攝影測量的發明和計算機的發明為標志,因此很大程度上,計算機的發展決定了攝影測量學的發展。在解析攝影測量中,計算機用于大規模的空中三角測量、區域網平差、數字測圖,還用于計算共線方程,在解析測圖儀中起著控制相片盤的實時運動,交會空間點位的作用。而出現在數字攝影測量階段的數字攝影測量工作站(digital photogrammetry workstation,DPW)就是一臺計算機+各種功能的攝影測量軟件。如果說從模擬攝影測量到解析攝影測量的發展是一次技術的進步,那么從解析攝影測量到數字攝影測量的發展則是一場技術的革命。數字攝影測量與模擬、解析攝影測量的最大區別在于:它處理的是數字影像而不再是模擬相片,更為重要的是它開始并將不斷深入地利用計算機替代作業員的眼睛。[1-2]毫無疑問,攝影測量進入數字攝影測量時代已經與計算機視覺緊密聯系在一起了[2]。

計算機視覺是一個相對年輕而又發展迅速的領域。其目標是使計算機具有通過二維圖像認知三維環境信息的能力,這種能力將不僅使機器能感知三維環境中物體的幾何信息,包括它的形狀、位置、姿態、運動等,而且能對它們進行描述、存儲、識別與理解[3]。數字攝影測量具有類似的目標,也面臨著相同的基本問題。數字攝影測量學涉及多個學科,如圖像處理、模式識別以及計算機圖形學等。由于它與計算機視覺的聯系十分緊密,有些專家將其看做是計算機視覺的分支。

數字攝影測量的發展已經借鑒了許多計算機視覺的研究成果[4]。數字攝影測量發展導致了實時攝影測量的出現,所謂實時攝影測量是指利用多臺CCD數字攝影機對目標進行影像獲取,并直接輸入計算機系統中,在實時軟件的幫助下,立刻獲得和提取需要的信息,并用來控制對目標的操作[1]。在立體觀測的過程中,其主要利用計算機視覺方法實現計算機代替人眼。隨著數碼相機技術的發展和應用,數字近景攝影測量已經成為必然趨勢。近景攝影測量是利用近距離攝影取得的影像信息,研究物體大小形狀和時空位置的一門新技術,它是一種基于數字信息和數字影像技術的數據獲取手段。量測型的計算機視覺與數字近景攝影測量的學科交叉將會在計算機視覺中形成一個新的分支――攝影測量的計算機視覺,但是它不應僅僅局限于地學信息[2]。

1. 計算機視覺與數字攝影測量的差異

1.1 目的不同導致二者的坐標系和基本公式不同

攝影測量的基本任務是嚴格建立相片獲取瞬間所存在的像點與對應物點之間的幾何關系,最終實現利用攝影片上的影像信息測制各種比例尺地形圖,建立地形數據庫,為各種地理信息系統建立或更新提供基礎數據。因此,它是在測繪領域內發展起來的一門學科。

而計算機視覺領域的突出特點是其多樣性與不完善性。計算機視覺的主要任務是通過對采集的圖片或視頻進行處理以獲得相應場景的三維信息,因此直到計算機的性能提高到足以處理大規模數據時它才得到正式的關注和發展,而這些發展往往起源于其他不同領域的需要。比如在一些不適合于人工作業的危險工作環境或人工視覺難以滿足要求的場合,常用計算機來替代人工視覺。

由于攝影測量是測繪地形圖的重要手段之一,為了測繪某一地區而攝影的所有影像,必須建立統一的坐標系。而計算機視覺是研究怎樣用計算機模擬人的眼睛,因此它是以眼睛(攝影機中心)與光軸構成的坐標系為準。因此,攝影測量與計算機視覺目的不同,導致它們對物體與影像之間關系的描述也不同。

1.2 二者處理流程不同

2. 可用于數字攝影測量領域的計算機視覺理論――立體視覺

2.1 立體視覺

立體視覺是計算機視覺中的一個重要分支,一直是計算機視覺研究的重點和熱點之一,在20多年的發展過程中,逐漸形成了自己的方法和理論。立體視覺的基本原理是從兩個(或多個)視點觀察同一景物,以獲取在不同視角下的感知圖像,通過三角測量原理計算像像素間的位置偏差(即視差)來獲取景物的三維信息,這一過程與人類視覺的立體感知過程是類似的。一個完整的立體視覺系統通??煞譃閳D像獲取、攝像機定標、特征提取、影像匹配、深度確定及內插等6個大部分[5]。其中影像匹配是立體視覺中最重要也是最困難的問題,也是計算機視覺和數字攝影測量的核心問題。

2.2 影像匹配

立體視覺的最終目的是為了恢復景物可視表面的完整信息。當空間三維場景被投影為二維圖像時,同一景物在不同視點下的圖像會有很大不同,而且場景中的諸多因素,如光照條件,景物幾何形狀和物理特性、噪聲干擾和畸變以及攝像機特性等,都被綜合成單一的圖像中的灰度值。因此,要準確地對包含了如此之多不利因素的圖像進行無歧義的匹配,顯然是十分困難的。

在攝影測量中最基本的過程之一就是在兩幅或者更多幅的重疊影像中識別并定位同名點,以產生立體影像。在模擬攝影測量和解析攝影測量中,同名點的識別是通過人工操作方式完成的;而在數字攝影測量中則利用計算機代替人工解決同名點識別的問題,即采用影像匹配的方法。

2.3 多目立體視覺

根據單張相片只能確定地面某個點的方向,不能確定地面點的三維空間位置,而有了立體像對則可構成與地面相似的立體模型,解求地面點的空間位置。雙目立體視覺由不同位置的兩臺或者一臺攝像機(CCD)經過移動或旋轉拍攝同一幅場景,就像人有了兩只眼睛,才能看三維立體景觀一樣,然后通過計算空間點在兩幅圖像中的視差,獲得該點的三維坐標值?,F在的數字攝影測量中的立體像對技術通常是在一條基線上進行的,但是由于采用計算機匹配替代人眼測定影像同名像對時存在大量的誤匹配,使自動匹配的結果很不可靠。其存在的問題主要是,對存在特殊結構的景物,如平坦、缺乏紋理細節、周期性的重復特征等易產生假匹配;在攝像機基線距離增大時,遮擋嚴重,能重建的空間點減少。為了解決這些問題,降低雙目匹配的難度,自1986年以來出現了三目立體視覺系統,即采用3個攝像機同時攝取空間景物,通過利用第三目圖像提供的信息來消除匹配的歧義性[5]。采用“多目立體視覺技術”可以利用攝影測量的空中三角測量原理,對多度重疊點進行“多方向的前方交會”,既能較有效地解決隨機的誤匹配問題,同時又能增加交會角,提高高程測量的精度[2]。這項技術的應用,將很大程度地解決自動匹配結果的不可靠性,提高數字攝影測量系統的準確性。

計算機視覺處理技術范文4

關鍵詞: 計算機視覺;快速開發;框架;模塊化;模塊耦合;底層剝離

中圖分類號:TP311 文獻標識碼:A 文章編號:1009-3044(2012)29-7084-04

在視覺分析實際應用項目中,如何通過建立計算機視覺分析快速開發框架,搭建一個分工明確,快捷有效的圖像學應用處理平臺,提高開發效率,縮短開發時間,已成為項目開發人員關注的重點內容之一。本框架從項目應用和實際需求出發,將計算機視覺技術的核心算法從底層研究工作中剝離,可極大的縮短開發時間,提高開發效率。

在本框架下,開發人員可各司其職,分工、構成和職能劃分明確,框架開發人員只專注于框架接口的定義;算法開發人員只專注于圖像處理與識別等算法的開發;上層應用開發人員只負責抽取出一般的處理流程,專注于項目的具體實現和功能模塊的組合應用。

1 研究與應用

1.1背景

計算機視覺是用攝像機和電腦代替人眼對目標進行識別、跟蹤和測量的機器視覺。系統將獲取的視頻或圖像資料,通過計算機處理成為更適合人眼觀察或傳送給儀器檢測的圖像,其中包括圖像處理、模式識別或圖像識別、景物分析、圖像理解等相關內容,它們之間既有差別,又有相互重疊。

在計算機視覺分析技術中,對于一些復雜的問題,往往不是某單一學科能夠解決的,它需要一系列相關技術的支持。例如:對航道中船舶的識別,獲取的視頻流往往要經過平滑、去噪等圖像處理操作后,便于下一步運用基于直方圖分類器的圖像識別算法來區分船舶和水面,通過圖像分割技術來提取檢測目標。而這些方案的實現中,同一個問題的解決又往往需要有一系列的算法來支持。還是以船舶識別為例,圖像平滑有領域平均、低通濾波等算法;圖像去噪有各種濾波器算法;基于直方圖的分類器也存在決策樹、貝葉斯、SVM等等算法。雖然上述的算法本身沒有優劣之分,但在特定的環境下一定會有某個最佳算法。

因此,在實際應用項目中如何找出其最優路徑,除了需要開發者擁有深厚的圖像學功底,更需要的是通過大量的對比實驗來找出該最優路徑的解決方案。即便如此,也只能解決特定環境下的計算機視覺需求,換個應用場景,上述步驟又需要重新進行,此類過程的重復,既增加了開發成本,又延長了開發時間。

本框架從工程化的角度出發,在不同項目中的計算機視覺軟件開發中,研究如何提高開發結果的復用性,盡量降低上述各條件間的相互依賴關系,將視覺技術的核心算法從底層研究中剝離,達到縮短開發時間,提高開發效率的目的。

1.2研究目標

1) 框架系統的扁平化、模塊化;

2) 完成處理過程的任意組合,使圖像處理模塊單一化;

3) 理行為在處理模塊內部完成,處理結果可通過接口方式進行輸出;

4) 處理模塊間的數據流動定義在框架之中,框架負責配置數據流;

5) 置好的數據流,通過指定圖像處理模塊實現對物體的識別、行為的識別。

1.3.5框架的效果演示

從右側功能區中選取兩個輸入模塊:MediaOpen00和MediaOpen01,分別打開視頻文件“.\公司監控視頻.avi”和圖片“.\Lena.jpg”,任意添加一些圖像處理模塊或者圖像識別模塊,這里我們選取了行人檢測算法、基本全局閾值二值算法、人臉檢測算法、輪廓檢測算法,加入輸出展示模塊用于顯示處理結果。最后我們用曲線將模塊間的輸入輸出點連起來,完成數據流向的配置過程。其中一個輸出點可以連接多個輸入點,但一個輸入點只能接入一個輸出點。

2 結論

隨著計算機視覺技術發展的日新月異,算法的更新和積累將會越來越多。計算機視覺快速開發框架從實際應用工程的角度出發,在不同項目計算機視覺軟件的開發過程中,將視覺技術的核心算法從底層研究中剝離,使視覺分析應用項目中的框架開發人員專注于框架接口定義的開發,而項目中的算法、上層應用等開發人員各司其職,分工明確,不但提高了開發結果的復用性,同時,也降低了項目開發中各條件間的相互依賴關系,縮短了開發時間,提高了開發效率。

參考文獻:

[1] Gary bradski,Adrian Kaebler.《Learning OpenCV》[M].O’Reilly Media Inc,2008.

[2] 張廣軍.機器視覺[M].北京:科學出版社,2005.

[3] 張少輝,沈曉蓉,范耀祖.一種基于圖像特征點提取及匹配的方法[J].北京航空航天大學學報,2008,34(5).

[4] 劉立,彭復員,趙坤,萬亞平.采用簡化SIFT算法實現快速圖像匹配[J].紅外與激光工程,2008,37(1).

[5] 戴斌,方宇強,孫振平,王亮.基于光流技術的運動目標檢測和跟蹤方法研究[D].國防科學技術大學機電工程與自動化學院.

[6] 陳勝勇,劉盛.基于OpenCV的計算機視覺技術實現[M].科學出版社.

計算機視覺處理技術范文5

1計算機視覺概述

1.1計算機視覺學概述

從某種意義上說,計算機視覺學是一門在20世紀60年代興起的新學科。它是一門邊緣學科,融入了很多學科的特點,具有很強的工程性特征。比如,圖像處理、應用數學、光電技術。換個角度來說,計算機視覺同屬于工程領域、科學領域。

1.2計算機視覺的應用

計算機視覺的應用能夠使計算機具有和人一樣的視覺功能。在生活和生產過程中,照片資料、視頻資料的處理是計算機視覺應用的主要方面。比如,在航空事業方面,對衛星照片的翻譯;在醫學領域中,主要用于輔方面的診斷;在工業生產方面,由于各種復雜因素的影響,計算機視覺在這方面的應用顯得特別簡單,有利于相關系統的實際構成。

2目標圖像檢索存在的問題

從某種角度來說,目標圖像檢索需要分為特征匹配、特征提取兩個方面。它們表達了不同的含義。對于特征提取來說,它是圖像進行檢索的第一步,其提取結果會對進一步的研究造成直接的影響。而對于特征匹配來說,其匹配的準確度會直接影響圖像檢索系統的返回結果。但在目標圖像檢索完善的過程中,遇到一些問題阻礙了這兩個方面的完善。因此,本文作者對其中的一些予以了相關的探討。

2.1環境因素不斷變化

對于目標圖像來說,環境因素是影響其準確率的重要因素。同時,在復雜混亂的環境中,由于受到眾多干擾物的影響,加上部分目標圖像區域被遮蓋,致使目標圖像信息不夠全面,使目標物體特征的提取難度進一步加大。

2.2圖像噪聲的影響

子為了更好地模仿生活中的圖像檢索,數據庫中的圖像也會隨之發生一系列的變化。比如,尺度、角度、光照。而其中圖像噪音的影響會使目標物體的外觀發生對應的變化。在此基礎上,嚴重降低了目標圖像信息獲取的準確度。

2.3目標圖像檢索訓練數據的自動標注

由于處于網絡中的圖像資源信息過于繁多,需要采用手工的方式對它們進行標注。但這種方法非常浪費時間,準確率也比較低。很顯然,這就需要目標檢索圖像能夠具有自動標注的能力。實際上,圖像檢索方法過分依賴人工標注信息。而這些信息很多收到來自各方面因素的影響。比如,認識差異因素、個人經驗。以至于對圖像產生誤解。

3基于計算機視覺下的目標圖像檢索技術

3.1以多尺度視覺為紐帶的目標圖像檢索方法

該種目標檢索技術的應用主要是為了提高目標圖像檢索的準確率,能夠實現目標圖像訓練數據的自動化標注。該類技術主要是用于那些沒有遮擋,不需要進行監督的目標圖像檢索方面。具體來說,它需要經過一系列的訓練。在訓練的過程中,以統計學習為紐帶,對相應多尺度的目標檢測模型進行適當的訓練。在此基礎上,以該模型為基點,對圖像中那些顯著性的區域進行合理地提取。比如,該區域的亮度、顏色。最后,需要對用于該實驗研究中的概率潛在語義分析模型進行合理地利用??傊眠@種檢索方法可以對圖像中那些顯著目標所處的區域自動進行檢測。同時,對其中目標圖像的顯著性進行合理地排序,能夠提高檢索引擎所返回圖像結果的準確度。

3.2以彩色LBP局部紋理特點為媒介的目標圖像檢索方法

這種目標圖像檢索方法能夠有效地解決圖像信息采集過程圖像噪聲以及其它相關因素對所提取紋理特征的影響,提高了圖像目標的準確率。對于這種圖像目標檢索方法來說,它把圖像彩色空間特征和簡化的LBP特征有機地相融合。在此基礎上,該類方法增加了光照的不變特性,卻保留了LBP局部的旋轉特點。在提高圖像檢索速度方面,主要是利用原來的LBP特征來丟失其中的彩色信息。以此,使其中的特征維度能夠在一定程度上降低。同時,這種目標圖像檢索方法的應用可以使對應計算方法的難度得以降低,還能對角度等變化狀態下的目標圖像進行準確地識別以及檢索。

3.3以視覺一致性為橋梁的目標圖像檢索方法

從某個角度來說,它的應用主要是為了提高圖像搜索引擎的返回效果,使局部噪聲圖形具有更高的顯著性特征。一是:站在客觀的角度,對搜索引擎返回結果的目標顯著圖予以準確的計算。此外,還要對其中的目標顯著系數進行適當地過濾。二是:以所有圖像為基點,以顯著目標為導向,采取視覺一致性的模式。三是:以視覺一致性為基礎,對其中的不同目標圖像信息進行客觀地分類。這種以視覺一致性為核心的方法能夠有效地提高圖像檢索結果的準確率。更重要的是,在提高圖像搜索引擎檢索性能的同時,能夠及時為用戶選出最優的圖像信息。而這些信息資源和用戶尋找的主題信息密切相關。

4結語

計算機視覺處理技術范文6

關鍵詞:計算機視覺;地圖匹配;SLAM;機器人導航;路徑規劃

1概述

計算機視覺在人工智能學科占據重要地位,為自主移動機器人視覺導航做了深厚的理論鋪墊。目前,機器人導航技術有很多種,傳感器導航技術如里程計、激光雷達、超聲波、紅外線、微波雷達、陀螺儀、指南針、速度、加速度計或觸覺等得到了普遍應用,與上述非計算機視覺導航技術相比較,計算機視覺導航技術如人眼般具有靈敏度高且可捕獲的信息量大以及成本低等優點。由于室內相對室外空間比較狹小且內部環境復雜,所以普通移動機器人在作業過程中,完成躲避眼前障礙物、自主導航以及為自身找出一條可行路徑等一系列操作會相對比較困難。計算機視覺導航技術可利用本身的攝像頭獲得室內周圍的環境信息,實時對其周身的場景進行快速反饋,對視野前方障礙物進行快速識別和檢測,從而確定一條高效的可行的安全路徑。本文對計算機視覺導航技術進行分類研究,主要分為3類:第一類是環境地圖事先已知,提前對外界環境特征進行提取和處理,建立全局地圖,并將地圖信息存儲在機器人內存數據庫中,在導航的時候實時進行地圖匹配;第二類是同時定位與地圖構建,移動機器人在自身位置不確定的情況下根據自身的攝像頭獲取周圍未知環境信息,在作業時逐步構建周圍的環境地圖,根據構建的增量式地圖自主實時定位和導航;第三類是不依賴環境地圖,自主移動機器人不需要依賴任何的環境地圖,其在作業活動時的可行區域主要取決于攝像頭實時識別和檢測的環境相對信息。

2環境地圖的表示方法

目前,計算機視覺導航技術多采用柵格地圖、幾何地圖、拓撲地圖和混合地圖構建環境地圖信息。

2.1柵格地圖

柵格地圖,將柵格圖像考慮為一矩形,均分為一系列柵格單元,將每個柵格單元賦予一個平均概率值,并利用傳感信息估計每個單元內部內存障礙物的概率。構建柵格地圖的優點是其地圖表達形式直觀,創建和維護比較容易;但當劃分的柵格單元數量不斷增多時,實時性就會慢慢變差;當劃分的柵格單元越大時,環境地圖的分辨率越低。

2.2幾何地圖

幾何地圖利用幾何特征如點、直線、平面等來構成環境主要框架,需要知道這些特征在環境中信息的具置,所以幾何地圖通常使用其對應的三維空間坐標來表示。幾何地圖構建過程相對簡單,保留了室內環境的各種重要信息,是基于計算機視覺的定位與地圖構建算法中最常用的一種表示方式。但是為了完成環境的建模需要標記大量的特征,從而計算量也非常的大,降低了實時性,其重建的地圖也容易出現與全局不一致的情況。

2.3拓撲地圖

拓撲地圖用許多節點和連接這些節點的曲線來表示環境信息。其中,每個節點相對應真實環境中的特征點(如門角、窗戶、椅子、桌子角及拐角等),而節點之間的曲線表示兩個節點對應的地點是相聯通的。拓撲地圖把環境信息表上在一線圖上,不需要精確表示不同節點間的地理位置關系,圖像較為抽象,表示起來方便且簡單。機器人首先識別這些節點進而根據識別的節點選擇節點與節點間的曲線作為可作業的路徑。

2.4混合地圖

混合地圖主要包括3種形式:柵格一幾何地圖、幾何一拓撲地圖以及柵格一拓撲地圖。混合地圖采用多種地圖表示,可結合多種地圖的優勢,與單一的地圖表示相比更具有靈活性、準確性和魯棒性,但其不同類別的地圖結合起來管理會比較復雜,難以協調,增加了地圖構建的難度。文獻針對室內環境所建立的模型分為全局拓撲和局部幾何表述部分,整體環境通過拓撲節點串連起來,維護了整體環境表述的全局一致性;而以每個拓撲節點為核心所采用的幾何表述則可確保局部精確定位的實現,這樣建立的幾何一拓撲混合環境模型可將二者的優勢都表現出來,使得移動機器人定位和地圖構建同時進行,實現容易。

3基于計算機視覺的室內導航

基于計算機視覺的室內導航技術可利用攝像頭捕獲機器人周圍環境的全部信息,對其周身的場景進行反饋,對障礙物進行快速識別和檢測,從而確定一條高效的可行的安全路徑。本文將計算機視覺室內導航技術主要分為3類:第一類是環境地圖事先已知;第二類是定位與地圖構建同時進行;第三類是不依賴環境地圖。

3.1環境地圖事先已知

提前對外界環境特征進行提取和處理,建立全局地圖,并將地圖信息存儲在機器人內存數據庫中,在導航的時候實時進行地圖匹配,即預存環境地圖。在環境地圖事先已知的導航中,路標信息保存在計算機內存的數據庫中,視覺系統中心利用圖像特征直接或間接向移動機器人提供一系列路標信息,一旦路標被確定后,通過匹配觀察到的圖像和所期望圖像,機器人借助地圖實現自身精確定位和導航。該導航技術過程可分為以下步驟:

a)圖像獲取:攝像頭獲取其周圍的視頻圖像;

b)路標識別及檢測:利用相關圖像處理算法對圖像進行一系列預處理如進行邊緣檢測和提取、平滑、濾波、區域分割;

c)路標匹配標志:在觀察到的圖像和所期望圖像之間進行匹配,搜索現有的路標數據庫進行標志路標;

d)位置計算:當有特征點進行匹配時,視覺系統會根據數據庫中的路標位置進行自身精確定位和導航。

在基于計算機視覺的地圖匹配定位過程中,主要有2種地圖匹配較為典型。

①已知起點,已知地圖。這種條件下的定位稱為局部定位,采用的是一種相對定位的方法,如圖1所示為其位姿估計過程,這種情況目前導航技術研究得最多。

②不知起點,已知地圖。這種條件下的定位稱為全局定位。當機器人需要重置時,通常使用這種定位方法來檢索機器人的當前位置(即姿態初始化)。常用的輔助方法是在環境中添加一些人造信標,如無線收發器,幾何信標,條碼技術,紅外或超聲波接收系統進行位置識別,利用視覺系統識別自然標志,自主定位。

3.2定位與地圖構建同時進行

不知起點,不知地圖。SLAM技術最早由Smith等人于1986年提出,移動機器人在自身位置不確定的情況下根據自身的攝像頭獲取周圍未知環境信息,在作業時逐步構建周圍的環境地圖,根據構建的增量式地圖自主實時定位和導航。在日后的導航研究中,混合地圖中的幾何一拓撲混合環境模型被得到廣泛應用,主要用來解決SLAM問題。

2003年,在解決SLAM技術難題上,Arras等人采用基于Kalman濾波器和最鄰近(nearest neighbor)匹配策略的隨機地圖創建方法。下面是該算法步驟:

a)數據采集:首先初始化系統,從攝像頭傳感器采集距離數據;

b)狀態預測:視覺系統預測機器人運動狀態,實時返回新位姿信息和協方差矩陣,預測地圖;

c)觀測:從原始捕獲的信息中提取主要特征信息并將此信息返回給局部地圖;

d)測量預測:預測機器人當前位姿的全局地圖;

e)位置匹配:應用最鄰近濾波器匹配局部地圖中的觀測點和預測點;

f)估計:使用擴展Kalman濾波器更新地圖;

g)創建:將非相關的觀測點加入地圖,對機器人返回增量式地圖;

h)輸出地圖。

制約機器人視覺系統性能的重要因素是信息實時處理的計算復雜度和處理效率,SLAM算法需要在地圖密度與計算效率之間取得權衡。

3.3無環境地圖

在這類系統中,機器人不需要依賴任何的環境地圖信息,機器人的活動取決于其當時識別和提取出來的環境信息,這些環境信息可能是桌子、椅子和門等,不需要知道這些環境元素的絕對位置。無環境地圖的導航技術典型的技術有3大類:基于光流的導航技術、基于外觀信息的導航技術、基于目標識別的導航技術和基于目標跟蹤的導航技術。

3.3.1基于光流的導航技術

光流是三維空間運動物體在觀測成像面上的像素運動的瞬時速度,也是圖像亮度的運動信息描述。光流法計算最初是由Horn和Schunck于1981年提出的,其利用二維速度場與灰度,引入光流約束方程,得到光流計算的基本算法。光流計算基于物體移動的光學特性提出了2個假設:①運動物體的灰度在很短的間隔時間內保持不變;②給定鄰域內的速度向量場變化是緩慢的。如Santos-Victor等人研發了一種基于光流的robee視覺系統,該系統模擬了蜜蜂的視覺行為。在robee視覺系統中,使用單獨的雙目視覺方法來模擬蜜蜂的中心反射(Centering Reflex):當機器人移動到走廊兩側的墻壁中心時,左眼捕獲場景的瞬時速度與右眼捕獲場景的瞬時速度是相同的,幾乎沒有差別,那么機器人就可以知道他們在走廊的中心。如果眼睛兩側的眼睛的瞬時變化速度不同,則機器人移動到較慢的速度。在自動機器人導航的實現中,基于這個想法是測量攝像機捕獲圖像場景瞬時速度差異。這種導航技術只能用于室內單通道直走道導航,不能引導機器人改變方向,具有一定的局限性。

3.3.2基于外觀信息的導航技術

基于外觀的機器人導航方法,不需要構建真實的地圖導航,機器人通過自身所攜帶的攝像頭和傳感器感知周圍目標的外觀信息進行自主定位和導航。其中,所述的外觀信息多為目標信息的顏色、亮度、形狀、空間大小和物理紋路等。機器人在導航時存儲連續視頻幀的環境圖像信息,并將連續視頻幀與控制指令相關聯,從而再執行指令規劃有效路徑到達目的地。

3.3.3基于目標識別導航技術

為了達到目標點或是識別目標,機器人很多時候只能獲取少量的圖像信息。Kim等人提出了一種用符號代替導航各個位置的賦值方法。該賦值方法中,機器人執行命令如“去窗邊”“去你后面的椅子旁”等。這樣,通過相關的符號命令,機器人自動識別并建立路標,通過符號指令到達目標點。例如“去你后面的椅子旁”,這樣的命令就是告訴機器人路標是椅子、路徑向后。該導航技術的難點在于目標是否可以準確實時識別路標。第一,識別大量不同類別的物體,室內環境有許多不同類別的物體,需要將它們組織到一個在給定的容易搜索圖像數據結構中去,起到容易識別是用什么度量來區分物體;第二,識別大量不同背景下的物體,一個合適的物體表達式有助于將圖像組織成片斷,而這些片斷來自于物體的種類且與物體無關的;第三,在抽象層次上識別物體,機器人可以不需要在看到一個具體的杯子之前便能知道它是一個杯子,相關程序能夠類似的物體進行識別和區分。

3.3.4基于目標跟蹤的導航技術

基于目標跟蹤的導航技術,為機器人構造一個虛擬地圖,機器人通過攝像頭獲取連續的視頻序定一個跟蹤的目標,為了達到對目標的精確定位和實時跟蹤,可以利用粒子濾波算法對需要跟蹤的目標進行建模?;诹W訛V波的目標跟蹤主要包含四個階段,分別是初始化目標區域,概率轉移,目標區域權重計算,目標區域重采樣。在機器人導航之前,通過視頻序列的當前幾幀標注機器人所需要跟蹤的目標,在導航時,機器人通過連續的視頻幀感知周圍的待跟蹤目標,同時對所需要跟蹤的目標散播粒子,當獲取的視頻幀對目標區域重采樣后足以讓機器人確定所需要跟蹤的目標時,機器人通過確定的目標為自己規劃最有效的路徑到達目的地。獲取視頻序列目標跟蹤是算機視覺領域中的重要分支,它在工業生產、交通導航、國防建設、航空導航等各個領域有著廣泛的應用。

亚洲精品一二三区-久久