計算機視覺的基本技術范例6篇

前言:中文期刊網精心挑選了計算機視覺的基本技術范文供你參考和學習,希望我們的參考范文能激發你的文章創作靈感,歡迎閱讀。

計算機視覺的基本技術

計算機視覺的基本技術范文1

【關鍵詞】精密測量 計算機視覺圖像 關鍵技術

在現代城市的建設中離不開測量的運用,對于測量而言需要精確的數值來表達建筑物、地形地貌等特征及高度。在以往的測量中無法精準的進行計算及在施工中無法精準的達到設計要求。本文就計算機視覺圖像精密測量進行分析,并對其關鍵技術做以簡析。

1 概論

1.1 什么是計算機視覺圖像精密測量

計算機視覺精密測量從定義上來講是一種新型的、非接觸性測量。它是集計算機視覺技術、圖像處理技術及測量技術于一體的高精度測量技術,且將光學測量的技術融入當中。這樣讓它具備了快速、精準、智能等方面的優勢及特性。這種測量方法在現代測量中被廣泛使用。

1.2 計算機視覺圖像精密測量的工作原理

計算機視覺圖像精密測量的工作原理類似于測量儀器中的全站儀。它們具有相同的特點及特性,主要還是通過微電腦進行快速的計算處理得到使用者需要的測量數據。其原理簡單分為以下幾步:

(1)對被測量物體進行圖像掃描,在對圖像進行掃描時需注意外借環境及光線因素,特別注意光線對于儀器掃描的影響。

(2)形成比例的原始圖,在對于物體進行掃描后得到與現實原狀相同的圖像,在個步驟與相機的拍照原理幾乎相同。

(3)提取特征,通過微電子計算機對掃描形成的原始圖進行特征的提取,在設置程序后,儀器會自動進行相應特征部分的關鍵提取。

(4)分類整理,對圖像特征進行有效的分類整理,主要對于操作人員所需求的數據進行整理分類。

(5)形成數據文件,在完成以上四個步驟后微計算機會對于整理分類出的特征進行數據分析存儲。對于計算機視覺圖像精密測量的工作原理就進行以上分析。

1.3 主要影響

從施工測量及測繪角度分析,對于計算機視覺圖像精密測量的影響在于環境的影響。其主要分為地形影響和氣候影響。地形影響對于計算機視覺圖像精密測量是有限的,基本對于計算機視覺圖像精密測量的影響不是很大,但還是存在一定的影響。主要體現在遮擋物對于掃描成像的影響,如果掃描成像質量較差,會直接影響到對于特征物的提取及數據的準確性。還存在氣候影響,氣候影響的因素主要在于大風及光線影響。大風對于掃描儀器的穩定性具有一定的考驗,如有稍微抖動就會出現誤差不能準確的進行精密測量。光線的影響在于光照的強度上,主要還是表現在基礎的成像,成像結果會直接導致數據結果的準確性。

2 計算機視覺圖像精密測量下的關鍵技術

計算機視覺圖像精密測量下的關鍵技術主要分為以下幾種:

2.1 自動進行數據存儲

在對計算機視覺圖像精密測量的原理分析,參照計算機視覺圖像精密測量的工作原理,對設備的質量要求很高,計算機視覺圖像精密測量儀器主要還是通過計算機來進行數據的計算處理,如果遇到計算機系統老舊或處理數據量較大,會導致計算機系統崩潰,導致計算結果無法進行正常的存儲。為了避免這種情況的發生,需要對于測量成果技術進行有效的存儲。將測量數據成果存儲在固定、安全的存儲媒介中,保證數據的安全性。如果遇到計算機系統崩潰等無法正常運行的情況時,應及時將數據進行備份存儲,快速還原數據。在對于前期測量數據再次進行測量或多次測量,系統會對于這些數據進行統一對比,如果出現多次測量結果有所出入,系統會進行提示。這樣就可以避免數據存在較大的誤差。

2.2 減小誤差概率

在進行計算機視覺圖像精密測量時往往會出現誤差,而導致這些誤差的原因主要存在于操作人員與機器系統故障,在進行操作前操作員應對于儀器進行系統性的檢查,再次使用儀器中的自檢系統,保證儀器的硬件與軟件的正常運行,如果硬軟件出現問題會導致測量精度的誤差,從而影響工作的進度。人員操作也會導致誤差,人員操作的誤差在某些方面來說是不可避免的。這主要是對操作人員工作的熟練程度的一種考驗,主要是對于儀器的架設及觀測的方式。減少人員操作中的誤差,就要做好人員的技術技能培訓工作。讓操作人員有過硬過強的操作技術,在這些基礎上再建立完善的體制制度。利用多方面進行全面控制誤差。

2.3 方便便攜

在科學技術發展的今天我們在生活當中運用到東西逐漸在形狀、外觀上發生巨大的變大。近年來,對于各種儀器設備的便攜性提出了很高的要求,在計算機視覺圖像精密測量中對設備的外形體積要求、系統要求更為重要,其主要在于人員方便攜帶可在大范圍及野外進行測量,不受環境等特殊情況的限制。

3 計算機視覺圖像精密測量發展趨勢

目前我國國民經濟快速發展,我們對于精密測量的要求越來越來高,特別是近年我國科技技術的快速發展及需要,很多工程及工業方面已經超出我們所能測試的范圍。在這樣的前景下,我們對于計算機視覺圖像精密測量的發展趨勢進行一個預估,其主要發展趨勢有以下幾方面:

3.1 測量精度

在我們日常生活中,我們常用的長度單位基本在毫米級別,但在現在生活中,毫米級別已經不能滿足工業方面的要求,如航天航空方面。所以提高測量精度也是計算機視覺圖像精密測量發展趨勢的重要方向,主要在于提高測量精度,在向微米級及納米級別發展,同時提高成像圖像方面的分辨率,進而達到我們預測的目的。

3.2 圖像技術

計算機的普遍對于各行各業的發展都具有時代性的意義,在計算機視覺圖像精密測量中運用圖像技術也是非常重要的,在提高圖像處理技術做以提高。同時工程方面遙感測量的技術也是對于精密測量的一種推廣。

4 結束語

在科技發展的現在,測量是生活中不可缺少的一部分,測量同時也影響著我們的衣食住行,在測量技術中加入計算機視覺圖像技術是對測量技術的一種革新。在融入這種技術后,我相信在未來的工業及航天事業中計算機視覺圖像技g能發揮出最大限度的作用,為改變人們的生活做出杰出的貢獻。

參考文獻

[1]湯劍.周芳芹.楊繼隆.計算機視覺圖像系統的技術改造[J].機電產品開發與創新周刊,2015,14(18):33-36.

[2]馬玉真.程殿彬.范文兵,計算機視覺檢測技術的發展及應用研究[J].濟南大學學報,2014,18(23):222-227.

[3]李華.基于計算機視覺圖像精密測量的關鍵技術分析[J].電腦知識與技術,2013(05):1211-1212.

計算機視覺的基本技術范文2

關鍵詞:計算機視覺圖像 精密測量 構造幾何模型 信號源的接收

中圖分類號:TP391 文獻標識碼:A 文章編號:1009-3044(2013)05-1211-02

新型計算機視覺圖像精密測量是一種基于計算機程序設計以及圖像顯示的高精度的關鍵技術,它廣泛用于測量的領域,對于測量的準確性有很好的保證。這種關鍵技術是幾何了光學的特性,發揮了圖像學的顯影性,把普通的測量技術瞬間提升到了一個新的高度。在這項關鍵技術中包含了物理學中光的效應,圖像中的傳感器以及計算機中的編程軟件,這還不完全,還有一些其他科學領域知識的輔助,可以說這項關鍵技術是一個非常有技術含量的技術,很值得學者進行研究。

1 計算機視覺圖像精密測量的關鍵技術的具體形式

在以往的測量中,選擇的測量方式還是完全采用機械的形式,但是在使用了計算機視覺圖像精密測量后,完成了許多以往技術所不能達到的任務。在我們的研究中,計算機視覺圖像測量的原理是通過攝像機將被處理的對象采集進行影像采集,在多個控制點的數據采集完成后,系統會自動將這些圖像進行整合,得出相關的幾何多變參數,再在計算機上以具體的數據顯示出來,以供技術人員使用參照。

在上面所說的攝像機并不是我們通常意義上生活中使用的攝像機。它是一種可視化較強,表針比較敏感的測試儀??梢詫⒁曈X中的二維形態通過顯影,記錄在機械的光譜儀上,再將這種的二維圖像做數學處理,有二階矩陣轉換為三階矩陣,通過播放儀呈現出三維的影像。這時的圖像變為立體化,更有層次感,效果上也有了明顯的變化,這是一種顯示方法。此外還有一種造價較高的儀器,我們不常使用,就是圖像提取器。同樣是采集控制點的數據,將數據整合在系統之內,然后對于原始的圖像進行預處理,不再經過有曝光這個程序,將圖像中關鍵點的坐標在整個內部軸面上體現出來,提取數據幀數,再運用機器的智能識別系統,對控制點的坐標進行數據分析,自動生成圖形,這也可以用于精密測量。它的優點就是使用上極其的方面,基本只要架立儀器和打開開關,其他的工作機械系統都會自動的完成。使用的困難就是造價極其的高,不適合一般企業使用。在基于計算機視覺圖像測量中使用上的原理如下:

1) 計算出觀察控制點到計算機視覺圖像測量儀器的有效距離;

2) 得出觀察點到目標控制點之間的三維的運動幾何參數;

3) 推斷出目標控制點在整個平面上的表面特征( 大多時候要求形成立體視覺);

4) 還通過觀察可以判斷出目標物體的幾何坐標方位。

在整個計算機視覺圖像精密測量的關鍵技術中最關鍵的元件就是壓力應變電阻儀,這也是傳感器的一部分。壓力應變電阻儀的使用方式是將應力片粘貼在控制點位上,事先在物體表面打磨平整,清理干凈后,涂抹丙酮試劑,在液體完全風干后就可以黏貼應力片,通過導線的聯接,形成了一小段閉合的電路,時刻讓計算機視覺圖像系統可以感應到并作跟蹤觀察。因受到來自不同方面諧波的影響后,應力片會產生一定數值的電阻,在電路中,這些電阻會轉化為電流,視覺圖像系統接收到了電流后就會顯示在儀表盤上相應的數據,我們就可以根據儀表盤中的數據記錄測量中的數據,很好的解決了原始機械在使用過程中大量的做無用功所消耗資源的現象。傳感器對每個應點都進行動態的測量,將數據模轉換成現實中的圖像,精確的成像可以測算出控制點的位置,用計算機視覺圖像精密測量結合數據方面的相關的分析,得出施工中的可行性報告分析,減低了施工中的成本,將施工的預算控制在一個合理的范圍之內。

當無法觀察到控制點是,計算機視覺圖像精密測量可以通過接收信號或是相關的頻率波段來收集數據,不會因為以往測量的環境不好,距離太遠,誤差太大的影響。

2 計算機視覺圖像精密測量的關鍵技術分析

在計算機視覺圖像精密測量的關鍵技術中解決了很多以往很難完成的任務,但是在使用過程中還是發生了很多的問題。尤其在視覺圖像的選擇中,無法使用高幀數的圖片顯示,無法將計算機視覺圖像精密測量的關鍵技術的優點發揮出來。我們就計算機視覺圖像精密測量的關鍵技術中常見的問題進行討論。

2.1 降低失誤的概率

在很多的數據誤差中,有一部分是出現在人為的因素上面。對于機器的不熟悉和操作中的疏忽都會在一定程度上對圖像的視覺感模擬帶來麻煩。對于網絡設備的配置上,要經常性的學習,將配置在可能的情況下設置的更加合理和使用,保證網絡連接系統的安全性。為防止更多因操作帶來的誤差,選用系統登入的制度,用戶在通過識別后進入系統,在采集數據后,確定最終數據上又相關的再次確定的標識,系統對本身有的登錄服務器和路由器有相關的資料解釋,記錄好實用操作的時間,及時備份。

2.2 對于權限的控制

權限控制是針對測量關鍵所提出的一種安全保護措施,它是在使用計算機視覺圖像精密測量的關鍵技術中對用戶和用戶組賦予一定的權限,可以限制用戶和用戶組對目錄、子目錄、文件、打印機和其他共享資源的瀏覽和更改。圖像中的運行服務器在停止的情況下可以做出不應答的操作指令,立刻關閉當前不適用的界面,加快系統的運行速度,對于每天的日志文件實時監控,一旦發現問題及時解決。對于數據終端的數據可采用可三維加密的方法,定時進行安全檢測等手段來進一步加強系統的安全性。如果通過了加密通道,系統可以將數據自動的保存和轉換為視圖模式,對于數據的審計和運行可以同時進行,這樣就可以很好的保證大地測量中的圖像數據安全,利用防護墻將采集中廢棄的數據革除在外,避免數值之間發生紊亂的現象,進一步改善計算機視覺圖像精密測量的關鍵技術。

2.3 開啟自動建立備份系統

計算機視覺圖像精密測量的關鍵技術的完善中會常遇到系統突然崩潰或是圖像受到嚴重干擾導致無法轉換的一系列情況,發生這種情況最大的可能性就是系統在處理多組數據后無法重新還原成進入界面。這時為保證圖片轉換成數字的系統數據不丟失,我們對系統進行備份。選定固定的磁盤保存數據,定期將產生的數據(轉換前的圖像和轉換后的數值)導出,保證程序的正常運行。當系統一旦發生錯誤,可以盡快的恢復數據的初始狀態,為測量任務的完成爭取更多的時間。我們還要減少信號源周圍的干擾,定期的更新系統數據庫,保持數據采集的穩定性,把攝像機記錄出的數據節點保存在相應的技術圖紙上,用這樣的方式來知道測量工作。系統備份的數據還可以用于數據的對比,重復測量后得出的數據,系統會自動也備份的數據進行比對,發現誤差值在規定以外,就會做出相應的預警,這樣也能在工作中降低出現誤差的概率。

3 計算機視覺圖像精密測量的關鍵技術遇到的困難和使用前景

計算機視覺圖像精密測量的關鍵技術作為一種新興技術在使用時間上不過十幾年,其使用的程度已經無法估算。正是因為它的簡單、使用、精度高以及自動化能力卓越的特點受到了測量單位的廣泛青睞。在測量方面的這些可靠性和穩定性也是有目共睹的。在土木和機械測量的行業計算機視覺圖像精密測量的關鍵技術都會有廣泛和良好的使用,前景也是十分的廣闊。但是不容忽視該技術也有一些弊端。這項關鍵技術中涵蓋的學科非常的多,涉及到的知識也很全面,一旦出現了機器的故障,在維修上還是一個很大的問題,如何很好的解決計算機視覺圖像技術的相關核心問題就是當下亟待解決的。

我們都知道,人的眼睛是可以受到吱聲的控制,想要完成觀測是十分簡單的,但是在計算機視覺圖像技術中,畢竟是采取攝像機取景的模式,在取得的點位有的時候不是特別的有代表性,很難將這些問題具體化、形象化。達不到我們設計時的初衷。所以在這些模型的構建中和數據的轉換上必須有嚴格的規定和要求,切不可盲目的實施測量,每項技術操作都要按規程來實施。

上文中也談到了,計算機視覺圖像精密測量的關鍵技術中最主要的構建是傳感器,一個合理的傳感器是體統的“心臟”,我們在儀器的操作中,不能時時刻刻對傳感器進行檢查,甚至這種高精度的元件在檢查上也并不是一件簡單的事情,通過不斷的研究,將傳感器的等級和使用方法上進行一定的創新也是一項科研任務。

4 結束語

在測量工程發展的今天,很多的測量技術已經離不了計算機視覺圖像技術的輔助,該文中詳細的談到了基于計算機視覺圖像精密測量的關鍵技術方面的研究,對于之中可能出現的一些問題也提出了相應的解決方案。測量工程中計算機視覺圖像精密測量的關鍵技術可以很好的解決和完善測量中遇到的一些問題,但是也暴露出了很多的問題。

將基于計算機視覺圖像精密測量的關鍵技術引入到測量工程中來,也是加強了工程建設的信息化水平。可以預見的是,在未來使用計算機視覺圖像技術建立的測量模型會得到更多、更好的應用。但作為一個長期復雜的技術工程,在這個建設過程中定會有一些困難的出現。希望通過不斷的發現問題、總結經驗,讓計算機視覺圖像精密測量的關鍵技術在測量中作用發揮的更好。

參考文獻:

[1] 湯劍,周芳芹,楊繼隆.計算機視覺圖像系統的技術改造[J].機電產品開發與創新周刊,2005,14(18):33-36.

[2] 段發階,等. 拔絲??仔斡嬎銠C視覺檢測技術[J]. 光電工程時報, 1996,23(13):189-190.

計算機視覺的基本技術范文3

關鍵詞: 計算機 視覺注意機制 計算機視覺注意模型

1.引言

隨著信息技術的不斷發展,數據處理量劇增,以及用戶不斷擴大的個性化需求,對計算機信息處理能力提出了越來越高的要求。如何在場景中快速準確地找到與任務相關的局部信息,即物體選擇與識別,已經成為計算機信息處理領域的一個研究熱點。隨著在心理學領域注意機制研究的不斷發展,將注意機制引入信息處理領域來解決物體識別問題,已經不再是紙上談兵。

人類視覺系統進行視覺信息處理時,總是迅速選擇少數幾個顯著對象進行優先處理,忽略或舍棄其他的非顯著對象。進入人類視野的海量信息,通過注意選擇機制進行篩選,就能使我們有選擇地分配有限的視覺處理資源,保證視覺信息處理的效率,這就是視覺選擇注意機制的原理。依據人類視覺選擇注意的基本原理,開發能夠進行智能圖像信息處理的計算機系統,就成為一大任務。我們研究的主要方向是使計算機處理對象時,能夠具備與人類相似的視覺選擇注意能力。

2.視覺注意機制

研究視覺注意機制是個多學科交叉的問題,目前多個領域的研究人員都取得了研究成果,并且對視覺注意的理論都形成了一些共識。目前普遍認為注意既可以是按自底向上(自下而上)的圖像數據驅動的,也可以是安自頂向下(自上而下)的任務驅動的。其中,自下而上的研究主要來自圖像中物體數據本身的顯著性。例如,在視覺搜索實驗中,顯著的物體會自動跳出,如圖1中的圓點通過特征對比,以形狀跳出的形式獲得注意。自上而下的引導主要來自當前的視覺任務,以及場景的快速認證結果,即我們可以“故意”去注意任何一個“不起眼”的物體,如我們可以在圖書館浩如煙海的藏書中,找到自己感興趣的那本書。

研究視覺注意機制的重要方法是研究眼睛在搜索目標時的表現。顯著圖中的各目標在競爭中吸引注意點,注意點在各個注意目標間轉移。根據注意點轉移時是否伴隨眼動,視覺注意也分為隱式注意和顯式注意。隱式注意的中央凹不會隨著注意點的轉移而移動,而顯式注意的中央凹隨每次注意點的轉移而運動。

對視覺注意機制的研究為計算機視覺的發展提供了可能。計算機視覺借鑒人類視覺的注意機制,建立視覺注意的計算模型。通過“注意點”的選擇與轉移,實現對復雜場景中任務的搜索與定位,最終來實現實時信息的響應處理。在計算機視覺的研究中,顯式注意應用較多。

3.計算機視覺注意模型

從人的角度來看,人類視覺系統通過視覺,選擇注意在復雜的場景中迅速將注意力集中在少數幾個顯著的視覺對象上。從場景的角度來看,場景中的某些內容比其他內容更能引起觀察者的注意,我們稱之為視覺顯著性,兩者其實是從不同的角度對視覺選擇注意過程的描述。

我們把引起注意的場景內容定義為注意焦點FOA(Focus of Attention)。Treisman的特征整合理論中將視覺信息處理過程劃分為前注意和注意兩個階段,各種視覺特征在前注意階段被以并行的方式提取出來,并在注意階段以串行方式整合為視覺客體,即注意的特征和客體是通過不同方式進行的。在注意焦點的選擇和轉移上,Koch[2]進行了深入的研究,他提出注意焦點FOA的變化具有四個特征,即單焦點性:同一時刻只能存在一個FOA;縮放性:FOA的空間范圍可以擴大或者縮?。唤裹c轉移性:FOA能夠由一個位置向另一個位置轉移;鄰近優先性:FOA轉移時傾向于選擇與當前注視內容接近的位置。同時注意焦點具有抑制返回的特點,即FOA轉移時抑制返回最近被選擇過的注視區域。在此基礎上,視覺注意的研究人員提出了多種視覺注意模型。

4.視覺注意模型的研究現狀

人類的視覺注意過程包括兩個方面:一方面是對自下而上的初級視覺特征的加工,另一方面是由自上而下的任務的指導,兩方面結合,共同完成了視覺的選擇性注意。與此對應,當前的計算機視覺注意研究也分為這兩個方面。

4.1自下向上的數據驅動注意模型研究及分析

在沒有先驗任務指導的情況下,視覺注意的目標選擇主要是由場景中自下而上的數據驅動的,目標是否被關注,由它的顯著性決定?,F在,自下而上的注意研究主要基于Treisman的特征整合理論和Koch&Ullman的顯著性模型,Itti、satoh等人均在此基礎上提出了自己的研究模型,并做了一些模型的改進研究。自下而上的研究方法通過對輸入圖像提取顏色、朝向、亮度等方面的基本視覺特征的研究,形成各個特征對應的顯著圖。另外,一些研究者采用基于局部或全局對比度的方法,來得到圖中每個像素的顯著性,進而得到顯著圖。

現有的自下而上的視覺注意計算模型中,Itti的顯著圖模型(簡稱Itti模型)最具代表性。該模型主要包含3個模塊:特征提取、顯著圖生成和注意焦點轉移。模型通過初級特征的提取,將多種特征、多種尺度的視覺空間通過中央―周邊算子得到的各個特征的顯著性圖合成一幅顯著圖。顯著圖中的各個目標通過勝者為王的競爭機制,選出唯一的注意目標,其中注意焦點的轉移用的是禁止返回機制。但該模型也有一些缺點,如顯著區與目標區域有偏差、計算量較大、運行時間較長、動態場景中實時處理不平等。

在動態場景之中,由于Itti模型很難滿足實時性的要求,科研工作者們正在努力研究動態場景的特性,并建立相應的動態模型。如Wolfe[1]指出,影響前注意的特征包括顏色、方向、曲率、尺寸、運動、深度特征、微調支距、光澤、形狀,等等,其中又以運動特征最為敏感。而You等采用了一種空間域特征和時間域特征相結合的視覺注意模型,該模型假設當場景中存在全局運動時,視覺注意對象將極少做運動。然而,許多真實的場景并不能滿足這個假設,限制了模型的適用范圍。Hang等人提出了一種運動圖的計算方法,并把運動圖作為特征之一,與顏色、亮度、方向等特征結合。這些研究關注了運動特征對視覺的影響,但是均存在一定的局限性,對于復雜的運動場景的注意焦點計算很難取得良好的效果。

我國研究者也在Itti注意模型的基礎上研究了適合動態場景中的注意模型,形成了一些理論成果。如曾志宏[2]等人提出注意焦點計算模型,鄭雅羽[3]等提出基于時空特征融合的視覺注意計算模型。這些模型都能較好地提取動態場景下的視覺目標。

4.2自上而下的任務驅動的注意模型研究及分析

自上而下的注意即任務驅動的注意,通過目標和任務的抽象知識,在一定程度上指導注意焦點的選擇。在自上而下注意模型的研究方面,Laar(1997)提出了一個用于隱式視覺注意的模型,該模型通過任務學習,將注意集中于重要的特征。Rabak[4]提出了基于注意機制的視覺感知識別模型,該模型在定義目標顯著性時,通過語義分析對其他三個自下向上的視覺控制參數項進行線性組合。Salah將可觀測馬爾科夫模型引入到模擬任務驅動的注意模型研究中,并在數字識別和人臉識別的實驗中取得了很好的效果。Itti提出以調節心理閾值函數的形式來控制視覺感知。

目前對自下而上的數據驅動方面的研究較多,而對自下而上的任務驅動方面研究較少。因為任務驅動的注意與人的主觀意識有關,同時受到場景的全局特征影響。自上而下的注意涉及記憶、控制等多個模塊的分工協作,其過程非常復雜。

5.計算機視覺注意模型研究的趨勢

自底向上和自頂向下的加工是兩種方向不同的信息處理機制,兩者的結合形成了統一的視知覺系統。人類的視覺信息處理系統只有遵循這樣的方法,才能有效地實現視覺選擇注意的目的。

實踐證明,把自底向上和自頂向下的研究相分離的研究方法并不能很好地解決計算機的視覺注意過程。要想使計算機能夠準確模擬人類的視覺注意過程,實現主動的視覺選擇注意的目的,采用兩種研究方法相結合的形式勢在必行。自底向上的視覺注意計算往往離不開與自頂向下的有機結合,實現二者的優勢互補是以后計算機視覺注意研究的一個趨勢。

參考文獻:

[1]Wolf J M,Cave K R.Deploying visual attention:the guided search model.In:Troscianko T,Blake A,eds.AI and the Eye.Chichester,UK:Wiley press,1990.

[2]曾志宏,周昌樂,林坤輝,曲延云,陳嘉威.目標跟蹤的視覺注意計算模型[J].計算機工程,2008,(23).

[3]鄭雅羽,田翔,陳耀武.基于時空特征融合的視覺注意模型[J].吉林大學學報,2009,(11).

[4]Rabak I A,Gusakova V I,Golovan A V,et al.A model of attention-guided vision perception and recognition.Vision Research,1998,38.

計算機視覺的基本技術范文4

關鍵詞:智能交通;計算機視覺;車輛檢測;運動矢量場;時域濾波;空域濾波

中圖分類號:TN911文獻標識碼:A文章編號:1009-3044(2012)15-3670-04

Vehicle Detection Algorithm Based on Spatial and Temporal Filtering of Motion Vector Field

SUN Li-hu, XIONG Lin, FAN Zhi-qiang, HUANG Yi, GAO Zi-feng

(College of Electronic Information Engineering, South-central University for Nationalities, Wuhan 430074,China)

Abstract:Vehicle detection system based on computer vision is the basic parts of intelligent transportation system, which is in the founda? tion of capturing video images, through effective algorithm of computer vision to realize the video of the vehicle target position detection; existing vehicle detection algorithm have high complexity and low accuracy; this paper proposed a vehicle detection algorithm based on pat? tern classification and motion vector field filtering; and this low-complexity algorithm can identify vehicles quickly; especially the proposed method has good performance when the target is small or blocked.

Key words: intelligent transportation; computer vision; vehicle detection; motion vector field; spatial filtering; temporal filtering

隨著社會經濟的快速發展,人們生活水平不斷提高,各種汽車的保有量大幅度增加,怎樣提高交通效率就顯得越來越重要,目前世界各國都投入了大量的人力和物力對智能交通系統(ITS)進行研究[1]。交通監視系統是智能交通系統中的一個重要環節。近年來,基于視頻檢測的方法隨著計算機技術,圖像處理,人工智能和模式識別等技術的不斷發展,在交通流檢測中得到了越來越廣泛的應用,相對于其它交通流量檢測技術而言,它具有以下優勢[2~3]:

1)視頻檢測可以檢測較大的交通場景面積;

2)相對于其它檢測方法,投資少,費用低;視頻傳感器等設備,例如攝像頭,易于安裝和調試,且對路面設施不會產生破壞;

3)使用視頻檢測技術可以采集到更多的交通流量參數。

動態視頻目標檢測技術是智能化視頻分析的基礎,隨著計算機視覺以及視頻分析技術的進一步發展,視頻目標檢測面臨著許多新的應用,以圖像分割為基礎的視頻目標識別檢測技術在智能交通等方面有著廣泛的應用。

計算機視覺的基本技術范文5

摘要:研究基于計算機視覺的實時動態手勢識別技術,并利用OpenCV計算機視覺庫在VS2010平臺上設計一個基于該技術在多媒體教學中PPT演示控制方面的應用。首先,利用背景差分法進行手勢檢測,在背景更新的基礎上,通過背景差分圖和顏色直方圖的反投影圖來檢測運動手勢區域,可以達到較為滿意的實時運動手勢檢測效果;其次,采用基于顏色直方圖的粒子跟蹤算法進行手勢跟蹤,基本能滿足跟蹤的實時性;最后,在手勢識別階段,采用基于Hu不變矩的輪廓匹配算法,得到較好的手勢識別效果;使用六種手勢,來實現演示文稿中的控制應用。

關鍵詞:計算機視覺;背景差分;粒子跟蹤;手勢識別;Hu矩

中圖分類號:TP391.41文獻標識碼:A

1引言

隨著計算機軟硬件技術的發展,人機交互已經由過去的鼠標、鍵盤方式逐漸向更加靈活生動的語音、姿勢等新穎交互方式發展。由于基于視覺方式具有便捷和開銷低等優點,因此,利用計算機視覺技術來使計算機理解用戶的命令,從而做出控制動作,這一領域的研究得到越來越多的重視。其中,人的手勢作為日常生活中最為廣泛使用的一種交流方式;因此,國內外許多研究機構開始對手勢識別技術進行研究,并已經取得了一些階段性的成果。較早的有:Freeman和Roth等人提出的基于方向直方圖的手勢識別系統;國內的高文教授等人于1994年提出了一種靜態復雜背景手勢目標的捕獲與識別。經過二三十年的發展,

人們對運動目標檢測及跟蹤進行了大量深入的研究:美國MIT實驗室通過提取左右手質心的運動軌跡以及手勢形狀特征參數,結合語法規則識別40個美國手語,準確率達到97%;另外,Microsoft Korea的HyeonKyu Lee,采用HMM的閾值模型,識別9種動態手勢命令,平均識別率高達98.19%;國內的任海兵提出了基于DTW的手勢識別算法,該算法能準確識別12種手勢。

現在,基于視覺的手勢識別技術更多的是應用在娛樂、游戲方面,比如微軟前段時間推出的Xbox360游戲機體的體感外設Kinect及多款相配套的體感游戲,玩家可以通過手勢在游戲中進行操作和互動,使得人機互動娛樂進入了一個新紀元。與此同時,還沒有比較成熟的手勢識別技術應用在現代教學系統中。因此,本文的研究重點是基于視覺的實時手勢識別技術在多媒體教學演示控制中的應用。在基于視覺的手勢識別研究中,需要解決的問題主要有兩個:一是實時檢測運動手勢的信息,二是識別運動手勢的信息并做出響應。對運動手勢檢測,本文采用背景差分結合改進顏色直方圖特征的運動檢測方法[1];對運動手勢跟蹤,本文采用粒子濾波算法[2]結合改進顏色直方圖信息的方法;手勢識別階段,本文采用了基于Hu不變矩特征[3]的輪廓匹配算法[4];本文研究基于計算機視覺的手勢識別系統,實現了在播放控制中運用手勢進行開始、翻頁、退出等功能,極大的提高了課堂教學的靈活性。

2手勢檢測

實時視頻圖像中的運動手勢檢測所需要完成的任務是:能夠快且準的檢測出手勢在實時圖像中的主要位置,并且能將位置所在的特定區域作為后續跟蹤、識別的感興趣區域。手勢檢測算法的好壞,直接影響整個系統的跟蹤以及識別的效果。

目前,運動目標檢測[5]的算法比較常用的有三種方法:光流法、幀間差分法和背景差分法。本文考慮實現環境為固定攝像頭采集實時視頻圖像,背景基本不動,因此采用背景差分結合改進顏色直方圖信息的運動檢測方法。

2.1背景差分法

本文研究中,選取攝像頭啟動后的前10幀圖像的平均作為最初的背景圖像,把以后的實時序列圖像當前幀和背景圖像相減,進行背景消去??梢缘玫?,運動手勢區域的像素點的差分值比較大,背景區域的像素點的差分值比較小。另外,由于真實場景中的背景會因光線等外部條件產生微小的變化,長期的誤差積累會造成最后得不到理想的手勢區域,因此背景需要進行實時更新,從而能及時反映當前幀的背景圖像,背景更新[6]的公式如下:

背景更新操作以后,對當前幀進行背景差分,大于閾值th1的圖像點即為運動手勢區域的點,并將得到的運動手勢區域圖像進行二值化操作,公式如下:

3手勢跟蹤

現在常用的一些跟蹤算法主要有:卡爾曼預測算法、粒子濾波算法、均值偏移算法以及Camshift跟蹤算法等??紤]到卡爾曼預測算法和均值偏移算法等都是線性跟蹤算法,不能很好的應對目標運動的隨機性,本文采用了粒子濾波算法。

3.1粒子濾波算法原理

粒子濾波法是指通過用一組帶有權值的隨機樣本,以及基于這些樣本的估算來表示動態系統的后驗概率密度。當樣本很大的時候,這種估計就等同于后驗概率密度。這些樣本就稱為“粒子”。假設在t=0時刻每個粒子都有一個解,每個解與真實解都有一定的相似度,這個相似度可以表示為權重,隨著時間的增加,相似度越大的粒子權重越大,而相似度越小的粒子權重就越小,最后趨于0,從而找到真實解(如圖2)。

3.2基于改進顏色直方圖信息的粒子跟蹤

視頻圖像跟蹤方面,目標的運動模型主要表現為目標位置、速度隨時間改變的狀態轉移過程,目標的觀測模型主要表現為每幀圖像中運動目標的特征(如顏色、輪廓等)與真實目標的相似度的似然過程。在粒子濾波算法中,運動模型可以稱為粒子傳播或者粒子采樣,它是一種隨機過程[11]。粒子在經過傳播以后,狀態會發生改變,但權值沒有跟著改變,這就需要系統的觀測模型對當前粒子的狀態進行計算從而更新粒子的權值。本文的研究中,觀測值由目標區域的顏色直方圖決定。

基于顏色直方圖信息的粒子濾波就是將圖像顏色特征的相似度作為粒子濾波算法要求解的后驗概率,利用巴氏距離(Bhattacharyya)來計算相似度,得到粒子的權重。巴氏系數[12]如公式(9):

4.2識別算法過程

本文研究中,首先建立手勢模板庫,然后通過實時提取手勢幀,經過前面第2部分的結合改進顏色直方圖信息的手勢檢測,然后再經過形態學處理之后,得到效果良好手勢區域的二值圖,再用輪廓提取及跟蹤來得到手勢的輪廓圖,然后計算其7Hu矩特征,最后運用歐氏距離將其與模板庫中定義的手勢進行特征匹配,完成手勢識別。

輪廓提取就是要掏空內部的點:如果其八個相鄰的點都是黑色,則可以判定為內部點,然后刪除改點。

輪廓跟蹤方法:首先找出輪廓中最左下方的點作為搜索的起點,然后按照一定規則來搜索手勢輪廓上的其他像素點。由于輪廓是連續的,因此每個輪廓上的點的位置都可以用其前一個點的所張的角度來表示。研究中采用如下跟蹤準則,第一個點開始定義搜索方向為左上,如果左上方的點是黑點,則它也是輪廓上的點;如果不是,那么順時針旋轉,直到找到第一個黑點,即輪廓上的下一個點。繼續同樣的方法搜索,直到返回最初的起點,搜索結束。

下圖是輪廓跟蹤算法[15]的示意圖,搜索方向用箭頭表示。

5系統實現

本文的系統是在微軟的VS2010平臺上,使用C++語言進行軟件開發,在圖像處理相關方面是基于計算機視覺庫(OpenCV)進行研究的。程序界面如下圖:

左邊底層區的按鈕可以觀察實時手勢跟蹤和識別效果的功能(如圖4和圖7)。

手勢識別的結果可以定義成一個變量,不同

的識別結果對應的變量值不同,然后根據變量值調用不同的API接口函數,這樣就可以實現實時手勢識別技術在演示控制中的應用。本文研究在控制部分挑選了六種手勢,分別控制PPT播放中的開始、退出、上下翻頁、跳轉首末頁等功能。手勢命令定義如下:手勢4控制開始播放;手勢3控制退出播放;手勢1控制跳轉首頁;手勢2為跳轉尾頁;手勢10為向下翻頁頁;手勢5控制向前翻頁。對電腦中某一PPT進行實際的播放控制(列舉其中4個手勢的控制狀態),效果如下:

1)識別手勢4,開始播放:

2)識別手勢10,向下翻頁:

3)識別手勢1,跳轉到首頁:

4)識別手勢3,退出:

系統通過筆記本自帶30W像素的攝像頭,采用DirectShow技術進行實時視頻的獲取,圖像尺寸是320*240,fps可以達到30-60幀/秒,可以很好的滿足實時性的要求。

6結語

本文通過研究設計了一個基于視覺的手勢識別技術在演示控制中的應用系統,可以看出背景差分結合顏色直方圖的運動檢測可以得到較好的手勢區域效果;采用的基于顏色直方圖的粒子跟蹤也能基本實現實時跟蹤的任務;在識別過程中,基于Hu不變矩的輪廓匹配算法具有很好的魯棒性,可以得到較好手勢識別效果;在應用階段,使用手勢來完成控制命令,基本實現了在播放控制中的應用。

同時,仍存在一些問題:對于光照和人臉微小晃動等外部因素引起的噪聲,只能降低而無法消除,這對于手勢跟蹤與識別的效果還是有一定的影響,在應用時會產生一定的誤操作。這些問題仍需繼續研究,才能使得基于視覺的手勢識別技術得到更成熟的應用。

參考文獻

[1]吳曉陽.基于OpenCV的運動目標檢測與跟蹤[D].杭州:浙江大學,2008.

[2]CHO J U, JIN S H, PHAM X D. Object tracking circuit using particle filter with multiple features [C] / / SICE-ICASE: International Joint Conference. Las Vegas: IEEE, 2006: 1431-1436.

[3]甘志杰.基于Hu矩和支持向量機的靜態手勢識別及應用[D].青島:青島科技大學,2008.

[4]華斌,夏利娜.基于中值濾波和Hu矩向量的手語識別[J].計算機工程與設計,2011,32(2): 615- 618.

[5]伏思華,張小虎.基于序列圖像的運動目標實時檢測方法[J].光學術,2004,30(2): 215- 217.

[6]LINDEBERC T. Scale-space theory: a basic tool for analyzing structures at different scales [J]. Joumal of Applied Statistics. 1994, 21(2):224-270.

[7]于華平.視頻序列中的手勢檢測與跟蹤[D].南寧:廣西大學,2010.

[8]QIN WEN, PENG QICONG. An improved particle filter algorithm based on neural network for visual tracking [C] / / International Conference on Communications, Circuits and Systems. Las Vegas: IEEE, 2007:765-768.

[9]龔翔. 基于粒子濾波的視覺跟蹤算法研究[D]. 南京:南京理工大學,2009.

[10]YU JIAXIA, LIU WENJING, YANG Y. Improved particle filter algorithms based on partial systematic resambling [C]/ /IEEE International Conference on Intelligent Computing and Intelligent Systems. Las Vegas: IEEE, 2010: 483-487.

[11]朱志宇.粒子濾波算法及其應用[M].北京:北京科學出版社,2010.

[12]FAZLI S, POUR H M, BOUZARI H. Particle filter based object tracking with sift and color feature [C] / / Second International Conference on Machine Vision. Las Vegas: IEEE, 2009:89-93.

[13]侯一明,郭雷,倫向敏,等.運動背景下基于粒子濾波的目標跟蹤[J].計算機工程與應用,2007,43(8): 62- 64.

計算機視覺的基本技術范文6

關鍵詞:增強現實;視線追蹤;應用

增強現實(Augmented Reality簡稱AR)技術是近年來的一個研究熱點,有著廣泛的應用前景。它是對現實世界的補充,使得虛擬物體從感官上成為周圍真實環境的組成部分。與傳統的虛擬現實(Virtual Reality簡稱VR)不同,增強現實只是實現對現實環境的增強,加深了對現實環境的感受。在實際的AR體驗中,因為人的觀察視線會不斷地變化,AR系統需要實時的根據用戶的視場重新建立位置坐標系,進行追蹤。而視線追蹤技術就是實時地跟蹤用戶頭部的位置和視線方向,根據這些信息來確定虛擬物體在真實空間坐標中的位置,并將它實時地顯示在顯示器中的正確位置。

一、視線追蹤技術及其特點

(一)視線追蹤技術概述。

視線追蹤也稱為眼動追蹤,它被認為是研究視覺信息加工的有效手段。利用專用設備來記錄學習者的眼球運動(Eve-Movement,簡稱眼動)情況,可以作為分析學習者內部心理活動情況的依據。關于視線追蹤技術的研究己有較長歷史,目前它己在多個領域得到廣泛應用。例如用于圖片廣告研究(網頁評估、設計評估等)、動態分析(航空航天、體育運動、汽車、飛機駕駛等)、產品測試(可用性測試)、場景研究(商場購物、店鋪裝演、家居環境等)和人機交互等多個領域。此外,視線追蹤在智能計算機、智能家電、虛擬現實和數字游戲等領域也有很好的應用前景。

在眼動實驗研究中,當被試對視覺信息進行提取時,其注視時間、注視次數、注視點序列、眼跳距離、回視次數、瞳孔直徑等通常被視為思維和心理加工的重要參數。因此,通過對被試在學習過程中的實時眼動信息進行觀測,可用于分析和引導其學習的依據。眼動模式一般分為三種:注視(fixation)、眼跳(saccade)和追隨運動(pursuit movement)。其中,持續一段時間、相對穩定的眼球運動稱為注視;眼球快速運動時導致視覺區域的聚焦點產生變化,這種行為稱為眼跳;眼睛緩慢、平滑地追蹤某個緩慢運動的目標,則稱為追隨運動。通過分析眼動模式和相關參數,可以獲得很多重要的信息。例如,眼跳速度會隨著疲倦程度的增加而降低,而隨著學習任務難度的增加而增加;眨眼速度和眼睛睜開程度的降低則可能意味著疲倦的加重。因此,可以據此來確定學習者的學習精神狀態,或對其學習過程進行分析,從而采取相應的學習策略或干預措施。

(二)視線追蹤系統的類型及其特點。

人眼的注視點主要由頭的方位和眼睛視線決定。頭的方位決定了人眼可能注視的范圍,眼睛的視線決定了注視點的精確位置。國內外將視覺跟蹤技術按照借助的媒介分為硬件和軟件兩種。以硬件為基礎的視線跟蹤的基本工作原理是利用圖像處理技術,通過攝像機攝入瞳孔反射的紅外線記錄視線變化,達到視線追蹤的目的。視線跟蹤裝置目前有穿戴式與非穿戴式,接觸式與非接觸式,如帶上專用頭盔、眼鏡或者頭部固定支架,置于頭部上的攝像機,這種情形用戶使用較不舒適。通過軟件實現的視線跟蹤方法,對用戶沒有干擾,首先利用攝像機獲取頭部、臉部或眼睛圖像,再經過軟件分析對視線定位與跟蹤。由于不需要佩戴任何裝置,用戶的自由度舒適度較好。

人與計算機交互是研究人與計算機之間溝通的技術,將視線跟蹤、語音識別、手勢輸入、感覺反饋等引入人機交互,提高了交互的自然性和高效性。視線追蹤技術同樣引發了人機交互系統的改革,鼠標、觸控板的消失,及通過追蹤人眼視線,用眼神來操作電腦、輸入文字、玩游戲。

二、視線追蹤技術在AR增強現實研究中的應用

(一)顯示技術。

AR的簡單定義就是將計算機生成的虛擬數字信息疊加到現實的生活場景中。這個“疊加”是需要通過顯示設備作為中介來實現。

增強現實系統中的顯示器可以分為頭盔顯示器(HMD)和非頭盔顯示設備。目前,一般的增強現實系統主要使用透視式頭盔顯示器。透視式頭盔顯示器主要由三個基本環節構成:虛擬信息顯示通道、真實環境顯示通道、圖像融合及顯示通道。其中,虛擬信息的顯示原理與虛擬現實系統所用的浸沒式頭盔顯示器基本相同;圖像融合與顯示通道是與用戶交互的最終接口,根據其中真實環境的表現方式,可分為基于CCD攝像原理的視頻透視式頭盔顯示器和基于光學原理的光學透視式頭盔顯示器兩類。

光W透視技術是通過安裝在設備眼前的光學透鏡來呈現出真實和虛擬世界。首先計算機生成的虛擬信息經過光學系統放大后反射后進入視野,透過透鏡又能直接看到現實場景,兩部分的信息匯聚到人眼的視網膜上實現AR的效果。視頻透視技術是借助安裝在頭顯上的攝像頭來捕捉獲取外部真實環境,計算機將數字模擬信息疊加到攝像機的視頻信號上,再將真實場景和虛擬場景進行融合。相比較光學透視技術,它的視角場更大,而且不受外界的強光干擾。不過一旦攝像機與用戶的視點不能保持完全重合,會產生一些偏差。

(二)跟蹤注冊技術。

基于計算機視覺的注冊技術主要是指利用計算機視覺獲取真實場景的信息后,經過圖像處理方面的知識來識別和跟蹤定位真實場景。細分可以劃為基于傳統標志的注冊算法和基于自然特征點無標志注冊算法?;谟嬎銠C視覺的注冊技術的精度較高,但是對計算量非常大,而且算法復雜,對系統的要求非常高。

為了取長補短,得到更加精確的注冊結果,現在有結合兩種技術的混合注冊方法。通常是先由跟蹤傳感器大概估計位置姿態,再通過視覺法進一步精確調整定位。一般采用的復合法有視覺與電磁跟蹤結合、視覺與慣導跟蹤結合、視覺與GPS跟蹤結合等。

三、結論

在國外,增強現實早已在醫學、遙操作、制造與維修、可視化與教育培訓、娛樂、軍事訓練等領域取得了成功應用。在國內,不少單位和個人對增強現實中的關鍵技術和算法進行了研究,并且以牙科醫學、設備維修等許多背景得到了初步應用研究。但國內的研究目前仍多限于實驗階段,與國外的應用水平還有一定距離。

目前,隨著增強現實的快速發展,出現了許多新的研究方向,如新的顯示方式、照片真實感圖形繪制、調節現實、基于網絡的增強現實和針對戶外隨身增強現實系統的技術等等。其中涉及到的技術包括基于圖像的繪制(IBMR)、多通道信息融合、普適計算技術、顯示設備和跟蹤設備的隨身便攜化等。隨著系統性能的提高、操作過程的簡化和設備成本的降低,增強現實會在越來越多的領域得到廣泛應用。

參考文獻:

[1]奚惠寧等.視線追蹤應用技術的專利分析[J].電視技術,2013(S2)。

亚洲精品一二三区-久久