計算機視覺的原理范例6篇

前言:中文期刊網精心挑選了計算機視覺的原理范文供你參考和學習,希望我們的參考范文能激發你的文章創作靈感,歡迎閱讀。

計算機視覺的原理

計算機視覺的原理范文1

關鍵詞:計算機輔助教學;視覺媒介;綜合技能;教學形式

中圖分類號:G64文獻標識碼:A文章編號:1005-5312(2012)11-0215-01

視覺傳達設計是通過視覺媒介表現并傳達給觀眾的設計,其領域與其他領域不斷相互交叉,高校紛紛加大對藝術類專業的投入。在眾多院校中,在課程設置方面也是各有特色,但是有一點是相同的,即計算機輔助課程歸納到各個學校的教學計劃之中的,且成為該專業的骨干課程。

一、視覺傳達專業計算機輔助設計類課程的設置現狀

視覺傳達設計是指利用視覺符號來傳遞各種信息的設計??偟膩碚f,視覺傳達專業計算機輔助設計類課程主要分為以下幾類:平面設計軟件類(Photoshop、Coreldraw、Illustrator、Indesign)、二維動畫軟件類(Flash)以及影視后期制作軟件類課程(Aftereffect、Premire)。Photoshop作為一款圖像處理和繪圖軟件成為該專業學生必須掌握的工具,其強大的作用及功能幾乎滲透到視覺類專業的所有科目。Coreldraw、Illustrator軟件作為必須掌握的矢量軟件,在制作插圖、標志、書籍裝幀、版式設計、VI設計、包裝設計等主干課程中發揮到不可忽視的作用。二者作為基礎性軟件,容易學習和上手,是學生入門的好軟件。Flash軟件可以用于二維動畫和多媒體創作。Aftereffect是目前世界上最廣泛的視頻合成軟件之一,廣泛用于數字電視,視頻的后期制作,在PC系統上可以完成較好的合成效果。

二、視覺傳達專業計算機輔助設計類課程的設置現狀

獨立院校教育以市場需要為導向,著重在于培養學生的動手能力。因此,計算機輔助課程相對于其它課程來說實踐課時較多,以強化學生運用軟件的能力。計算機輔助設計類課程要求學生利用日益增多的各類設計素材庫,對圖像進行處理,變化出更為豐富的視覺語言。如今軟件升級換代十分迅速,這要求學生及教師能不斷的更新知識,在學習的過程中,要學會質疑和嘗試,觸類旁通去學習和尋找不同的操作方法。

三、視覺傳達專業計算機輔助設計類課程的教學方法

(一)案例式教學法

學會工具的簡單用法,最容易達到。通過了解功能、界面、菜單、面板以及工具的基本使用方法,就大致了解。學生除了在課堂上消化和吸收教學案例以外,學會舉一反三,大量的課外鉆研也有必要的。

(二)項目式教學法

項目式教學法是通過進行一個完整的“項目”工作而進行的實踐教學活動的培訓方法。在教學實踐中,拿實際項目里的課題研究作為項目,它能為學生日后進入工作崗位積累實踐經驗,這種過程對學生的學習能力有著極大的提高。

四、 視覺傳達專業計算機輔助設計類課程存在的誤區

在教學方面:有的教師側重于工具的教授,然后輔以大量的圖例去啟發學生。有的教師則完全把軟件課變成單獨的軟件培訓班的模式,一味的填鴨式教學,不去培養學生的創新能力。這些情況只會使學生的軟件學習能力停留在很低的層次。

在學習方面:學生不動腦筋,不愿意去探討原理和基礎工具運用,只是默默地跟著范例,至于為什么會,不去探究。另外有些同學不善于做筆記,不勤加練習,今天會明天忘,所以說軟件的學習過程也是個需要潛心修煉的過程。

五、視覺傳達專業計算機輔助設計類課程的有效進行

(一)針對性的設置課程

學校在開展計算機輔助設計類課程的初期,可以嘗試著去要求學生對常規軟件(例如Photoshop、Coreldraw、Illustrator等),達到創新的運用程度。其它的軟件,學生可以根據自身的學習情況和接受能力進行多樣性的選修。同時也可以在這三類基礎軟件上加大課時的投入,以鞏固學習成果。

(二)教學與實踐相結合

學校與相關單位緊密協作,定期到單位參觀實習此外加大投入讓學生能參與到國內外的各項比賽中,以賽代練。

(三)加強師資培訓,提高教師業務水平

計算機視覺的原理范文2

【關鍵詞】Opencv;計算機視覺技術;系統;研究

隨著計算機技術的快速發展,計算機設備逐漸被應用到社會生活的各個方面,尤其是在當前計算機視覺技術和圖像處理技術快速發展的時期,各個科技領域中的計算機視覺技術已經逐漸成熟。計算機視覺技術主要是利用計算機智能化來替代人眼,即對于客觀存在的三維立體化世界的理解和識別,整個實現過程均是以計算機技術作為基礎。隨著計算機視覺技術的不斷發展,現今其已逐漸成為了一門神經生理學、計算機工程、信號學、物理學、應用數學等綜合性學科。計算機視覺技術系統其在高性能計算機基礎之上來實現對大量數據的獲取,并且通過智能算法來對獲取數據進行處理,從而完成對數據集成。

一、視頻中運動物體檢測原理

對于視頻中的運動物體檢測主要分為兩中方法,其一為宏觀檢測法;其二為微觀檢測法。宏觀檢測法是對獲得的整幅圖像進行檢測,而微觀檢測法則是對所需要的區域進行圖像檢測。視覺技術在檢測運動物體的時候,首先對圖像進行采集,并對采集的信息數據進行預處理,將圖像進行分割,然后分別提取運動物體的影象,從而實現參數的更新。圖像采集過程中采用背景差分法,實現對背景圖像的提取,其通過一定算法采用人為手段獲取沒有背景的圖像。另外在進行運動物體檢測的時候還可以采用幀間差分法,其主要是實時獲取幀圖,然后實現一幀一幀圖像比值的比較,從而獲取具有差值的圖像。運動物體進行檢測的時候需連續獲取幀圖,將這些幀圖組合起來,其實就是物體的運動軌跡,然后同分割技術就能勾勒出物體的輪廓。隨著計算機視覺技術的不斷深入研究,發現此兩種方法單獨使用仍然存在的一些缺點,于是研究人員將二種檢測方法進行融合,形成一種綜合檢測方法。綜合檢測法將兩者檢測方法的優勢進行了融合,并將其靈活的應用到了生產和生活之中,取得了十分不錯的效用。

二、基于Opencv的計算機視覺技術探究

(一)基于Opencv的運動物體檢測

運動物體在進行檢測的時候,基于Opencv的檢測原理主要為:根據物體某項特定信息,例如,顏色、輪廓、性狀等,在復雜背景中利用這些特定的信息將物體分離出來。整個圖像的分離過程首先是進行視頻流捕捉,然后是進行視頻的格式轉換,再將圖像進行預處理,從而提取前景物體,減少環境因素對圖像處理的誤差,最后根據物體特征提取,并完成對運動物體的跟蹤。從圖像中提取所需的目標物體,其實質就是對整個屋里輪廓進行檢測和分割,根據每個圖像的幀差異來進行提取。

(二)基于Opencv圖像預處理

視覺技術應用于復雜的環境之中,由于存在著光照的變化,其場景中所出現的環境因素對視頻采集設備性能影響很大。環境因素會使得獲取的圖像信息的質量降低,并且在圖像中無法避免的存在著噪點,這對于運動物體的檢測和圖像采集會造成很大的影響。當獲取視頻幀圖像之后需對其數據進行預處理,通常有平滑度濾波處理、圖像填充、圖像背景更新等。

1.平滑度濾波處理

由于在進行視頻圖像采集的時候存在著噪點,那么我們就需要對其進行噪點處理,以求減小噪聲。濾波平滑度濾波處理,其具有線性和非線性兩種方式,其中線性方式進行處理器運算簡單、運算速度快,但是在進行處理之后的圖像都會呈現不清晰的情況。而非線性方式盡心給處理之后,雖然能夠很好的減小噪點,確保信號的局部特點,但是其運算的速度會較慢。

2.圖像填充

對于幀圖像進行處理,通常采用檢測邊緣填充法或者是腐蝕膨脹法來完成,其中填充法是指當檢測出目標物體之后,利用邊緣檢測方法來對物體進行辨識,然后利用形態學的漫水填充法進行填充。圖像的腐蝕膨脹則主要是由于攝像機的性能等問題造成的。

3.實時背景更新

在進行圖像差分之前,需要對背景圖樣進行確定,并且需要對其進行初始化處理。以方便以后在進行檢測時候能夠對實時背景圖進行差分計算,只有這樣,才能夠獲得極佳的前景效果。在進行圖像差分時,首先需要根據指定法來確定第一幀背景的圖像,并將其指定為第一張背景圖片,然后在檢測過程中根據算法對背景實施更新。整個圖像在進行更新時,其主要的流程為:判斷并讀取圖像是否為第一幀;將Opencv處理的圖像轉化為單通道灰度值;將實時采集的圖像進行高斯平滑度處理,去除噪點;最后使用形態學濾波處理噪點。

(三)提取前景運動物體圖像

檢測運動物體的時候,只有在檢測流程中確保精確度,才能夠獲取滿意的前景跟蹤效果。此過程中主要分為兩個步驟,第一步為二值化圖像之后進行分割;第二步,圖像分析前處理,進行充分填充,確保前景圖的完整性。其中,前景圖的提取主要分為下面幾個步驟:首先對前景圖像和背景圖像進行差分,然后對差分的圖像進行二值化,再對背景中的前景圖像邊緣進行檢測,根據輪廓進行填充圖像。由于攝像頭存在于不同的場景和環境之中,不論是室外或者是室內隨著場景的變化都會對圖像的采集產生影響。那么在前景圖中提取目標就需要在檢測系統中采用有效手段來完成背景實時更新。

閥值二值化分割法可以對檢測的物體進行前景和背景差圖分割,從而使目標物體能夠分離出圖像,且閥值分割先要確定每個像素的點是否處于灰度范圍值之內。將圖像中的像素灰度與確定的閥值進行比較,其結果解釋所有像素點分為2類,一類像素的灰度小于閥值,另外一類就是大于閥值。閥值二值化分割時,確定分割的閥值T,然后分割圖像。選取合適的閥值進行分割,可以有效的減少光照因素影響,常用的動態閥值主要有直方圖來法與最大類方差法這另種分割方法。

三、計算機視覺三維技術

計算機視覺技術的核心為分割問題、運動分析、3D立體場景重構等,立體視覺主要是從多幅圖像的參照中獲取目標物體的三維幾何信息。計算機視覺所模擬出的3D立體畫面只需要攝像機從不同的角度同一時間針進行圖像捕獲,將2D信息進行3D重構,進而將計算機程序重建于真實的三維場景之中,以恢復物體的真實空間信息。

(一)視覺系統

視覺系統捕獲圖像的過程,實則可以看成為對大量信息進行處理過程,整個系統處理可以分為三個層次,其一,理論層次;其二,描述層次;其三,實現層次。在攝像機視覺系統之中,輸入的是2D圖像,但是輸出為3D信息,而這就可以實現對圖像的位置、距離等信息的如實描述。視覺系統分為三個進階層次,第一階段為基礎框架;第二階段為2.5D表達;第三階段為三維階段。在第二階段中實現的2.5D表達,其原理是將不完整的3D圖像信息進行表達,即以一個點為坐標,從此點看去某一些物體的部分被遮擋。第三階段的三維階段,則是人眼觀察之后可以從不同的角度來觀察物體的整體框架,從而實現了將2.5D圖像信息的疊加重合運算,進一步處理之后得到了3D圖像。

(二)雙目視覺

人們從不同角度觀看同一時間內的同一物體的時候,可以利用算法測量物體間的距離。此法被稱為雙目立體感覺,其依據的原理是視覺差原理,利用兩臺攝像機或者一臺攝像機,對兩幅不同的圖像進行不同角度觀察,并且對其觀察的數據進行對比分析。實現雙目立體視覺與平面視覺圖像獲取,其主要的步驟為:

(1)圖像獲取

從兩臺不同的攝像機,捕獲幀圖像,由于環境因素會造成圖像差異困難。為了更好的跟蹤目標、檢測,當捕獲圖像之后,需要對圖像進行預處理。

(2)攝像標定方式

獲得真實坐標系中的場景點中的與平面成像點占比見的對應關系,借用三維立體空間中的三維坐標,標定之后確定攝像機的位置以及屬性參數,并建立起成像的模型。

(3)特征提取方式

所謂的特征提取方式主要是為了提升檢測、跟蹤目標的準確性,需要對目標物體進行特征提取,從而實現對圖像分割提取。

(4)深度計算

深度信息主要是根據幾何光學原理,從三維世界進行客觀分析,因為距離會產生不同的位置,會使得成像位置與兩眼視網膜上有所不同。簡單來說,客觀景物的深度可以反映出雙目的視覺差,而利用視覺差的信息結合三角原理進行計算,可呈現出深度的圖像信息。

(三)攝像機模型

攝像機在標定過程中確定了其建立的基礎為攝像機的模型,攝像機模型在標定過程中關系到三個不同坐標系的轉換,分別為2D圖像平面坐標系、攝像機自身坐標系以及真實的世界坐標系。攝像機在攝像的時候起本質是2D圖像坐標轉換,首先要定義攝像機的自身坐標系,將坐標系的原點設置為光心,X、Y、Z成立三維坐標系。其次則是建立平面的圖像坐標系,用以透視模型表示,其原點也在廣心的位置,稱之為主點。實際應用中,物理的距離光心的位置d≠f焦距,而且會遠遠大于焦距,為了解決如此問題就提出了平面概念。在光軸z上設置一個虛擬的圖像平面,然后在此位置于平面關于光心對稱。接著,在設置的虛擬2D坐標系中,光軸和原點重合,并且攝像機與垂直平面的垂直方向相同,真實圖像上的點影射到攝像機坐標系。

(四)3D重構算法

視頻流的采集,主要是采用Kinect設備、彩色攝像頭、紅外發射攝像頭、紅外接收攝像頭。使用微軟提供API控制Kinect設備,在操作之前需調用NUI初始化函數,將函數的參數設置為用戶信息深度圖數據、彩色圖數據、骨骼追蹤圖數據、深度圖數據。上述的視頻流的打開方式不同,既可以是一種打開方式,也可以是多種打開方式,尤其在進行Kinect傳輸數據處理的時候,需遵循三條步驟的運行管線。此三條管線分別為:第一條為處理彩色和深度數據,第二條為根據用索引添加顏色信息,并將其放入到深度圖之中,第三條為骨骼追蹤數據。

四、總結

隨著計算技術的快速發展,視覺技術逐漸被廣泛的應用于我們日常的研究之中。本文通過對視覺技術的相關問題進行分析,探究了圖像處理、分割、前景提取、運動物體觀測以及重構3D圖等問題,為實現視覺技術更加深入研究做出了相應的貢獻;為廣大參與計算機視覺技術研究同仁提供一個研究的思路,為實現視覺技術的騰飛貢獻薄力。

參考文獻

[1]張???基于Opencv的人手識別與跟蹤定位技術研究與實現[D].云南大學,2013.

計算機視覺的原理范文3

關鍵詞 計算機視覺;立體匹配;研究情況

中圖分類號:TP391 文獻標識碼:A 文章編號:1671-7597(2014)07-0001-01

隨著科學技術的快速發展,計算機技術也得到了飛速的發展。將計算機技術應用于人類的視覺系統,并輔助人們觀察到一些眼睛難以看到的東西,已經逐漸成為一門大家所熱捧和追逐的技術。隨著人們對視覺傳感器技術越來越多的探索,人們也逐漸實現了古代時想擁有千里眼的夢想。目前,人們已經把視覺傳感器技術和計算機技術良好的結合在一起,并把這些技術應用到食品、建筑、醫藥、電子、航天航空等眾多領域當中。而該項技術的快速發展,也幫助人們解決了一些日常工作當中人類視覺存在盲區的問題,保證了人們工作過程的安全。視覺技術與IT技術的完美結合使得人們的生活變得更加便利,讓人們親身體會到了IT技術給人們生活帶來的便捷。

1 雙目立體視覺概述

雙目立體視覺又稱雙目視覺技術,是目前計算機視覺應用領域的重要研究內容。雙目立體視覺控制系統的組成因其采用的原理和應用功能的不同,組成也都各不相同。

雙目立體視覺的實現原理是基于人眼的視網膜看物體的特性,從兩個不同的方向來觀看同一個物體的不同角度,從而實現清楚的了解到物體的圖像的目的。雙目立體視覺從不同的角度獲得物體的投影信息,并根據匹配的結果,獲取同一個物體不同偏差位置的信息。最后在依據三角測量技術,根據已經獲得的這些偏差信息從而獲得這些不同點對應的距離信息,并最終獲得這些實際物體的具體坐標位置信息。

視差測距技術告訴我們,要清楚的觀察到一個物體的全貌,需要兩個觀察物從不同的方向,或者固定一個觀察物,移動另外一個觀察物的方式,以達到拍攝同一個物體的目的。根據同一個物體在兩個觀察物當中的位置偏差,從而確定該物體的三維信息。一般來說,雙目立體視覺的組成包括:圖像獲取設備、圖像預處理設備、攝像機標定設備、立體匹配設備、根據二維信息實現三維重構設備等五個重要設備。

2 雙目立體視覺技術的原理

立體畫又可以稱之為三維立體畫,是一種人們可以從三維立體圖中獲取二維平面圖信息的技術。三維立體圖表面看似毫無規則,但是假如通過一些特殊的技術或者通過合理的觀察手段和觀察設備,就可以看到一組秩序井然的美妙圖片。

三維立體圖是一組重復的二維圖片有序的堆積積累而成,因此可以呈現出立體效果。人體觀察物體的原理大致如下:當人類通過左右眼觀察所在的空間平面的時候,這些平面圖都只是一些毫無秩序的圖片。而當左右眼重新聚焦或者在觀察畫面的時候呈現一定的層次感,則人類的左右眼觀察到的一組重復案在經過人體識別以后,這些畫面之間將存在一定的距離差異,從而在腦中生成立體感。

雙目立體視覺技術正是基于以上的原理,從兩個不同的方向去觀察物體,并獲得目標圖像的信息,并經過一定的處理獲得三維重建的物體立體信息的技術。

雙目立體視覺在計算機技術中實現三維重建的大致流程

如下。

1)攝像機定位,并通過單片機計算得到要獲取圖像信息需要的外部的參數的大概值,并根據這些參數值設定攝像機。

2)用設定參數的攝像機拍攝目標場景的畫面,并采集這些畫面的二維圖的信息。

3)通過計算機技術實現雙目匹配,并判定采集畫面中的二維圖像中的不同點之間的對應關系。

4)在第三步中若得到兩組二維圖像的關系是稠密的時候,則生成三維視差圖。如果不是則進一步采集圖片信息。

5)根據得到的視差圖最終實現場景的三維圖形的重建。

3 雙目立體匹配技術的研究難點和未來的發展方向

盡管目前有很多學者都投身到雙目立體匹配技術的研究和開發當中,直至目前為止也解決了很多關于視覺理論當中存在的很多缺陷問題。但是視覺問題是一個復雜且難以解決的問題,特別是在雙目立體匹配問題方面更是困難重重。立體匹配技術的難點已經成為限制將雙目技術應用到計算機技術當中的重要瓶頸。

立體匹配的主要手段就是找到計算機采集到兩幅和多副圖片的中像素的對應關系,然后根據這些像素關系判定并生成三維重建圖。但是二維圖像的匹配存在層層困難,主要體現在以下幾個方面。

1)由于視角的問題或者觀察物體存在遮擋問題,導致采集回來的圖片信息存在盲點,這樣子更難找到圖片的匹配區域。

2)場景中的一些深度不連續的區域大都處在場景當中的邊界位置,這些位置容易出現像素不高,邊界不清晰等問題,這些問題也給圖像匹配帶了很多困擾。

3)場景當中的低紋理的圖片匹配特征和匹配關系較少,而且該位置的每個像素點極為相似。假如只是通過簡單的像素相似性檢測的話,會檢測到很多匹配結果,而這些匹配結果當中有一大部分是錯誤的。這樣子的結果勢必會導致最終的圖像匹配正確率極為低下。

從以上的分析,我們可以看出立體匹配技術存在很多技術上的難點,這些都在很大程度上限制雙目立體匹配技術在計算機當中的應用發展。如何才能設計出有效、準確、快速、通用性強的立體匹配算法將會是以后雙目立體匹配計算發展的重要方向。也只有通過設計出一套行之有效的立體匹配算法才能使得雙目立體匹配技術在計算機視覺當中得到廣泛的應用。

4 結束語

人們通過眼睛可以感受到外界事物的存在,可以清楚的了解到事物的立體信息,分辨出觀察物的廣度和深度,以及物體的遠近。因此人類視覺感知系統就是一個雙目的立體感知系統。本文講述的計算機中的雙目立體匹配技術正是基于人眼視覺觀察物體的原理,通過雙目立體視覺原理,對計算機采集獲得兩幅二維圖像的信息進行分析,并結合計算機的分析,最終獲得同人類眼睛一樣觀察到物體三維表面信息的目的。雙目立體匹配技術與計算機技術的完美結合幫助人們可以更加輕易的獲得物體的信息。希望在不久的將來,可以將該項技術應用于人類的視網膜當中,以幫助一些視網膜存在問題的人們,讓他們重新感受到光明,感受世間的溫暖。

參考文獻

[1]高文,陳熙霖.計算機視覺算法與系統原理[M].北京:清華大學出版社,2002.

[2]明祖衡.雙目立體視覺測距算法研究[M].北京:北京理工大學,2008.

[3]劉昌,郭立,李敬文,劉俊,楊福榮,羅鋒.一種優于SAD的匹配準則及其快速算法[J].電路與系統學報,2007,12(4):137-14.

[4]陳蛟.雙目立體匹配的算法研究及其多核并行化[M].南京:南京郵電大學,2012.

計算機視覺的原理范文4

關鍵詞:三目攝像機;標定;立體視覺;外部參數

一、緒論

1.1研究的背景及意義

計算機視覺是當今極為重要的學科之一,它在具有很強的挑戰性的同時又擁有廣泛的應用前景和實用價值。計算機視覺以視覺理論為中心,以圖像處理、模式識別、計算機技術和生理學、心理學為基礎,研究內容主要有兩個方面:一是開發從輸入圖像數據自動構造場景描述的圖像處理系統;二是理解人類視覺機理,用機器代替人去做人類難以達到或根本無法達到的工作[1]。

計算機視覺應用的廣泛性體現在其不僅用于文字、指紋、面部、商標以及圖像數據庫、檢測集成電路芯片、多媒體技術這些圖像方面,還應用到機器人導航、工業檢測和產品的自動裝配、CT圖像器官重建和遙感照片解釋等空間物體的定位、識別以及重建上。現如今,計算機視覺已經應用到機器人、地理、醫學、物理、化學、天文等各大的研究領域。

作為多個學科交叉與融合中心的計算機視覺,攝像機是其研究的重要工具,而攝像機標定又是計算機視覺研究的一個關鍵問題,故攝像機的標定越來越受到廣泛的重視。攝像機標定是通過物體空間上的點與圖像中的對應點的幾何關系,來確定攝像機的內外參數的過程。標定結果是否準確影響著三維測量的精度和三維重建的結果,而且實時的標定更能滿足自動導航機器視覺的需要[2]。

伴隨著應用的發展,攝像機廣泛地被應用于三維立體的測量、視覺檢測、運動檢測等領域。由此,對攝像機標定的精度要求也日益增加。攝像機標定結果的優劣影響了計算機視覺在各領域的應用。攝像機標定的準確與否,對能否提高計算機視覺在各領域測量的準確度有重要影響[3]。因此,研究攝像機標定方法具有重要的理論研究意義和實際應用價值。

1.2攝像機標定技術研究的發展及現狀

攝像機有一個圖像平面和提供三維空間到圖像平面轉換的鏡頭。由于鏡頭會產生畸變,不能把這個轉化過程簡單描述為投射變換。所以它表示的是畸變的模型,這些模型近似于真實數據,而其精確性則依靠于建立的模型及模型參數的準確性。

首先進行攝像機標定工作的是加拿大的Deville,他于1910年建立實驗室,使用多個瞄準儀對他的“測量攝像機”(surveying camera)進行標定[4]。上個世紀三十年代后期,美國標準局發明了一種精確鏡頭,用來檢測攝像機,同時將它用在攝像機標定上。四十年代后期,該項工作得到進一步加深,有了更多對高精度的需求和對易操作設備的需求。1955年,Carman出版了 《棋盤平面度的干涉測量和控制》,該書引起了社會各界對攝像機標定的關注。二戰時期,隨著飛機的大規模使用,航空攝影與制圖興起,為得到更加精確的測量結果,對攝像機鏡頭的校正要求也變得更高。五十到七十年代也是鏡頭校正技術發展最為迅速的時間段。在這期間,各種鏡頭像差的表達式逐步被提出并且得到普遍認同與采用,建立了很多的鏡頭像差的模型,D.C.Brown等人作出了比較大的貢獻,他們導出了近焦距情況下給定位置處徑向畸變表達式并證明了近焦距情況下測量出鏡頭兩個位置的徑向畸變就可以求出任何位置的徑向畸變[5]。這些徑向與切向像差表達式成為后來各攝像機的標定非線性模型的基礎。這段時間里,研究的重點是如何校正鏡頭與用何種方法補償鏡頭像差,這些研究對促進各性能鏡頭組的研制起到了重要作用。在1999年,張正友提出了一種簡便的攝像機標定方法,該方法介于傳統標定和自標定之間,操作方便靈活,能夠得到不錯的精度,滿足了眾多擁有桌面視覺系統的用戶在攝像機標定方面的需求。

1.3本文的主要研究內容

本文的主要研究多個攝像機的標定問題。標定主要是對攝像機內外參的測量計算,利用這些參數對多個攝像機識別的物體尺寸進行衡量并建立起多攝像機系統的數字環境。

論文的內容包括:

第一章為緒論,介紹攝像機標定相關的研究背景、國內外研究現狀。

第二章為攝像機標定理論基礎:主要介紹標定的坐標系與待標定的參數。

第三章提出本文的多攝像機標定方法與實驗過程。

第四章進行全文的總結。

二、攝像機標定方法研究

2.1攝像機標定原理

攝像機通過透鏡將三維物體投影到--維圖像平面上,這個成像變換的過程稱為攝像機成像模型。攝像機成像模型有多種,最常用的為小孔成像模型。由于實際的攝像機鏡頭會發生一定的畸變,使得空間點所成的像不在線性模型描述的位置而會發生一定的偏移,為了能準確的標定攝像機參數,標定的過程中要考慮非線性畸變因子。

一般來說,得到標定結果后要對其精度進行評估,然而很難得到準確的攝像機標定參數真值作為參考,其中基于圖像坐標和世界坐標的絕對和相對誤差的評價方法應用廣泛,本文將對這些方法的原理進行探討。

2.2攝像機標定坐標系建立

首先定義了四個坐標系,如圖1所示,圖像坐標系的坐標原點為O0,列與行由坐標軸u和v表示;成像平面坐標系的原點是攝像機光軸與圖像坐標系的交點0l,x、y 軸分別與u、v 軸平行;在攝像機坐標系中,坐標原點0c即為在攝像機的光心,Xc、Yc軸與x、y 軸平行,與圖像平面垂直是攝像機光軸作為Zc軸,0c0l為攝像機焦距f;世界坐標系是假想的參考坐標系,可固定于場景中某物體上,用于描述攝像機的位置,由Xw,Yw,Zw軸組成。

圖(1)

2.3攝像機外部參數構成

主動視覺傳感器從在笛卡爾直角坐標系中的運動表現為相應的旋轉矩陣和平移矩陣,故攝像機外部參數表現為旋轉矩陣R和平移矩陣T,則攝像機坐標系與世界坐標系的轉化關系可以表示成:

上式中(Xc,Yc,Zc)表示空間點在攝像機坐標系下的坐標,(Xw,Yw,Zw)表示空間點在世界坐標系下的坐標。根據靶標點在像空間坐標系和物方空間坐標系中的坐標,通過分解旋轉矩陣線性計算像空間坐標系與物方空間坐標之間的轉換參數,即外方位元素(攝站參數)[6]。

2.4各攝像機相對位置確定

三目攝像機擁有三個視覺傳感器,而三個傳感器之間的相對位置可通過已獲得的外部參數進行確定。將三個攝像機坐標系設置為,Oci xci yci zci(i=1,2,3),由2.3中所介紹的內容可知,這三個攝像機坐標系與世界坐標系的關系為:

i=(1,2,3)

由此我們可以得到任意兩個攝像機i,j的坐標系轉換關系:

其中: = = i,j=1,2,3

三、攝像機標定實驗過程及結果

3.1實驗系統介紹

實驗中被用來標定的是一個多攝像機系統,攝像機標定有關的基本參數、系統組成和開發環境如下:

(1)硬件環境

標定板、三目攝像機和圖像采集卡等。

(2)軟件環境

OpenCV開源視覺庫,它僅由一系列C函數和少量C++類構成,為Python、MATLAB等語言提供了接口,在圖像處理和計算機視覺方面實現了很多通用算法。

3.2實驗過程

本系統以棋盤格模板作為標定模板。采用激光打印機打印棋盤格黑白方塊間隔紙,方塊邊長為3cm,共6行9列,將打印紙固定在一塊平板上,作為標定模板,如圖(2)。安裝三目攝像機系統,調節固定好個攝像機位置,如圖(3)。手持標定板在三目攝像機前方各個位置拍攝5組共15張各姿態的照片,利用Canny算子進行像點灰度中心提取、同名像點匹配并解算出三個攝像機在標定板坐標系中的外部參數值。

3.3標定結果

攝像機1:

R= T=

攝像機2:

R= T=

攝像機3:

R= T=

四、總結

隨著計算機技術的高速發展,計算機視覺成為當今熱門的研究課題,受到了廣泛關注。本文就如何在機器視覺的理論基礎上對三目視覺系統進行標定進行了研究,討論了計算機視覺理論知識,分析攝像機標定原理以及標定坐標系的建立。同時通過計算機視覺知識的分析討論了基于三目視覺系統的攝像機標定技術,完成了三目視覺系統的外部參數標定實驗。三目攝像機測量系統外部參數的標定能夠解決測量作業現場、測量控制場建立難的問題,為快速地建立簡單實用的控制場提供了方案,有一定的實用價值。

參考文獻

[1] 荊麗秋.雙目視覺系統標定與匹配的研究與實現[D].哈爾濱工程大學,2009.DOI:10.7666/d.y1489086.

[2] 馬頌德.計算機視覺―計算理論與算法基礎[M].北京:科學出版社,1998.

[3] 王榮一.攝像機標定及關鍵技術研究[D].哈爾濱理工大學,2011.DOI:10.7666/d.y2012483.

[4] Clarke T A,Fryer J G.The development of camera calibration methods andmodels.Photogrammetric Record,1998,16(91):51-66

[5] Brown D C.Decentering distortion of lenses.Photogrammetric Engineering,1 966,32(3):444-462.

[6] 范亞兵,黃桂平,高寶華等.三目立體工業攝影測量系統外部參數的快速標定[J].測繪工程,2012,21(5):48-52.DOI:10.3969/j.issn.1006-7949 .2012.05.013

計算機視覺的原理范文5

關鍵詞 陶瓷設計,計算機視覺、觸覺設計

1前 言

歷經數十年發展,CAD/CAM技術已取得了巨大成功,并迎來了數字化設計、數字化制造的時代。NURBS曲線曲面(非均勻有理B樣條)以其強大的形狀表示能力和配套的計算、編輯算法,已成為事實上的產品表示標準。細分曲面、隱式曲面是近年曲面造型研究的熱點,它們突破了NURBS在拓撲結構上的局限性,更容易表達某些復雜的形狀。

在陶瓷設計領域,經常需要設計人體、動物等自然雕塑形體,現有的CAD系統可采用NURBS曲面、細分曲面、隱式曲面等來描述這些復雜對象[1],但如何能快速、精確地設計出來,目前尚無有效的數字化工具。人們認識、改變外在事物時,主要利用視覺與觸覺的感官功能,通過手眼協調來設計出新的事物,設計師在設計新的對象時,也可如此操作。

近些年出現了一些價格較為便宜的觸覺式設計系統,如FreeForm系統,它抽取了大型虛擬現實系統的單一觸覺功能,可提供真實感的數字雕塑工具。但一般設計人員使用后的效果并不理想,雖可以在局部修修補補,但缺乏對整體形態的把握[2]。

本文提出了一套視覺與觸覺相結合的數字設計系統,以數碼相機和力感觸覺系統為工具,快速實現復雜形體的數字建模。首先利用數碼相機拍照,攝取參考對象的圖像,通過一個專門設計的攝影測量與計算機視覺集成系統重構出參考對象的三維數字模型;然后將此模型輸入到觸覺設計系統,經局部的修正,得到新的設計模型。以下詳述系統組成及原理,并給出設計實例予以驗證。

2造型設計系統的組成

本文所提出的系統主要分為兩個模塊:視覺子系統與觸覺子系統。其中觸覺子系統是購置的,視覺子系統是獨立開發的[3]。相機采用奧林巴斯CL5050,拍攝的照片經視覺反求系統處理后,得到VRML格式的三維模型,然后輸入FreeForm觸覺設計系統,進行再設計,最終輸出改型設計后的數字模型。圖1所示是視覺系統實物,圖2是觸覺系統的實物照片。

2.1 視覺系統[4]

本文提出的系統中,視覺系統為自主開發的,先講述相關的主要原理。

本文采用的視覺系統結合了攝影測量法的高精度與計算機視覺法的靈活性。近年來由圖片生成3D模型是一個熱門的計算機視覺研究領域,并相應提出了諸多的研究方法,其核心問題包括:相機標定、對應點匹配及3D重構等;針對每個問題均有大量的研究算法,特別是相機標定技術幾乎成為一個關鍵環節。

類似于測量系統控制網的概念,我們設計了一套控制特征點,相機直接根據控制特征點進行標定,可得到精度較高的相機內外參數。圖3所示是控制點分布的實物圖。

我們對控制點分布采取了特殊設計,使任意角度下拍照,均有10個(通常要求至少6個)以上特征點被攝取。對特征點,采用了高精度的專業攝影測量系統Aicon加以標定,其空間坐標保存于一個數據文件中,以備相機標定時采用。

有了高精度的相機參數,就可以利用成熟的計算機視覺方法重構3D模型。我們采用了遮擋輪廓法[1]及空間剝離法[2]這兩種對環境要求較低、算法較為穩定的方法,處理標定過的圖像,得到三維模型主要形態,可作為觸覺設計的基礎。

2.2 觸覺系統

觸覺子系統采用FreeForm觸覺式虛擬設計系統,通常也亦稱為3D Touch系統,采用了力回饋技術,手握觸覺筆在空間旋轉移動,屏幕里相應的雕刻刀便隨之移動;當雕刻刀接觸到模型時,會有力回饋到握筆的手上,讓使用者感受到接觸時的力量。在雕刻時可設定模型的軟硬度,進而調整雕刻所需的力。常規的實物雕刻操作,在系統內均有對應的虛擬工具,無論是雕刻效果,還是虛擬雕刻過程中的感受,與實際雕刻幾乎一樣,提供了十分逼真的雕刻環境。

3陶瓷狗的造型設計

在陶瓷設計中,經常需要參考某種實物樣品。本實驗以圖1中的玩具狗作為參考對象,借助視覺、觸覺集成系統進行了兩次造型、建模試驗。視覺系統從不同角度攝取了10幅圖片,由這10幅圖片生成一個三維模型(見圖4)。整個建模過程僅需十幾分鐘,方便快捷。輸出的模型包含了參考對象的主要形態,稍加修整,即可得到新的改型設計。

以視覺系統的輸出為骨架,在FreeForm系統中進行細部的修整與再設計,并可添加修飾色彩,得到新的設計結果,見圖5。

在試驗中,如果僅依靠觸覺設計系統,即使熟練的操作人員,要設計出比例協調、結構合理的模型,也需要花費一天或數天時間。視覺系統的輸入極大地簡化了主體形態的構造,使不太熟練的設計人員也能利用觸覺系統,很快設計出新的作品。

4總 結

本文提出了視覺、觸覺相結合的方法,利用計算機視覺系統幫助設計人員觀察、感知設計對象,并把結果以數字形式保存起來;觸覺系統直接利用已有的觀察結果,通過手眼協調完成最終設計。這種混合系統彌補了非專業人員所缺乏的空間形體洞察力及操縱力,使他們不用經過長期的專業訓練,也可快速地設計出新的作品。本文給出的實例已驗證了這一觀點。

本文揭示了虛擬雕刻過程所忽略的視覺思維環節,并設計出計算機視覺系統來加以彌補,取得了良好的結果,這套視、觸覺結合的設計系統可用于陶瓷產品的設計制造,可大幅度提高設計效率和設計質量。

參考文獻

1 Potemesil M.Generating octree model of 3D objects from their silhouetttes in a sequence of

images[J].Computer Vision&Graphics Image Processing,1987,40(1):1~29

2 K.Kutulakos and S.Seitz. A theory of shape by space carving[J]. International Journal of Computer

Vision,2000, 38(3):199~218

計算機視覺的原理范文6

關鍵詞:雙目計算機視覺 深度信息 自適應 光照變化 視頻監控

1、引 言

面對日益復雜的社會和政治環境,國家安全、社會安全、個人人生安全和財產安全等都面臨著不同程度的威脅,都需要各種安全保護措施,在眾多場所建立切實有效的安保措施,成為一個迫切的課題。本文提出了一種基于雙目計算機視覺的自適應識別算法,將該算法應用于現有的監控系統,并賦予監控終端智能性,不僅使其脫離人而具有獨立智能、自主判斷的能力,而且使得視頻監控系統在安防方面的作用大大提高。

在現有的背景建模方法中,大多對于背景象素點的亮度值,例如最小亮度值、最大亮度值和最大亮度差值[ 1 ] ,或是對顏色信息進行建模[ 2 ] 。對于背景的更新,一般使用自適應濾波器對像素的統計特性進行遞歸更新,為了考慮到噪聲的影響,文獻[ 3 ]提出了Kalman濾波器的方法,該文認為系統的最優信息可通過估計獲得??紤]到環境的動態緩慢改變,文獻[ 4 ]利用統計模型給背景建模,即由一個時域濾波器保留著一個序列均值和一個標準偏差,并通過濾波過程統計值隨時間改變來反映環境的動態特性。另外有一些方法解決了光照漸變等影響[ 5~7 ] ,但計算較復雜。

2、雙目計算機視覺深度算法

基于實際應用考慮,攝像頭的數量關系著成本和計算量,所以選擇支持雙攝像頭(雙目視覺)的算法是最合適的。在支持雙目視覺的算法中,Princeton NEC research institute 基于最大流算法(maximum2flow)的計算機視覺算法( Stereo2MF)在深度效果平滑性上做得較好[ 8, 9 ] ,適用于監控區域深度計算的應用背景。但原有算法所需的計算量和計算過程中的暫存數據量是較大的,雖然支持計算量的削減,但只是機械地在一塊區域中選擇中心點來進行計算,這樣計算的結果會因選擇的機械性,而出現大量的“偽點”,這些偽點錯誤地表現了該區域的平均深度信息。本文采用統計平均值選取計算點,通過距離因子的Gauss分布將塊內其他點的值融合計算,從而使得計算出的值較準確的代表了這一塊內的大致深度分布。

m, n分別是圖像的長和寬所包含的像素點個數,M、N 表示像素點的橫縱坐標, .d 是塊內深度統計平均值, dM, N為計算點的深度值, q為距離因子, dB是計算所得的塊深度代表值。圖1為改進后雙目視覺深度算法與原算法識別效果比較。由圖1可以明顯看出,修改后的算法效果在細節表現、平滑性、偽點減少上均有明顯改善,而且深度計算精確度能夠完全滿足視頻

圖1 改進后雙目視覺深度算法與原算法識別效果比較Fig. 1Effect comparison after algorithm modification

度計算精確度能夠完全滿足視頻監控應用的需要。

3、自適應識別算法

對于一個固定的場景,場景各像素點的深度值是符合一個隨機概率分布。以某一均值為基線,在其附近做不超過某一偏差的隨機振蕩,這種情況下的場景稱之為背景。而場景環境往往是動態變化的,如環境自然光的緩變,燈光的突然熄滅或點亮,以及運動對象的出現、運動和消失等。如果能識別出場景中的動態變化,就能自適應的更新背景值,將光照的改變融合到背景值中。本文采取了用統計模型的方式給每個像素點建模,而以像素點變化的分布情況來確定光照突變引起的深度突變,并結合深度計算本身特性,解決光照緩變突變引起的誤判問題,以及判別場景中對象的主次性。

3. 1 背景象素點的深度值建模

由于雙目計算機視覺算法得到的深度值,已經是塊融合的,可以根據精度要求,來加大塊面積, 減少數據量。本文獲得的數據量只有原像素點的( k, l分別是塊的長和寬所包含的像素點個數) 。以統計的方法給每個像素點的深度值建模, 設為第u幀圖像的某個像素點的深度值, 其中u代表第u幀圖像, i, j分別代表像素點的橫坐標和縱坐標。由一個時間濾波器來保持該像素點深度值的序列均值和時間偏差

其中,α是一個可調增益參數, 其與采樣頻率有關。通過濾波過程,來得到每個像素點的深度值基于時間的統計特性,由于這些統計特性反映了環境的動態特性,據此可以了解到是環境的光照發生了突變,還是有運動對象的運動。

3. 2 背景更新與場景識別

通過上述濾波過程,就可以將光照緩變融入到背景中去,實現背景的自適應更新。而對于光照突變,此時幾乎所有的象素點的亮度值會同時增大或減小,但根據最大流算法的特性,同方向的變化對流量差不會引起太大變化, 而對深度計算結果只會引起較小的同方向變化。這種全局的等量變化, 可以認為是光照突變引起的。

其中, a、b和c是3個可調節系數,他們的取值可依據場景的情況及檢測光照突變的速度與誤差來進行選取。s, t分別是深度圖像的長和寬所包含的像素點個數。Q是符合式( 9)的像素點個數。一旦檢測到環境光照發生了突變, 就把背景點像素的深度序列均值,全部以當前幀像素點的深度值的測量

值代替,而j以0取代,從而實現背景的及時更新。

如果式(10)式(12)中任意一個不成立的話,則認為像素塊深度值的變化并非由光照突變引起, 而是場景中有運動對象出現。

4、算法分析與實驗

4. 1 算法復雜度

對于光照突變檢測,若有突變的話,則會立即檢測出來,當有運動對象出現時, 并且式( 10)式( 12)都接近滿足時,處理會較慢,因為需要處理突變檢測和運動對象兩個過程。當b取25% s ×t時的處理速度與變化點比例關系如圖2所示。

相對于一般的光強、灰度的識別檢測算法,本算法的優勢在于不僅可以利用深度特性更容易地檢測到光照的漸變與突變, 而且可以判斷出現的多個運動對象的主次性。

4. 2 算法誤檢率

由于光照直接對于像素點的光強、灰度等產生影響,所以深度算法的噪聲容限更大,這樣可降低了誤檢率,多組實驗后得到的誤檢率對比圖如圖3所示。但是由于深度算法本身對于反光或者陰暗面會產生偽點,所以,某些時候由于光照突變中光源的位置變化而會誤檢為運動對象,為此算法還需進一步改進能判別偽點的出現, 除去它在光照突變檢測中的影響。另外,公式中可調系數a, b, c的選取也會對不同場景產生影響。

筆者在實驗室環境下做了不同光照角度、不同環境光強度、不同運動物體的多組實驗,發現在反光面或是陰暗面較多的情況下,光照突變檢測不是很靈敏,而且會出錯,但是在增加系數a, c的值后, 誤檢率有所降低(如圖3所示) 。

5、基于算法的監控系統

我們利用該算法實現了視頻監控原型系統。計算機視覺算法對于攝像頭的同步曝光要求很高,所以本系統終端用一塊單獨的MCU (micro control unit)控制同步曝光。核心算法用DSP處理。系統結構如圖4所示。實際系統原型圖如圖5所示。

亚洲精品一二三区-久久