前言:中文期刊網精心挑選了計算機視覺感知技術范文供你參考和學習,希望我們的參考范文能激發你的文章創作靈感,歡迎閱讀。
計算機視覺感知技術范文1
在我國市場經濟不斷發展的盛況下,我國科技發展水平也緊隨其后,成為世界上的科技強國之一。在計算機水平的不斷提高下,計算機視覺技術應運而生。其中,計算機視覺技術被應用與各個領域,并在各個領域都得到廣泛有效的應用,比如軍事領域、醫療領域、工業領域等。本文針對計算機視覺技術在交通領域中的應用進行分析。
【關鍵詞】計算機視覺 交通領域 探究
近年來,隨著科技水平的提高,計算機視覺技術逐漸被人們熟知并廣泛應用。相較于其他傳感器來說,視覺能獲得更多的信息。因此,在我國交通領域中,也對計算機視覺技術進行研究完善,將計算機視覺技術應用在交通領域各個方面中,并取得了顯著的成效。
1 計算機視覺的概述及基本體系結構
1.1 計算機視覺概述
通過使用計算機和相關設備,對生物視覺進行模擬的方式,就是計算機視覺。對采集到的圖片或視頻進行相應的技術處理,從而獲得相應的三維信息場景,是計算機視覺的主要任務。
計算機視覺是一門學問,它就如何通過計算機和照相機的運用,使人們獲得被拍攝對象的數據與信息所需等問題進行研究。簡單的說,就是讓計算機通過人們給其安裝上的“大腦”和“眼睛”,對周圍環境進行感知。
計算機視覺是一門綜合性學科,在各個領域都有所作為,已經吸引了各個領域的研究者對其研究。同時,計算機視覺也是科學領域中一個具有重要挑戰性的研究。
1.2 計算機視覺領域基本體系結構
提出第一個較為完善的視覺系統框架的是Marr,他從信息處理系統角度出發,結合圖像處理、心理物理學等多領域的研究成果,提出被計算機視覺工作者基本接受的計算機視覺系統框架。在此基礎上,研究者們針對視覺系統框架的各個角度、各個階段、各個功能進行分析研究,得出了計算機視覺系統的基本體系結構,如圖1。
2 計算機視覺在交通領域的應用
2.1 牌照識別
車輛的唯一身份是車輛牌照。在檢測違規車輛、稽查被盜車輛和管理停車場工作中,車輛牌照的有效識別與檢測具有重要的作用和應用價值。然而在實際應用工作中,雖然車牌識別技術相對成熟,但是由于受到拍攝角度、光照、天氣等因素的影響,車牌識別技術仍需改善。車牌定位技術、車牌字符識別技術和車牌字符分割技術是組成車牌識別技術的重要部分。
2.2 車輛檢測
目前,城市交通路口處紅綠燈的間隔時間是固定不變的,但是受交通路口的位置不同、時間不同的影響,每個交通路口的交通流量也是持續變化的。此外,對于某些交通區域來說,公共資源的配備,比如交通警察、交通車輛的數量是有限的。如果能根據計算機視覺技術,對交通路口的不同時間、不同位置的交通情況進行分析計算,并對交通流量進行預測,有利于為交通警察縮短出警時間、為交通路口的紅綠燈根據實際情況設置動態變化等技術提供支持。
2.3 統計公交乘客人數
城市公共交通的核心內容是城市公交調度問題,一個城市如何合理的解決公交調度問題,是緩解城市運力和運量矛盾,緩解城市交通緊張的有效措施。城市公交調度問題,為公交公司與乘客的平衡利益,為公交公司的經濟利益和社會效益的提高做出了巨大的貢獻。由于在不同的地域、不同的時間,公交客流會存在不均衡性,高峰時段的公交乘客過多,平峰時段的公交乘客過少,造成了公交調度不均衡問題,使有限資源浪費嚴重。在計算機視覺智能公交系統中,自動乘客計數技術是其關鍵技術。自動乘客計數技術,是對乘客上下車的時間和地點自動收集的最有效的技術之一。根據其收集到的數據,從時間和地點兩方面對客流分析,為城市公交調度進行合理的安排。
2.4 對車道偏離程度和駕駛員工作狀態判斷
交通事故的發生率隨著車輛數量的增加而增加。引發交通事故的重要因素之一就是駕駛員疲勞駕駛。據相關數據顯示,因車道偏離導致的交通事故在40%以上。其中,駕駛員的疲勞駕駛就是導致車道偏離的主要原因。針對此種現象,為減少交通事故的發生,計算機視覺中車道偏離預警系統被研究開發并被廣泛應用。針對駕駛員眨眼頻率,利用計算機視覺對駕駛員面部進行圖像處理和分析,再根據疲勞駕駛關注度與眨眼頻率的關系,對駕駛員的工作狀態進行判斷。此外,根據道路識別技術,對車輛行駛狀態進行檢測,也是判斷駕駛員工作狀態的方法之一。這兩種方法,是目前基于計算機視覺的基礎上,檢測駕駛員疲勞狀態的有效方法。
2.5 路面破損檢測
最常見的路面損壞方式就是裂縫。利用計算機視覺,及時發現路面破損情況,并在其裂縫程度嚴重之前進行修補,有利于節省維護成本,也避免出現路面坍塌,車輛凹陷的情況發生。利用計算機視覺進行路面檢測,相較于之前人工視覺檢測相比,有效提高了視覺檢測的效率,增強了自動化程度,提高了安全性,為市民的出行安全帶來了更高保障。
3 結論
本文從計算機視覺的概述,及計算機視覺基本體系結構,和計算機視覺在交通領域中的應用三面進行分析,可見計算機視覺在交通領域中的廣泛應用,在交通領域中應用的有效性、顯著性,以此可得計算機視覺在現展過程中的重要性。隨著計算機視覺技術的越來越成熟,交通領域的檢測管理一定會加嚴格,更加安全。
參考文獻
[1]段里仁.智能交通系境在我國道路空通管理中的應用[J].北方工業時報,2015(06).
[2]王豐元.計算機視覺在建筑區間的應用實例分析[J].河北電力學報,2015(04).
[3]李釗稱.主動測距技術在計算機數據分析中的作用探析[J].計算機應用,2015(08).
[4]馬良紅.三維物體影像的攝取與分析[J].中國公路學報,2014(05).
[5]朱學君,沈睿.關于計算機視覺在交通領域中的探討[J].信息通信,2013(01):123.
[6]王大勇.關于計算機視覺在交通領域中的應用分析[J].科技與企業,2013(01):115.
作者簡介
夏棟(1988-),男,湖北省孝感市人?,F為同濟大學軟件學院在讀碩士。研究方向為計算機視覺。
計算機視覺感知技術范文2
關鍵詞:計算機視覺技術 鐵路檢測 應用
中圖分類號:TP391 文獻標識碼:A 文章編號:1007-3973(2012)002-075-03
1 前言
自1825年世界第一條鐵路在英國出現以來,鐵路已經成為人們不可或缺的交通工具,越來越多的人在使用鐵路出行,由于近年來鐵路事故頻頻發生,促使了計算機視覺技術在鐵路檢測上的廣泛使用并大力發展。
傳統的鐵路檢測一直是靠人工和靜態檢測,這種檢測缺乏實時性和準確性,并且效率低下,根本無法滿足鐵路的發展。這就要求研究一種新的檢測方法來適應環境的發展,人們就試圖將計算機視覺技術應用于鐵路檢測上,并取得了很好的效果。將計算機視覺技術應用在鐵路檢測上顯著提高了鐵路檢測的實時性、準確性,有效的減輕了人工檢測中工作條件惡劣,工作量大等缺點。它能在列車行駛的過程中就能對鐵路和列車狀況進行檢測,并及時的做出預警,防止安全事故的發生。目前有關鐵路檢測主要集中在鐵路信號檢測、軌道檢測、接觸網檢測、電力機車檢測及站臺環境監測等五個方面。
2 計算機視覺技術
計算機視覺,也稱機器視覺。它是利用一個代替人眼的圖像傳感器獲取物體的圖像,將圖像轉換成數字圖像,并利用計算機模擬人的判別準則去理解和識別圖像,達到分析圖像和作出結論的目的。
計算機視覺是多學科的交叉和結合,涉及到數學、光學、人工智能、神經生物學、心理物理學、計算機科學、圖像處理、圖像理解、模式識別等多個領域。計算機視覺已有多年的發展歷程。隨著計算機、控制理論、模式識別、人工智能和生物技術的發展,計算機視覺在機器人、工業檢測、物體識別的應用越來越廣,研究方向也從二維到三維,從串行到并行,從直接依賴于輸入信號的低層處理到依賴于特征、結構、關系和知識的高層處理。
一般的計算機視覺系統是有CCD(電荷耦合器件)攝像機、裝備有圖像采集板的計算機、光照系統以及專用圖像處理軟件等組成。CCD攝像機將所要研究的對象和背景以圖像的形式記錄下來,這其實是一個光電傳感器,將光學信號轉成電信號,圖像采集板把采集的電信號轉為數字信號,即數字化,一般情況下在攝取圖像時都需要一個照明系統提供光照,然后再用專用的圖像處理軟件對圖像進行處理,輸出分析結果。
3 計算機視覺技術在鐵路信號中的應用
鐵路信號燈和現在的交通公路上的紅綠燈是一個功能,但鐵路和公路不同,鐵路有限定的道路,列車必須在限定的股道上行駛,所以一旦與其他車輛相遇的話根本沒有辦法避讓,如果發生車禍將會對國家和人民的生命和財產造成嚴重的損失,因此列車必須嚴格按照信號燈的指示行駛。
鐵路信號燈識別主要是利用了信號燈在不同情況下會發出特定色彩光的特點。文獻[1]在HSV空間中對S分量圖像邊緣檢測和膨脹等,結合各種信號燈色調H分量的取值范圍得到信號燈區域,然后多次腐蝕直到消除孤立點得到信號燈的邊緣,最后填充信號燈區域,從而實現了信號燈的識別。在文獻[2]也與此類似。文獻[3]將彩色圖像由RGB模式轉化為HSI模式,用彩色特征聚類分析法來對圖像進行分割,文中提出了基于顏色和形狀相結合的復雜環境中目標檢測與識別方法,用Hough變化來提取目標邊界,從而提取出特定目標,而后得到指示燈區域所有像素的H,S統計值確定信號燈的顏色。在文獻[4]提出一種基于改進的Hough變化的吊車信號燈識別算法。Roberto將攝取的圖片轉換到HIS顏色空間,用基于形狀特征和模板匹配的方法探測到相關的鐵路標志而放棄無關的基礎設施。
為了部分消除因為光照條件、背景和拍攝角度對目標識別的影響,文獻[5]提出使用一種利用sift特征的方法,它首先建立已知樣本模型的特征集,然后將視頻流每幀灰度圖像的sift特征與之比較,從而實現對目標的檢測或跟蹤。實驗表明該方法不僅能避免目標的錯誤識別,而且也明顯優于基于邊緣檢測的算法,在識別準確率上達到了90%。
4 計算機視覺技術在軌道檢測中的應用
隨著世界鐵路運營速度的不斷提高,列車在行駛時對軌道的撞擊、摩擦加劇,這就會造成軌道的變形、零件松動、磨損乃至缺失等,這些都會對列車的安全性造成嚴重影響,極有可能會造成鐵路安全事故的發生。因此軌道設備具備良好的狀態是鐵路運輸安全的重要保證。
隨著電子技術和檢測技術的發展,軌道檢測技術也經歷了翻天覆地的變化,其中也有不少研究機構將計算機視覺技術應用于軌道檢測上,且取得了若干有效的檢測方法。
軌道表面缺陷對列車行駛的質量和鐵路系統的安全性會造成嚴重的影響,文獻[7]提出了一種軌道表面缺陷檢測的實時視覺檢測系統。利用跟蹤提取算法分割出軌道的灰度圖像,然后用局部歸一化法增強軌道圖像的對比度,最后用基于投影輪廓的缺陷定位法檢測缺陷。該算法對噪聲有較強的魯棒性和計算速度快,在一定程度上克服了光照不均和軌道表面反射性質不同對圖像的影響,但對局部歸一化過程中參數的選擇有待進一步研究,以使該系統有更強的魯棒性。該系統在216km/h速度下能進行實時檢測,但隨著檢測速度的提高檢測的準確度會明顯下降且缺乏實時性。
文獻[8]利用一排結構光視覺傳感器,將鋼軌輪廓的大圓周和小圓周的中心作為檢查點。首先結構光視覺傳感器拍攝鐵軌側面并且將其標記 在參考坐標幀中,最后通過比較測量的鋼軌輪廓與參考輪廓的比較計算出鐵軌磨損程度。該方法簡單快速精確且不需要特殊的圖像處理設備,在列車較高速度時仍然能達到良好效果。
5 計算機視覺技術在接觸網檢測中的應用
接觸網是沿鐵路線上空架設的向電力機車供電的特殊形式的輸電線路。其由接觸懸掛、支持裝置、定位裝置、支柱與基礎幾部分組成。它是軌道交通的主要組成部分,主要為機車提供動力,接觸網的連接件由于受外界因素的影響容易產生過熱現象,嚴重時會導致供電中斷,引發列車停運事故。
我國的計算機視覺技術的接觸網檢測系統是基于德國相關技術而建立起來的,目前基于計算機視覺技術的接觸網磨耗檢測主要有兩種方案:(1)基于鏡面反射,激光照射接觸線,線性CCD照相機捕獲反射圖像;(2)基于漫反射原理和CMOS(互補金屬氧化物半導體)照相機。由于長期的頻繁摩擦,接觸網與受電弓接觸部分很少被空氣氧化,所以用光進行照射時該部分光反射率明顯高于其他部分,因此這也為計算機視覺技術用于接觸網檢測提供了可能。
基于機器視覺的接觸網檢測系統主要是建立在圖像識別和圖像處理等視覺技術基礎之上的,檢測的內容涵蓋接觸網的所有基本幾何參數。隨著鐵路的發展,原有的檢測系統已經暴露出了一些問題,已無法滿足需求,所以研究人員在系統硬件設備不變的情況下提出了許多改進的算法,如文獻[9]針對現行的接觸網定位器傾斜度檢測方法效率低下、精確度不高的缺點,提出了一種基于計算機視覺的接觸網定位器傾斜度自動測量裝置,應用圖像分割、剔除干擾線、圖像細化等算法,對采集的圖像進行處理,然后利用改進的霍夫(Hough)變換檢測細化后的圖像,對相鄰的特征像素點進行聚類并感知編組,最后用隨機Hough變換使感知編組后的每條線段更接近直線,進而計算裝置中定位器的傾斜度,實驗證明該算法精度高、速度快。
6 計算機視覺技術在電力機車檢測中的應用
在列車的行進過程中,機車車輪與鋼軌接觸面不斷發生摩擦,也就是輪緣與踏面的摩擦。從而會造成踏面的擦傷或剝離,而剝離會嚴重影響列車運行的安全性和平穩性以及軌道設施的使用壽命,因此需要對輪緣進行定期的檢測和維修。
傳統的檢測方法需要人工逐項檢測,存在費時費力、工作量大、工作環境差、效率低等缺點,所以人們就提出了一種基于計算機視覺技術的檢測技術,該技術是一種非接觸式檢測方法,它能檢測出所有關于火車輪緣輪廓的幾何參數,從而計算出火車輪緣的磨損情況。這種檢測方法檢測速度快、準確率高且大大減輕了勞動強度,在實驗中取得了滿意的效果,并且在實際檢測中也得到了廣泛的應用。
文獻[10]中研發設計了一種利用CCD成像測量技術、圖像處理理論和計算機控制等相關技術,提出了一種非接觸式的在線測量系統。采用二元多項式方法對由于硬件裝置引起的誤差的圖像進行幾何校正,用統計均值法對圖像進行分割,從而求出車輪踏面的各項參數,通過在實驗室對標準物進行測試實驗而得到的測量數據結果進行分析而得出。此系統能夠完成對火車輪對幾何參數的測量,并且可得到相對準確的測量結果。
為了解決檢測輪緣高度和寬度存在精度難以保證及穩定性不高的問題,文獻[11]提出了一種基于三角法測量的在線監測系統,該系統由CCD高速攝像機和結構光發射器完成數據的采集,然后利用三角測量原理導出測量模型和計算模型,根據輪緣高度和寬度的定義完成對高度和寬度的測量,最終對輪緣磨損程度進行量化,實驗表明該算法測量精度高,結果穩定可靠。
7 計算機視覺技術在站臺環境監測中的應用
近年來鐵路交通事業發展迅速,鐵路客流量也不斷增大,如中國每年的春運期間都有上億人次通過火車返鄉,各種危害乘客安全的事故也時有發生,因此世界各國特別是中國站臺監控就顯得越來越重要,目前的站臺監控主要是依靠安裝在各個角落的閉路電視或專業技術人員,這不僅需要專業技術知識還需要大量的人力物力。隨著計算機、圖像處理等技術的快速發展,對站臺的自動監控也逐漸成為發展趨勢。
近年來人們做了許多關于站臺人群檢測的研究,這些研究大都使用鐵路站臺中的閉路電視(CCTV)系統,在現代的CCTV系統中基本上使用的是數字化圖像,在人群監測過程中大量使用了數字圖像處理技術,如邊緣檢測、細化、像素計算等,通過圖像的處理可以輕易的得到想要的結果。
文獻[12]仍采用原有的CCTV監控系統拍攝的灰度圖像作為處理對象,利用基于視覺的經過最小二乘法和全局搜索的混合算法訓練的工業的額神經網絡來估算站臺的擁擠程度,該系統在實際的運行中獲得了較高的精確度,雖然不能計算人數但卻能實時的預測人群的密度。
文獻[13]所設計的系統就較為復雜,它利用多臺攝像頭對站臺進行檢測。首先判斷站臺上列車的四種狀態,如:沒有列車、有列車、列車正在出站、列車正在入站等,然后對物體或行人檢測及跟蹤,最后對所檢測的結果綜合分析,做出合理的預警或警告。
8 計算機視覺技術在鐵路檢測上的發展趨勢
隨著計算機視覺技術的鐵路檢測中的應用越來越廣泛和深入,并且隨著計算機視覺技術等關鍵技術的不斷發展,計算機視覺技術在鐵路檢測上應用發揮更大的作用,它就目前而言在鐵路檢測的應用上仍然存在技術難題需要研究:
計算機視覺感知技術范文3
關鍵詞:計算機視覺;地圖匹配;SLAM;機器人導航;路徑規劃
1概述
計算機視覺在人工智能學科占據重要地位,為自主移動機器人視覺導航做了深厚的理論鋪墊。目前,機器人導航技術有很多種,傳感器導航技術如里程計、激光雷達、超聲波、紅外線、微波雷達、陀螺儀、指南針、速度、加速度計或觸覺等得到了普遍應用,與上述非計算機視覺導航技術相比較,計算機視覺導航技術如人眼般具有靈敏度高且可捕獲的信息量大以及成本低等優點。由于室內相對室外空間比較狹小且內部環境復雜,所以普通移動機器人在作業過程中,完成躲避眼前障礙物、自主導航以及為自身找出一條可行路徑等一系列操作會相對比較困難。計算機視覺導航技術可利用本身的攝像頭獲得室內周圍的環境信息,實時對其周身的場景進行快速反饋,對視野前方障礙物進行快速識別和檢測,從而確定一條高效的可行的安全路徑。本文對計算機視覺導航技術進行分類研究,主要分為3類:第一類是環境地圖事先已知,提前對外界環境特征進行提取和處理,建立全局地圖,并將地圖信息存儲在機器人內存數據庫中,在導航的時候實時進行地圖匹配;第二類是同時定位與地圖構建,移動機器人在自身位置不確定的情況下根據自身的攝像頭獲取周圍未知環境信息,在作業時逐步構建周圍的環境地圖,根據構建的增量式地圖自主實時定位和導航;第三類是不依賴環境地圖,自主移動機器人不需要依賴任何的環境地圖,其在作業活動時的可行區域主要取決于攝像頭實時識別和檢測的環境相對信息。
2環境地圖的表示方法
目前,計算機視覺導航技術多采用柵格地圖、幾何地圖、拓撲地圖和混合地圖構建環境地圖信息。
2.1柵格地圖
柵格地圖,將柵格圖像考慮為一矩形,均分為一系列柵格單元,將每個柵格單元賦予一個平均概率值,并利用傳感信息估計每個單元內部內存障礙物的概率。構建柵格地圖的優點是其地圖表達形式直觀,創建和維護比較容易;但當劃分的柵格單元數量不斷增多時,實時性就會慢慢變差;當劃分的柵格單元越大時,環境地圖的分辨率越低。
2.2幾何地圖
幾何地圖利用幾何特征如點、直線、平面等來構成環境主要框架,需要知道這些特征在環境中信息的具置,所以幾何地圖通常使用其對應的三維空間坐標來表示。幾何地圖構建過程相對簡單,保留了室內環境的各種重要信息,是基于計算機視覺的定位與地圖構建算法中最常用的一種表示方式。但是為了完成環境的建模需要標記大量的特征,從而計算量也非常的大,降低了實時性,其重建的地圖也容易出現與全局不一致的情況。
2.3拓撲地圖
拓撲地圖用許多節點和連接這些節點的曲線來表示環境信息。其中,每個節點相對應真實環境中的特征點(如門角、窗戶、椅子、桌子角及拐角等),而節點之間的曲線表示兩個節點對應的地點是相聯通的。拓撲地圖把環境信息表上在一線圖上,不需要精確表示不同節點間的地理位置關系,圖像較為抽象,表示起來方便且簡單。機器人首先識別這些節點進而根據識別的節點選擇節點與節點間的曲線作為可作業的路徑。
2.4混合地圖
混合地圖主要包括3種形式:柵格一幾何地圖、幾何一拓撲地圖以及柵格一拓撲地圖?;旌系貓D采用多種地圖表示,可結合多種地圖的優勢,與單一的地圖表示相比更具有靈活性、準確性和魯棒性,但其不同類別的地圖結合起來管理會比較復雜,難以協調,增加了地圖構建的難度。文獻針對室內環境所建立的模型分為全局拓撲和局部幾何表述部分,整體環境通過拓撲節點串連起來,維護了整體環境表述的全局一致性;而以每個拓撲節點為核心所采用的幾何表述則可確保局部精確定位的實現,這樣建立的幾何一拓撲混合環境模型可將二者的優勢都表現出來,使得移動機器人定位和地圖構建同時進行,實現容易。
3基于計算機視覺的室內導航
基于計算機視覺的室內導航技術可利用攝像頭捕獲機器人周圍環境的全部信息,對其周身的場景進行反饋,對障礙物進行快速識別和檢測,從而確定一條高效的可行的安全路徑。本文將計算機視覺室內導航技術主要分為3類:第一類是環境地圖事先已知;第二類是定位與地圖構建同時進行;第三類是不依賴環境地圖。
3.1環境地圖事先已知
提前對外界環境特征進行提取和處理,建立全局地圖,并將地圖信息存儲在機器人內存數據庫中,在導航的時候實時進行地圖匹配,即預存環境地圖。在環境地圖事先已知的導航中,路標信息保存在計算機內存的數據庫中,視覺系統中心利用圖像特征直接或間接向移動機器人提供一系列路標信息,一旦路標被確定后,通過匹配觀察到的圖像和所期望圖像,機器人借助地圖實現自身精確定位和導航。該導航技術過程可分為以下步驟:
a)圖像獲?。簲z像頭獲取其周圍的視頻圖像;
b)路標識別及檢測:利用相關圖像處理算法對圖像進行一系列預處理如進行邊緣檢測和提取、平滑、濾波、區域分割;
c)路標匹配標志:在觀察到的圖像和所期望圖像之間進行匹配,搜索現有的路標數據庫進行標志路標;
d)位置計算:當有特征點進行匹配時,視覺系統會根據數據庫中的路標位置進行自身精確定位和導航。
在基于計算機視覺的地圖匹配定位過程中,主要有2種地圖匹配較為典型。
①已知起點,已知地圖。這種條件下的定位稱為局部定位,采用的是一種相對定位的方法,如圖1所示為其位姿估計過程,這種情況目前導航技術研究得最多。
②不知起點,已知地圖。這種條件下的定位稱為全局定位。當機器人需要重置時,通常使用這種定位方法來檢索機器人的當前位置(即姿態初始化)。常用的輔助方法是在環境中添加一些人造信標,如無線收發器,幾何信標,條碼技術,紅外或超聲波接收系統進行位置識別,利用視覺系統識別自然標志,自主定位。
3.2定位與地圖構建同時進行
不知起點,不知地圖。SLAM技術最早由Smith等人于1986年提出,移動機器人在自身位置不確定的情況下根據自身的攝像頭獲取周圍未知環境信息,在作業時逐步構建周圍的環境地圖,根據構建的增量式地圖自主實時定位和導航。在日后的導航研究中,混合地圖中的幾何一拓撲混合環境模型被得到廣泛應用,主要用來解決SLAM問題。
2003年,在解決SLAM技術難題上,Arras等人采用基于Kalman濾波器和最鄰近(nearest neighbor)匹配策略的隨機地圖創建方法。下面是該算法步驟:
a)數據采集:首先初始化系統,從攝像頭傳感器采集距離數據;
b)狀態預測:視覺系統預測機器人運動狀態,實時返回新位姿信息和協方差矩陣,預測地圖;
c)觀測:從原始捕獲的信息中提取主要特征信息并將此信息返回給局部地圖;
d)測量預測:預測機器人當前位姿的全局地圖;
e)位置匹配:應用最鄰近濾波器匹配局部地圖中的觀測點和預測點;
f)估計:使用擴展Kalman濾波器更新地圖;
g)創建:將非相關的觀測點加入地圖,對機器人返回增量式地圖;
h)輸出地圖。
制約機器人視覺系統性能的重要因素是信息實時處理的計算復雜度和處理效率,SLAM算法需要在地圖密度與計算效率之間取得權衡。
3.3無環境地圖
在這類系統中,機器人不需要依賴任何的環境地圖信息,機器人的活動取決于其當時識別和提取出來的環境信息,這些環境信息可能是桌子、椅子和門等,不需要知道這些環境元素的絕對位置。無環境地圖的導航技術典型的技術有3大類:基于光流的導航技術、基于外觀信息的導航技術、基于目標識別的導航技術和基于目標跟蹤的導航技術。
3.3.1基于光流的導航技術
光流是三維空間運動物體在觀測成像面上的像素運動的瞬時速度,也是圖像亮度的運動信息描述。光流法計算最初是由Horn和Schunck于1981年提出的,其利用二維速度場與灰度,引入光流約束方程,得到光流計算的基本算法。光流計算基于物體移動的光學特性提出了2個假設:①運動物體的灰度在很短的間隔時間內保持不變;②給定鄰域內的速度向量場變化是緩慢的。如Santos-Victor等人研發了一種基于光流的robee視覺系統,該系統模擬了蜜蜂的視覺行為。在robee視覺系統中,使用單獨的雙目視覺方法來模擬蜜蜂的中心反射(Centering Reflex):當機器人移動到走廊兩側的墻壁中心時,左眼捕獲場景的瞬時速度與右眼捕獲場景的瞬時速度是相同的,幾乎沒有差別,那么機器人就可以知道他們在走廊的中心。如果眼睛兩側的眼睛的瞬時變化速度不同,則機器人移動到較慢的速度。在自動機器人導航的實現中,基于這個想法是測量攝像機捕獲圖像場景瞬時速度差異。這種導航技術只能用于室內單通道直走道導航,不能引導機器人改變方向,具有一定的局限性。
3.3.2基于外觀信息的導航技術
基于外觀的機器人導航方法,不需要構建真實的地圖導航,機器人通過自身所攜帶的攝像頭和傳感器感知周圍目標的外觀信息進行自主定位和導航。其中,所述的外觀信息多為目標信息的顏色、亮度、形狀、空間大小和物理紋路等。機器人在導航時存儲連續視頻幀的環境圖像信息,并將連續視頻幀與控制指令相關聯,從而再執行指令規劃有效路徑到達目的地。
3.3.3基于目標識別導航技術
為了達到目標點或是識別目標,機器人很多時候只能獲取少量的圖像信息。Kim等人提出了一種用符號代替導航各個位置的賦值方法。該賦值方法中,機器人執行命令如“去窗邊”“去你后面的椅子旁”等。這樣,通過相關的符號命令,機器人自動識別并建立路標,通過符號指令到達目標點。例如“去你后面的椅子旁”,這樣的命令就是告訴機器人路標是椅子、路徑向后。該導航技術的難點在于目標是否可以準確實時識別路標。第一,識別大量不同類別的物體,室內環境有許多不同類別的物體,需要將它們組織到一個在給定的容易搜索圖像數據結構中去,起到容易識別是用什么度量來區分物體;第二,識別大量不同背景下的物體,一個合適的物體表達式有助于將圖像組織成片斷,而這些片斷來自于物體的種類且與物體無關的;第三,在抽象層次上識別物體,機器人可以不需要在看到一個具體的杯子之前便能知道它是一個杯子,相關程序能夠類似的物體進行識別和區分。
3.3.4基于目標跟蹤的導航技術
基于目標跟蹤的導航技術,為機器人構造一個虛擬地圖,機器人通過攝像頭獲取連續的視頻序定一個跟蹤的目標,為了達到對目標的精確定位和實時跟蹤,可以利用粒子濾波算法對需要跟蹤的目標進行建模?;诹W訛V波的目標跟蹤主要包含四個階段,分別是初始化目標區域,概率轉移,目標區域權重計算,目標區域重采樣。在機器人導航之前,通過視頻序列的當前幾幀標注機器人所需要跟蹤的目標,在導航時,機器人通過連續的視頻幀感知周圍的待跟蹤目標,同時對所需要跟蹤的目標散播粒子,當獲取的視頻幀對目標區域重采樣后足以讓機器人確定所需要跟蹤的目標時,機器人通過確定的目標為自己規劃最有效的路徑到達目的地。獲取視頻序列目標跟蹤是算機視覺領域中的重要分支,它在工業生產、交通導航、國防建設、航空導航等各個領域有著廣泛的應用。
計算機視覺感知技術范文4
關鍵詞:計算機視覺系統 工業機器人 探究
中圖分類號:TP242 文獻標識碼:A 文章編號:1007-9416(2015)05-0000-00
計算機視覺系統主要是為了工業機器人更好的工作而研發出來的,是一套裝有攝像機視場的自動跟蹤與定位的計算機視覺系統。近年來,機器人已經廣泛使用于工業生產,但是多數機器人都是通過“示教-再現”的模式工作,在工業機器人工作是都是由操作員進行操作示范再由機器人跟著示范進行工作。由于機器人缺乏對外界事物的識別能力,工作中經常發生偏差或者位移等情況。由于工作環境的惡劣以及各種阻礙,為了提高工業機器人的工作效率、靈活性、適應性等,讓機器人更好的識別外部環境并及時調整運作方向,能更好的發揮其作用,在原有的機器人系統中添加了一套計算機視覺系統,利用計算機視覺圖像裝置的信息,通過圖像使機器人進行外部環境的識別處理,采用三維的重建,通過作業中利用三維圖像的信息進行計算,采用Motocom32軟件和機器人控制柜通訊等設備,對工業機器人進行控制,更好的實現機器人對空間特點的跟蹤與定位。
1系統的結構與原理
本文主要針對Motoman UP6工業機器人系統的二次研究,在原有的工業機器人的系統中,增加了一套計算機視覺系統, 使工業機器人更好的識別外界環境的系統。計算機視覺系統主要包括:Panasonic CCD攝像機、Motoman UP6工業機器人系統、工控機、OK C-50圖像采集卡等外部設備。工業機器人的整個系統由原有系統與計算機視覺系統組成,在原有的系統中包含了YASNAC-XRC- UP6機器人控制柜、Motoman UP6工業機器人本體、示教編程器、Motocom32系統以及相關的外部設備等[1]。計算機視覺系統的設備主要有Panasonic CCTV攝像機、AVENIR TV鏡頭、OK系列C-50圖像采集卡、工控機、AVENIR TV鏡頭、Panasonic CCD攝像機、OK系列C-50圖像采集卡形成的視頻采集系統主要是捕獲物體的圖像,該功能主要是分三個層次進行圖像處理、計算、變換以及通信等功能來實施工控機。利用遠程控制來對工業機器人進行Motocom32系統進行通信。
2計算機視覺系統的構建
2.1硬件的組成
CCD攝像頭:選用的CCD攝像機采用PAP-VIVC810AOZ型彩色攝像頭,如圖1。攝像機的像素為P:500(H)x582(V),N:510(H)x 492(V),攝像機的分辨率為420。攝像機的成像器使用1/33"CCD,信噪>48 dB,同時攝像機具有自動背景光補償、自動增益控制等功能。
圖像采集卡:圖像采集卡主要采用CCD攝像頭配套的MV-200工業圖像處理。如圖2所示。MV-200圖像采集卡的分辨率、圖像清晰度具有較高的穩定性,其真彩色實施工業圖像采集卡,該圖像采集卡的硬件構造、地層函數都具有穩定性,同時在惡例的環境中都可以穩定運行[2]。圖像采集卡的圖像采集效果非常好,畫面效果非常流暢。
MV-200圖像采集卡性能特點:其分辨率為768 x 576,具有獨特的視頻過濾技術,使圖像質量的采集、顯示更加清晰流暢。主要支持的系統為Win98 /2K/XP,主要用于人工智能、事物識別、監控等多種領域。
工控機:工控機以奔4系列為主。
2.2軟件組成
圖像匹配軟件。
圖像處理與獲取軟件。
定標和定位算法軟件,功能分布如圖3所示。
3視覺系統的原理及流程圖
工業機器人的主要系統包括是由工業機器人本體、相關的外部設備、控制器(供電系統、執行器等)計算機視覺系統主要由三部分組成:圖像處理和獲取、圖像匹配、攝像機的定位等組成。通過借助OpenCV的視覺庫進行VC++.NET實行,流程如下圖表4所示。
在本視覺系統運行中,需要對攝像機實行定標,建立實際空間點和攝像機的對應點。在定標的過程中,就需要標記基準點,使攝像機在采集圖像時可以準確的把這些基準點投放到攝像機的坐標上[3]。同時在采集卡的圖像中,對圖像進行處理并計算出該基準點圖像的坐標,通過定標計算法,從而得出攝像機的參數。
在機器人系統中的反饋,計算機通過C語言的調節圖像采集卡進行動態鏈接來控制函數[4]。同時,對攝像機中的數據、視頻信號進行采集,構成數字化的圖像資料,采用BMP格式存儲進行計算,在計算機上顯示活動視頻,然后系統對獲取的圖像進行分析處理,以及對噪聲的去除、圖像的平滑等進行處理,利用二值化處理對那些灰度閥值的圖像進行處理,同時檢測計算機獲取圖像的特征量并計算[5]。在完成圖像的處理后,就需要確立圖像的匹配特征,對圖像進行匹配[6]。如果兩個圖像不重疊,就需要建立3D數據庫進行模型重新選擇,再把模型進行計算、投影計算、坐標更換等指令,直到找到與圖像相匹配的數據模型,才能真正得到真實有效的圖像。重疊時,要獲得有效的圖像,以工業機器人識別物體為目的,才能建立機器人系統之間的通信。同時,通過三維圖像重建,進行機器人空間定位[7]。如下圖表5所示。
4結語
綜上所述,計算機視覺系統主要是為了工業機器人更好的工作而研發出來的,是一套裝有攝像機視場的自動跟蹤與定位的計算機視覺系統。通過3D數據模型指定目標,機器人系統利用計算機視覺圖像的采集裝置來識別外界環境的數據,經過圖像的姿態預算、影像的投影計算產生圖像,通過圖片的合成比較,以此來實現機器人在工作中對物體的識別。利用計算機系統對機器人進行有效的控制,在工業機器人工作中對事物目標的搬運、跟蹤、夾持等指令。計算機視覺系統具備清晰的視覺功能,有利于提高工業機器人的靈活性以及適應性。
參考文獻
[1]夏群峰,彭勇剛.基于視覺的機器人抓取系統應用研究綜述[J].機電工程,2014(06):221-223.
[2]華永明,楊春玉.機器人視覺系統在立體編織自動鋪紗過程中的應用研究[J].玻璃纖維,2011(01):189-191.
[3]王培屹.基于多傳感器多目標實時跟蹤視覺系統在全自主機器人上的應用[J].軟件導刊,2011(01):263-264.
[4]譚民,王碩.機器人技術研究進展[J].自動化學報,2013(07):123-125.
[5]鮑官軍,荀一,戚利勇,楊慶華,高峰.機器視覺在黃瓜采摘機器人中的應用研究[J].浙江工業大學學報,201(01):93-95.
計算機視覺感知技術范文5
政策驅動也是重要動力,科技巨頭搶先布局引發示范效應。智能化時代,各國從國家戰略層面加緊人工智能布局,美國的大腦研究計劃(BRAIN)、歐盟的人腦工程項目(HBP)、日本大腦研究計劃(Brain/MINDS),而我國也在“十三五”規劃中把腦科學和類腦研究列入國家重大科技項目。企業布局方面,谷歌、Facebook、微軟、IBM等均投入巨資,其示范效應是產業進步的先兆;國內百度、阿里、訊飛、360、華為、滴滴等也加緊布局。15年行業投資金額增長76%,投資機構數量增長71%,計算機視覺和自然語言處理占比居前。
產業鏈格局已現,上游技術成型、下游需求倒逼,計算機視覺產業應用最成熟。產業鏈初步格局已現,從基礎層和底層技術,再到應用技術,最后再到行業應用,除了近年來底層核心技術的突破,下游行業需求倒逼也是人工智能應用技術發展的重要動力,諸如人機互動多元化倒逼自然語義處理、人口老齡化倒逼智能服務機器人、大數據精準營銷倒逼推薦引擎及協同過濾,等等。其中計算機視覺應用技術的發展可能是最先發力的,國內不乏世界一流水平公司。
2B應用首先爆發,“人工智能+金融、安防”應用前景廣闊?!叭斯ぶ悄?”將代替之前的“互聯網+”,在各行業深化應用,安防、金融、大數據安全、無人駕駛等等。生物識別和大數據分析在安防和金融領域的應用則是目前技術最為成熟、產業化進程較快,如智能視頻分析、反恐與情報分析、地鐵等大流量區域的監控比對;金融領域的遠程開戶、刷臉支付、金融大數據采集、處理、人工智能自動交易、資產管理等。相關推薦標的:東方網力、佳都科技、川大智勝,建議關注大智慧、遠方光電。
逐漸向2C端應用擴展,看好“人工智能+無人駕駛、教育”。人工智能在無人駕駛領域的應用體現在三方面:(1)環境感知環節的圖像識別;(2)基于高精度地圖和環境大數據的路徑規劃、復雜環境決策;(3)車車交互、車與環境交互下的車聯網,智能交通管理。教育領域應用方面,人機交互重構更互動性的教學;大數據和深度學習的結合使得個性化教學成為現實,這也是在線教育最重要的突破點;此外包括VR在內的多載體應用和多屏互動也是發展趨勢。相關推薦標的:四維圖新、千方科技、東軟集團、科大訊飛、長高集團、新開普。
計算機視覺感知技術范文6
關鍵詞: 邊緣檢測;SUSAN算子;角點檢測;亞像素;標定
中圖分類號:TB96 文獻標識碼:A
The Test Method of Wheel Alignment Parameters Based on Improved SUSAN Operator
LI Yu-yu1, HE Liang-liang2
(1. Automotive industry school in Anhui Province, Hefei Anhui 230041, China; 2. HeFei University of Technology, Hefei Anhui 230011, China)
Abstract: In view of the current four-wheel sensors' shortcomings, such as large amount, low accuracy, complex operation, and high maintenance costs, etc. we put forward a new method of detection which uses three-dimensional visual to detect parameters of four-wheel location. This paper expounds the improved SUSAN operator which is based on the proposed method. Through the collection of sequence image of the target disk format board which moves together with the wheels, we calculate three-dimensional cosine of the rotation axis of the wheels, then get four-wheel location geometric parameters. Compared with the traditional methods, this new method has many advantages, such as non-contact, real-time, simple operation, high precision and so on.
Keywords: edge detection; SUSAN operator; corner detection; subpixel; calibration
引 言
隨著汽車行駛里程的增加、使用時間的延續,其技術狀況必然發生改變。汽車行駛中的操作穩定性與行駛安全性、輪胎的異常磨損以及燃油消耗的增加等均與汽車車輪定位不準有關[1,2]。目前,國內廣泛使用了基于機器視覺的測量技術進行汽車四輪定位,計算機視覺是通過對三維世界所感知的二維圖像來研究和提取出三維景物的物理結構[3]。計算機視覺測量技術作為一種新興的、先進的高精度的測量技術,而攝像機標定是實現影像高精度測量的關鍵技術之一。本文根據空間向量原理與計算機視覺理論,提出一種四輪定位參數測量[4]的模板標定新方法,主要研究了針對棋盤格平面模板的亞像素級角點坐標的提取,為后續的攝像機的精確標定提供依據,并通過實車實驗進行了驗證。
1 四輪定位的主要參數
四輪定位的主要參數[5,6]包括:前束角θToe(車輪中心線與車輛幾何中心線之間的夾角)、外傾角θCamber(車輪旋轉平面與車輛縱向垂直面的夾角)、主銷內傾角(kingpin inclination)θKI(在汽車橫向平面內轉向節主銷軸線與鉛垂線的夾角)及主銷后傾角θCaster(在汽車縱向垂直平面內轉向節主銷軸線與鉛垂線的夾角)等。
X、Y、Z分別為車體的橫向、鉛垂方向和縱向的坐標軸,根據立體幾何知識,四輪定位參數數學模型如式(1)所示,單位為度。
1.1 數學模型求解
根據四輪定位參數的數學模型,我們可以通過攝像機采集隨車輪運動的棋盤格式目標盤的序列圖像,對其進行角點檢測[7],而后計算棋盤格角點的圖像坐標與世界坐標之間的單應性矩陣H[8],結合攝像機標定所得到的攝像機內參矩陣,便可求出棋盤格角點的旋轉矩陣,即車輪運動的旋轉矩陣,進而計算出車輪旋轉軸線的方向余弦,從而得到車輪的四輪定位參數,其具體的數學模型求解,流程如圖1所示。
2 改進SUSAN算子[9]的棋盤格角點檢測
棋盤格圖像是進行攝像機標定時最常用的圖像,由黑白相間的正方形組成,并以角點作為特征點。
從圖2可以看出,如果用原來的SUSAN算子進行角點檢測,由于邊緣和角點處的核值相似區都為模板區域的一半,故很難區分邊緣與角點,必須對SUSAN算子改進后才能用于角點檢測。所以我們采用如下的步驟對棋盤格進行角點檢測,首先用LoG算子進行邊緣檢測,然后在邊緣像素處用改進后的SUSAN算子進行角點檢測,最后利用灰度平方重心法進行亞像素角點定位。
2.1 棋盤格的邊緣檢測
在線攝像機標定過程中,因為利用SUSAN算子對整幅圖像進行角點檢測時,其檢測速度會比較慢,不能滿足在線標定對速度的要求。由于角點一定包含在圖像邊緣中,所以先利用LoG算子對圖像進行邊緣檢測,記下邊緣像素的坐標,再只對邊緣處的像素進行SUSAN角點檢測即可,這樣可以大大減少整個角點檢測的運算量。如圖3所示,是對棋盤格圖像進行邊緣檢測的效果圖。
2.2 棋盤格的角點檢測
從圖4可以看出,對于理想的邊緣,如a所示,其灰度不具有中心對稱性,而角點b、c、d、e均具有一定的中心對稱度。且對于理想的棋盤格角點e則具有完全的中心對稱性,而對于b、c、d 三種角點,其角點越尖銳,其對稱性越好。
選用37像素的圓形模板進行SUSAN角點檢測,選用相似比較函數[10]作相似比較,如式(2)所示。
式中t為相似度閾值,由于模板圖像灰度對比度很好,所以可適當取大一點,選用t=25作為相似度閾值,根據式(3)計算出核值相似區:
最后確定幾何閾值g,得到初始角點響應:
因為棋盤格角點的特殊性,其理想的幾何閾值g應為,對于實際的圖像,由于有噪聲的干擾以及攝像機的畸變,不可能是精確的直角角點,所以其幾何閾值最好選取~之間的值。從前面的論述可知,棋盤格角點具有完全的中心對稱性,而37像素的SUSAN圓形模板可方便地計算出其對稱度,所以就此提出了灰度中心對稱度的概念。
首先對SUSAN模板像素的一半依次搜索,找到其關于核心點的像素,求出二者的灰度差ΔI如式(5)所示。
ΔI=I(x,y)-I(x',y')(5)
其中I(x,y)與 是關于核心點中心對稱的像素灰度值?;叶炔瞀與閾值d的比較得到點(x,y)的灰度對稱度D(x,y)為:
D(x,y)=1 ΔI<d0 ΔI≥d(6)
閾值d是用來區分兩像素是否具有灰度相似性的關鍵,灰度區域的差值即為閾值d的取值。
將模板區域一半像素的灰度對稱度求和可得到整個模板的灰度對稱度S(x0,y0)為:
其中M表示整個模板區域,對于37像素的模板,其理想的最大灰度對稱度Smax=18。由于圖像角點模糊以及攝像機畸變等因素,棋盤格圖像的灰度對稱度S達不到Smax,所以在進行角點檢測時設定的灰度對稱度閾值可適當減小,文中取S=12。通過上述改進后可獲取出棋盤格的角點位置。
2.3 亞像素的角點檢測
通過上述方法檢測到的棋盤格角點并不是單像素角點,但是在進行攝像機的精確標定時,必須將角點定位到亞像素級。對棋盤格角點圖像進行分析可知,棋盤格角點圖像屬于灰度對稱分布的目標,而且圖像的灰度對比強烈,所以選取灰度平方重心法進行亞像素角點定位。設角點的灰度重心(x0,y0)為式(8):
其中W(i,j)為權值,取W(i,j)=I2(i,j),M是利用改進后的SUSAN算子檢測到的角點鄰域。該方法原理簡單,可以有效地實現亞像素角點定位。
3 四輪定位參數計算及實驗結果分析
圖像平面上的點m與平面模板的點M之間可通過單應性矩陣H來聯系,獲得匹配點的坐標就可以求圖像坐標與世界坐標之間的單應性矩陣H。用夾具將目標盤以一定角度安裝在車輪上,當車輛前后移動時,車輪及目標盤一起前后轉動,通過對目標盤上的進行運動前后的拍攝,得到旋轉前后的圖像,如圖5所示。然后進行圖像處理和分析提取出目標盤上的特征點,再根據特征點位置的空間坐標變化計算出車輪空間旋轉量,進而由該向量與空間坐標系各坐標軸夾角關系得出定位參數。
4 實驗結果及分析
應用車輪定位參數檢測實驗系統對奧迪A6L車輪定位參數進行了檢測,共測了3次,取其平均值作為最終結果,結果如表1所示。A列為改進算法前的四輪定位數據,B為改進算法后的實驗數據。從實驗結果來看,在通過本方法對特征點提取的算法做了改進后,實驗結果較之前精準,證明了本方法的正確性和有效性。
5 結 論
應用計算機視覺理論,建立了汽車四輪定位參數測量的數學模型,重點闡明了的改進SUSAN算子的亞像素角點檢測,避免了傳統SUSAN算子混淆角點和邊緣的缺點,可有效地檢測出正確的角點。由于只在棋盤格邊緣點附近進行角點檢測,其運算速度大大提高。灰度平方重心法的亞像素定位方法簡單高效,所以該方法非常適合于運用棋盤格對攝像機進行在線標定的場合。這是一種有別于傳統檢測法的新方法,以便提高汽車四輪定位的檢測精度。
參考文獻
[1] 羅進益,周. 轎車凹輪定位檢測與調整[M]. 北京:人民交通出版社,2002,3.
[2] 張遙遠,劉美生,羅發貴,王蛟茹. 四輪定位儀的性能評價與檢測[J]. 中國測試技術,2004,30(4):3-6.
[3] 高 文,陳熙霖. 計算機視覺[M]. 北京:清華大學出版社,1999.
[4] 胡修泰. 3D激光車輪定位儀[J]. 汽車維護與修理,2003(07):22-25.
[5] 王德超,涂亞慶,張鐵楠. 基于計算機視覺的汽車四輪定位參數檢測數學模型及方法[J]. 汽車工程,2008,30(03):223-228.
[6] 張鐵楠,涂亞慶,王德超. 基于計算機視覺的汽車車輪定位技術研究[J]. 電子測量技術, 2008,31(04):52-56.
[7] 郝潁明,朱 楓. 攝像機標定中的棋盤格自動檢測[J]. 計算機工程,2007,33(17):213-215.
[8] 劉永強,劉軍民. 基于視覺測量的汽車車輪定位技術的研究[J]. 大連理工大學網絡學刊. 2008.