前言:中文期刊網精心挑選了計算機視覺的前景范文供你參考和學習,希望我們的參考范文能激發你的文章創作靈感,歡迎閱讀。
計算機視覺的前景范文1
關鍵詞:動態場景;自適應預測;多特征融合;計算機視覺;運動目標
接受信息的關鍵手段之一就是視覺系統,隨著科學技術水平的不斷發展,以及計算機和信號處理理論的誕生,讓機器擁有人類視覺功能已經不再是夢。對所采集視頻中的運動目標進行跟蹤、檢測,并對其目標行為進行分析,就是運動目標分析的內容,運動目標分析是計算機視覺領域關鍵內容之一,其屬于圖像理解與圖像分析的范疇。而在運動目標分析系統中,跟蹤與檢測運動目標則為中級和低級處理部分,是分析與理解行為的高等層分析模塊的基礎。檢測與跟蹤運動目標技術主要包括了:機器人視覺導航、軍事領域、運動圖像編碼、交通管制、視覺監視等。
1目標檢測算法
連續圖像序列由視頻中提取出,由前景區域與背景區域共同組成了整個畫面。前景區域包含了如運動的人體、車輛等動態要素,它是指人們較為感興趣的區域。而背景區域主要包含例如樹木、建筑物等靜態要素,它的像素值僅發生微弱變化或者不產生變化。在連續圖像序列中,采用一系列算法分隔開背景區域和前景區域,將運動目標信息有效提取,則為運動目標檢測。以靜態場景為基礎的運動目標檢測算法包括了光流法、背景差分法、幀間查分法等,文章主要針對背景差分法進行介紹。
背景差分法通常適用于靜態場景,其是將背景圖像與當前幀圖像進行差分,運動目標依靠閥值化進行檢測,因為該算法僅能夠在背景變化緩慢或者不發生變化的情況下應用,因此就有著一定的局限性。假設當前幀圖像為fk(x,y),背景圖像B(x,y)可通過一定的方法得出,而這時背景差分圖像則為:
(1)
而假設二值化閥值為Th,二值化圖像B(x,y)則為:
(2)
運動目標檢測結果可通過數學形態學處理獲得。
2 背景模型的實時更新
要更新背景圖像可采用一階KALMAN濾波來實現,為了克服氣候變化、光照變化等外部環境變化對運動檢測產生的影響,采用一階KALMAN濾波更新背景圖像公式如下:
Bk+1(p)=Bk(p)+g(Ik(p)-Bk(p)) (3)
而增益因子則為:g=?琢1(1-Mk(p))+?琢2Mk(p) (4)
公式中?琢1和?琢2是權值系數;M是第k時刻二值化后目標圖像中p像素的值;B為背景圖像;I為當前幀圖像。要想將運動目標從背景序列圖像中有效分割出來,就必須要達到?琢2足夠小的條件,且?琢1應等于或者大于10?琢2,若?琢1值過大,就會將算法自身的去噪特性喪失,在序列背景圖像中也會存儲越來越多的運動變化。
3 更新車輛目標模型
核與活動輪廓算法具有效率高、技術復雜度低等特點,它以非參數核概率密度估計理論為基礎,在視頻運動目標跟蹤中廣泛應用。彩色圖像序列通過攝像機獲取,人臉目標模型可以采用RGB顏色空間來進行描述。在跟蹤車輛的過程中,噪聲、遮擋、光照等干擾或多或少存在,因干擾因素的存在,車輛像素特征也會發生相應的微弱變化。若不對目標模型進行更新,會對跟蹤精度產生影響,所以,采用的矩形模板會包括一定背景。而在實施跟蹤的過程中,要對車輛目標模型進行更換。如果其過程物遮擋,當BHATTACHARYYA系數滿足?籽>Tudm條件時,更新車輛目標模型,更新模型為:
(5)
公式中Tudm是模板更新閥值;qk-1是更新之前的車輛目標模型。通過視頻跟蹤,在近場景和遠場景拍攝到的視頻中,多尺度圖像空間由各個幀圖像構成。例如:將將書本作為跟蹤對象,由遠及近從書本的正上方拍攝六十幀圖像,為了能使矩形框正好能夠包含書本,對每幀圖像張書本手工劃定矩形框,并對框內圖像的信息量進行統計。最后,隨書本尺度的變化,給出圖像信息量變化曲線。
4 計算機視覺原理
計算機視覺是一門研究怎樣使機器進行觀察的科學,更切確地說,就是指利用電腦和攝影機代替人眼對目標進行識別、跟蹤和測量等機器視覺,并進一步做圖形處理,用電腦處理成為傳送給儀器檢測或更適合人眼觀察的圖像。計算機視覺研究相關的理論和技術作為一個科學學科,嘗試創建能夠從圖像或者多維數據中獲取信息的人工智能系統。這里所指的信息指Shannon定義的,可以用來幫助做一個決定的信息。因為感知可以看作是從感官信號中提取信息,所以計算機視覺也可以看作是研究如何使人工系統從圖像或多維數據中感知的科學。
計算機視覺就是由計算機來代替大腦完成處理和解釋,用各種成象系統代替視覺器官作為輸入敏感手段。使計算機能象人那樣通過視覺觀察和理解世界,具有自主適應環境的能力就是計算機視覺的最終研究目標,而需要經過長期的努力才能達到這個目標。所以,在實現最終目標以前,通過努力的中期目標是建立一種視覺系統,這個系統能依靠反饋的某種程度的智能和視覺敏感完成一定的任務。例如:計算機視覺的一個重要應用領域就是自主車輛的視覺導航,但要實現自主導航的系統,卻還沒有條件實現象人那樣能識別和理解任何環境。所以,人們通過不懈的努力,研究在高速公路上具有道路跟蹤能力,有效避免與前方車輛碰撞的視覺輔助駕駛系統。人類視覺系統是有史以來,人們所知道的功能最強大和完善的視覺系統。這里要指出的一點是在計算機視覺系統中計算機起代替人腦的作用。計算機視覺可以而且應該根據計算機系統的特點來進行視覺信息的處理,但并不等于計算機必須按人類視覺的方法完成視覺信息的處理??梢哉f,對人類視覺處理機制的研究將給計算機視覺的研究提供指導和啟發,所以,用計算機信息處理的方法研究人類視覺的機理,建立人類視覺的計算理論,與此同時也是一個十分重要和讓人感興趣的研究領域。這方面的研究被稱為計算視覺。計算視覺可被認為是計算機視覺中的一個研究領域。計算機視覺領域的不完善性與多樣性為其突出特點。
5 結束語
對視頻中的運動目標進行跟蹤、識別、檢測,并對目標行為進行研究、分析,這就是基于視覺運動目標分析。以計算機視覺為基礎,分析運動目標,包括了目標行為的理解與分析、目標跟蹤、運動目標檢測、預處理圖像等,它是計算機視覺領域重要內容之一。理解與分析運動目標的行為,既是計算機視覺的根本目的之一,也是檢測與跟蹤運動目標的最終目標。從理論層考慮,理解與分析運動目標的行為可以分為人工智能理論研究與模式識別。簡要闡述基于計算機視覺的運動目標分析,而所面臨的是對運動目標行為的理解。
參考文獻
[1]楊可,劉明軍,毛欣,夏維建,劉偉,周旋,吳煒,周凱.基于計算機視覺的電纜終端表面溫升分析系統[J].電視技術,2013(7).
[2]葉闖,沈益青,李豪,曹思汗,王柏祥.基于人類視覺特性(HVS)的離散小波變換(DWT)數字水印算法[J].浙江大學學報:理學版,2013(2).
[3]何青海,馬本學,瞿端陽,李宏偉,王寶.基于機器視覺棉葉螨自動監測與分級方法研究[J].農機化研究,2013(4).
[4]賈挺猛,茍一,鮑官軍,董茂,楊慶華.基于機器視覺的葡萄樹枝骨架提取算法研究[J].機電工程,2013(4).
計算機視覺的前景范文2
關鍵詞:印制電路板;圖像處理;機器視覺;PCB裸板;自動光學檢測;缺陷檢測 文獻標識碼:A
中圖分類號:TP391 文章編號:1009-2374(2016)09-0010-05 DOI:10.13535/ki.11-4406/n.2016.09.005
我國是全球第一大PCB生產基地,作為電子產品承載體的電路板,其集成度和產量不斷在提高。為了保證電子產品的性能,電路板缺陷檢測技術已經成為電子行業中非常關鍵的技術。建立在圖像處理算法基礎上的機器視覺檢測技術與傳統的人工檢測技術相比,提高了缺陷檢測的效率和準確度。因此,設計一種高效精準的機器視覺檢測電路板缺陷的系統,具有非常重要的現實意義。評估印刷電路板質量的一個重要因素就是表觀檢測,PCB的表觀質量對產品性能及成品使用安全有著極大的重要性。而伴隨著近年來在工業生產領域崛起的計算機視覺,當前表觀缺陷檢測和分類識別的研究方向已經轉向了利用計算機視覺技術來實現。計算機圖像處理識別技術這種基于計算機視覺的檢測技術成功取代了傳統的PCB缺陷檢測方法,在自動光學檢測系統眾多應用中占據了相對重要的地位,一躍成為PCB生產業表觀缺陷的主要檢測方法。
圖1 系統框圖
因此本文通過設計AOI自動光學檢測系統,搭建較為簡單的PCB缺陷自動檢測系統的實驗平臺,對PCB中四類較為關鍵、常見的缺陷進行檢測、分析、識別、判定,為研究推廣PCB缺陷自動檢測系統開拓應用前景,如能實現工業上的產業化檢測,將有高額的經濟收益。本文側重對PCB中的四類較為關鍵、常見的缺陷進行檢測、分析、識別、判定,并且僅搭建了較為簡單的PCB缺陷自動檢測系統的實驗平臺,即通過復雜算法對采集到的圖像進行處理、配準、對比,從而得出PCB缺陷類型及對其進行標識。如圖1所示。
1 硬件設計方案
PCB缺陷檢測的總體系統設計方案主要是基于自動光學檢測技術來搭建PCB缺陷檢測系統,硬件設計是使用CNC-T程控光源高精度影像測試系統操作臺,對待測電路板進行圖像采集,再通過VS2010軟件所編寫程序處理,得出待測電路板的缺陷種類。整個系統主要分為運動控制、光源、圖像采集、圖像處理四個模塊,分模塊簡要闡述了實驗過程、所需設備以及軟件算法,搭建了一個相對完整的系統工作平臺。
圖2 CNC-T程控光源影像操作臺
該設備具有測量元素種類齊全、手動測量、自動對焦等多種功能,使用該設備采集圖像進行二維檢測,測量軟體為YR-CNC,將圖像儲存至電腦后便由VS軟件進行圖像處理。實驗組成如圖3所示:
圖3 實驗系統框圖
1.1 運動控制模塊
本系統運動流程為:被檢測的PCB在檢測臺上,通過步進電機XY軸運動到攝像機拍攝區域,CCD攝像機固定在工作臺上方(Z軸),通過Z軸的運動實現聚焦。如圖4所示:
圖4 平臺運動示意圖
設備工作臺臺面尺寸為746mm×506mm,承載玻璃面尺寸為452mm×354mm,有效測量行程為400×300×200。本裝置既可通過軟件驅動自動采集圖像,也可以通過手動控制,移動并聚焦采集待測PCB的圖像。
1.2 光源模塊
輔助光照――采用的是正向和背向光源這兩種輔助光照。其中正光源和攝像頭同側,均位于Z軸上,正光源主要用于檢測待測物體的表面特征。背光源位于檢測臺面下方,與正光源處于同軸反向關系,背光源能突出待測物體的輪廓特征,常用于檢測物體輪廓尺寸。
圖像采集:分別利用正光源突出PCB表面如走線、過孔和焊盤等主要特征,而下光源主要使PCB的輪廓尺寸和過孔產生強烈的輪廓對比。
光源:使用的是高度集中照明光源中心的LDR系列,由于該光源的傘狀結構緊密排列著LED且采用了CCS獨創的柔性板,使之成為LED照明系統的標準模式。照明系統如圖5所示:
圖5 照明系統
1.3 圖像采集模塊
圖像采集模塊是由圖像采集卡、相機和鏡頭組成的,該模塊是圖像配準階段的硬件基礎。計算機采集圖像的媒介就是相機,而相機按照不同原理又分為多種,常見的有CCD(Charge Coupled Device)和CMOS(Complementary Metal Oxide Semiconductor)兩類。本系統采用的是CCD 1/2英寸43萬像素彩色攝像頭和高清晰度0.7~4.5X變焦倍率鏡頭,顯示分辨率為0.001mm。
1.4 圖像處理模塊
通常獲得的圖像將受到工業現場環境、光照等條件的干擾,計算機所獲得的圖像質量多數參差不齊,圖像的清晰度不一致,大大增加了PCB缺陷檢測的難度,所以在利用復雜算法檢測、識別PCB缺陷前要先對圖像進行預處理。
本圖像處理模塊主要通過VS軟件在OpenCV計算機視覺庫的基礎上,通過一系列算法對圖像進行處理對比。
2 系統軟件設計
2.1 OpenCV
OpenCV(Open Source Computer Vision Library)是一個跨平臺的可以運行在Linux、Windows和Mac OS操作系統上的基于(開源)發行的計算機視覺庫。它重量輕而高效,開放了多種接口如MATLAB、Ruby和Python等,并且在計算機視覺和圖像處理中大多數通用的算法都是被允許的。OpenCV可用于開發實時圖像處理、計算機視覺和模式識別方案,它提供了多種函數,實現了大量的計算機視覺算法,算法涵蓋了從最基礎的濾波至以高級的物體檢測。OpenCV實際上是一堆C和C++語言源代碼文件,許多常見的計算機視覺算法由這些源代碼文件實現。如C接口函數cvCanny()實現Canny邊緣檢測算法。它可直接加入到我們自己的軟件項目編程中,而無需去編寫自己的Canny算子代碼,就是沒有必要重復“造輪子”。
根據OpenCV中源代碼文件巨多的特點,以算法的功能為基準,將這些源文件分到多個模塊中,如core、imgproc、highgui等。將每個模塊中的源文件編譯成一個庫文件(如opencv_core.lib、opencv_imgproc.lib、opencv_highgui.lib等),用戶在使用時,僅需在自己的項目中添加要用的庫文件,與自己的源文件一起連接成可執行程序即可。
OpenCV計算機視覺庫的出現,是為了使人們利用方便快捷的計算機視覺框架,在計算機視覺領域可以更加輕松地設計出更為復雜的應用程序。OpenCV涵蓋了多種計算機視覺應用區域,如用戶界面、信息安全、醫學影像學、工廠產品檢驗、立體視覺、機器人和攝像機標定等,約有500多個函數。因為計算機視覺與機器學習是相輔相成的,所以OpenCV也開放了MLL(Machine Learning Library)機器學習庫。MLL除了在視覺任務相關中使用,也可以很容易地應用到其他機器學習中。
2.2 Microsoft Visual Studio2010
Visual Studio是微軟公司推出的開發環境,是同行業中目前最流行的Windows平臺應用程序開發環境。Visual Studio 2010于2010年4月12日,其集成開發環境(IDE)已被重新設計和組織,變得更簡單了。
Visual Studio 2010同時帶來了NET Framework 4.0、Microsoft Visual Studio 2010 CTP(Community Technology Preview――CTP),并且支持開發面向Windows 7的應用程序。除了Microsoft SQL Server外,它還支持IBM DB2和Oracle數據庫。目前有專業版、高級版、旗艦版、學習版和測試版五個版本。Visual Studio的用處十分廣泛,不僅可被用來基于Windows平臺創建Windows應用程序和Web應用程序,還可被用來創建智能設備、Office插件和Web服務等應用程序。微軟的Visual Studio 2010將成為一個版本的經典,這是相當于6.0版本。該版本可以自定義開始頁,新功能還包括:(1)C# 4.0中的動態類型和動態編程;(2)多顯示器支持;(3)使用Visual Studio 2010的特性支持TDD;(4)支持Office;(5)Quick Search特性;(6)C++ 0x新特性;(7)IDE增強;(8)使用Visual C++ 2010創建Ribbon界面;(9)新增基于.NET平臺的語言F#。本課題將基于OpenCV計算機視覺庫使用Microsoft Visual Studio2010開發環境,通過編輯算法實現PCB缺陷檢測。
3 圖像預處理
要使用計算機對圖像進行處理,所得到的連續圖像就必須被轉換為離散的數據集,這是因為計算機只能處理離散度數據,這一過程我們稱之為圖像采集。圖像采集由圖像采集系統實現,如圖6所示。圖像采集系統的三個主要模塊是成像系統、采樣系統和量化器。
圖6
將整理出的字符圖像交予識別模塊來識別,被稱為圖像的預處理。PCB的圖像預處理包括灰度化、增強、濾波、二值化、配準等,處理后的PCB輸出的圖像質量將得到改善,在很大程度上使得該圖像特征更直觀,方便計算機分析和處理。PCB的圖像預處理為整個PCB缺陷檢測系統的核心部件,很大程度上決定了檢測的準確性。圖像預處理流程如圖7所示:
圖7 圖像預處理流程圖
4 PCB缺陷檢測
本文針對四種常見缺陷:斷路、短路、毛刺(凸起)、缺損(凹陷)進行檢測研究。在這四種缺陷中,最為嚴重的缺陷類型是斷路和短路,它們將會使整塊板子失去本來的功能;而凸起、凹陷也可能影響到PCB在使用過程中的穩定性能。如圖8所示為幾種常見的缺陷:
圖8 常見電路板缺陷
4.1 PCB缺陷的檢測方法
常用的PCB缺陷檢測方法有參考法和非參考法兩種。要是從概念理解和電路難易程度看,參考法明顯更加具有概念直觀、電路簡單的優勢;要是從檢測所需要的條件來看,非參考法則在不需要待測PCB與標準PCB進行準確對準這一點上優于參考法。
本課題采用參考法進行PCB缺陷檢測。
使用參考法對PCB缺陷進行檢測的流程為:(1)確定標準的PCB圖像并放入參考庫;(2)通過成像設備采集待測PCB圖像,進行圖像預處理之后,再二值化PCB待測圖像,并對其進行連通域提取;(3)然后將處理結果與標準圖像進行對比,利用圖像相減來判斷PCB可能存在的缺陷;(4)進行分類,確定缺陷類型。
4.2 圖像連通域
像素是圖像中最小的單位,每個像素周圍有8個鄰接像素,常見的鄰接關系有兩種:4鄰接與8鄰接。4鄰接一共4個點,即上下左右。包括對角線位置的點,8鄰接的點一共有8個,如圖9所示:
圖9 領域示圖
如果像素點A與B鄰接,我們稱A與B連通,即有如下的結論:
如果A與B連通、B與C連通,則A與C連通。在視覺上看來,點與點相互連通,形成一個區域,而不是連通的點形成不同的區域。這種相互立體的所有的點,我們稱為連通區域。連通區域標記常用的方法有Two-Pass(兩遍掃描法)和Seed Filling(種子填充法)兩種方法,本課題主要介紹第二種。
Seed Filling來源于計算機圖形學,通常應用在填充圖形上。思路:以一個前景像素當作種子,而后在處于同一像素值且位置相鄰的連通區域,把和種子相鄰的前景像素融合到同一組像素中,結果將是獲得一個像素集,即連通區域。接下來介紹使用種子填充法實現的連通區域分析法:
第一,重復掃描圖像,當得到當前像素點B(x,y)=1時停止:(1)賦予B(x,y)一個label,并將像素位置作為種子,接著將所有位于該種子周圍的前景像素都壓入棧中;(2)將棧頂像素賦以相同的label值并彈出,接著將全部位于棧頂像素周邊的前景像素都壓入棧中;(3)重復(2)步驟,直到棧為空。此時,圖像B中的一個像素值被標記為label的連通區域便被找到了。
第二,在掃描結束前,重復第一個步驟,由此可以獲得圖像B中所有的連通區域在掃描結束后。
掃描所得的連通域如圖10所示:
圖10 圖像連通域提取
4.3 缺陷識別
缺陷識別具體特征如表1所示:
表1 缺陷特征
缺陷種類 二值圖像面積 連通區域數
斷路 減少 增加
短路 增加 減少
凸起 增加 不變
凹陷 減少 不變
第一,短路和斷路。在出現短路缺陷時,待測圖像與標準圖像相比,其所包含的連通區域數將會減少。同理可得,在出現斷路缺陷時,待測圖像與標準圖像相比,其所包含的連通區域數將會增多。因此,斷路和短路缺陷便可利用比較連通區域數來判定和識別。
第二,凸起和凹陷。凸起缺陷將導致導線和導線、導線和其他導體間的間隙變小,而凹陷缺陷將導致導線和導線、導線和其他導體間的間隙變大,二者均會導致PCB使用過程中出現不穩定狀態。而觀察可知,這兩種缺陷的連通區域相同,差別在于各自二值化面積的大小,所以可以通過計算該待測圖像的連通區域面積來識別凸起、凹陷缺陷。
識別過程:將經過圖像預處理的待測PCB圖像與標準圖像進行對比后,通過算法找出缺陷。比較二者的連通區域數,若前者大于后者,則標定該缺陷點為斷路,反之則為短路;若二者連通區域數相同,則比較二值化圖像面積,若前者大于后者,則標定該缺陷點為凸起,反之則為凹陷。檢測流程如圖11所示:
圖11 PCB缺陷檢測流程圖
5 系統實驗
本文使用CNC-T程控光源高精度影像測試系統操作臺,結合VS2010軟件基于OpenCV計算機視覺庫的算法編程來實現PCB的缺陷檢測。整體實驗過程為:手動控制操作臺捕捉、聚焦、采集待測PCB的圖像,采集到的圖像與標準圖像進行對比、識別,得出缺陷種類并顯示結果。
本課題一共就所研究缺陷類型,做了40組實驗,通過實驗結果計算正確率。如表2所示:
表2 實驗結果統計
缺陷類型 實驗次數 正確率
斷路 10 100%
短路 10 100%
凸起 10 100%
凹陷 10 100%
針對不同電路板圖中出現的同種斷路類型進行檢測,效果如圖12a、圖12b、圖12c所示,可準確檢測出缺陷存在。
圖12
針對不同電路板圖中出現的同種短路類型進行檢測,效果如圖13a、圖13b、圖13c所示,可準確檢測出缺陷存在。
圖13
針對不同電路板圖中出現的同種凸起類型進行檢測,效果如圖14a、圖14b、圖14c所示,可準確檢測出缺陷存在。
圖14
針對不同電路板圖中出現的同種凹陷類型進行檢測,效果如圖15a、圖15b、圖15c所示,可準確檢測出缺陷存在。
圖15
6 結語
PCB板面向體積越來越小、密度越來越高的方向發展。在檢測產品價格方面,國外AOI檢測產品價格普遍偏高,而由于經濟原因,在國內PCB板生產制造商多數仍采用人工目測等傳統檢測方法檢測。隨著經濟的發展,數字圖像處理研究的深入,自動光學檢測系統也開始頻繁活躍在人們視線中,但在PCB缺陷檢測方面的應用卻還有待完善。因此,本論文建立在深入掌握工控系統結構并從PCB板的質量標準、圖像特點、缺陷特征及檢測要求的分析基礎上,對以圖像處理為基礎的PCB缺陷檢測技術進行了深入研究。由于PCB缺陷自動檢測系統的研究涉及多個領域的知識,其研究過程十分耗時、繁瑣,由此,本論文僅僅對PCB缺陷檢測中較為常見的問題進行了較深入研究,并且僅搭建了較為簡單的PCB缺陷自動檢測系統的實驗平臺,對PCB中的四類較為關鍵、常見的缺陷進行檢測、分析、識別、判定。雖然還未實現真正實現工業上產業化檢測,但是在未來幾十年中,研究推廣的PCB缺陷自動檢測系統將有十分良好的應用前景,也將有高額的經濟收益。
參考文獻
[1] 陳勝勇,劉盛,等.基于OpenCV的計算機視覺技術實現[M].北京:科學出版社,2008.
[2] Gary Bradski,Adrian Kaebler,于仕琪,等.學習OpenCV[M].北京:清華大學出版社,2009.
[3] 周長發.精通Visual C++圖像處理編程(第3版)
[M].北京:電子工業出版社,2006.
[4] 黨振.中國大陸PCB產業的現狀與未來[J].印制電路信息,2006,32(1).
[5] 胡躍明,譚穎.自動光學檢測在中國的應用現狀和發展[J].微計算機信息,2006,(4).
[6] 李漢,何星,等.印刷電路板的自動光學檢測系統
[J].無損檢測,2004,26(6).
[7] 張利,高永英,等.PCB板檢測中的定位研究[J].中國圖像圖形學,1999,4(8).
[8] 姚立新,張武學,等.AOI系統在PCB中的應用[J].電子工業專用備,2004,(5).
[9] 范小濤,夏雨人.一種基于圖像處理的PCB檢測算法研究[J].計算機工程與應用,2004,(13).
[10] 傅莉.印制電路板的發展及前景[J].電腦與電信,2010,(5).
[11] 張明軒.基于視頻序列的人臉檢測與跟蹤算法研究[D].中北大學,2011.
[12] 張馳.基于機器視覺的智能控制與圖像識別問題研究[D].蘭州理工大學,2009.
[13] 謝飛.基于計算機視覺的自動光學檢測關鍵技術與應用研究[D].南京大學,2013.
[14] 張靜.PCB表觀缺陷的自動光學檢測理論與技術
[D].電子科技大學,2013.
[15] 俞瑋.AOI技術在PCB缺陷檢測中的應用研究[D].電子科技大學,2007.
計算機視覺的前景范文3
關鍵詞:計算機視覺;背景差法;圖像處理;車流量檢測;二值化
中圖分類號:TP391 文獻標識碼:A 文章編號:1009-3044(2013)19-4493-03
隨著現代交通的快速發展,車輛的日益增多,合理利用道路資源成為目前一項重要課題。為了實現快速準確地檢測道路中的車流量,該文提出了一種基于計算機視覺的車流量檢測方法。
1 車輛前景圖像的提取
對車輛進行檢測的前提是提取車輛的前景圖像,即在視頻序列中實時地發現并提取運動目標,為之后運動目標的處理、識別、分析等算法提供數據[1]。一般情況下視頻監控中背景與攝像頭之間相對位置保持不變,則背景圖像的大小和位置在不同幀中將保持不變,于是可以直接利用幀間同一位置像素的亮度或顏色的差別來進行變化檢測,并提取目標。對于運動目標檢測和提取算法,常用的有幀間差法、背景差法這兩種方法。
幀間差法是利用相鄰幀的圖像相減得到車輛的前景圖像,而背景差法是利用當前的圖像減去背景圖像得到車輛的前景圖像。后者更加直接有效,通常能夠提供最完備的特征數據,是當前靜止背景下進行運動目標檢測的最常用的方法[2]。具體做法:
[Dt(x,y)=ft(x,y)-f(x,y)] (1)
其中[Dt(x,y)]為提取出來的車輛前景圖像;[ft(x,y)]為當前視頻圖像;[f(x,y)]為視頻的背景圖像。攝像頭的位置是不變的,所以當前視頻圖像的背景與背景圖片相同,相減后相同點的灰度值都變為零。而車輛包含的點在兩幅圖中的灰度值不一樣,相減后不為零 [3]。實驗結果如圖1-圖3所示。
如圖所示:實時路況圖像與背景圖像相減后可以得到車輛前景圖像。這種方法得到的車輛前景圖像很完整,能夠很清楚的分辨出前景車輛。但這種方法最大的缺陷就是陰影問題比較嚴重,與此同時,背景圖像的選取也很重要。
2 車輛前景圖像的處理
2.1圖像二值化
攝像頭拍攝到的圖像一般為彩色圖像,包含了豐富的信息,比如光照信息,物體表面的顏色信息等。但這些信息對運動車輛的檢測作用不大,并且占用了大量的內存空間,嚴重影響到圖像處理的速度和效率。因此,我們需要對圖像進行二值化處理 [4]。
在數字圖像處理中,二值圖像占有非常重要的地位。二值化后的圖像不再涉及像素的多級值,使處理變得簡單,而且數據的處理量較小。此外,二值化后的圖像能夠用幾何學中的概念進行分析和特征描述,具有很大的優勢。為了得到理想的二值圖,我們一般用值域分割的方法,即該點的灰度值大于某個值時,就將該點的灰度值置為1,而小于該值的話就將該點的灰度值置為0。
[g(x,y)=1f(x,y)≥T0f(x,y)≥T] (2)
通過設定閾值T,可以將圖像進行二值化。二值化后可以很清晰地分辨出車輛信息。便于圖像的后期處理。圖4為二值化后的圖像,該圖像可以很清楚地分辨出車輛信息,但會出現有些車輛的前景圖像不完整或區域不連通,這樣對車輛計數有很大影響,這就需要對車輛前景圖像進行完善處理。
2.2圖像膨脹和填充
經過二值化后的圖片,由于車輛本身各點的像素灰度值不同,其有些點的灰度值與背景圖像上相應點的灰度值很接近,再經過一定閾值的二值化后,這些點的灰度值就完全為“0”[5]。這樣一輛車得到得前景圖像就會不完整或者區域不連通,會導致圖像中目標計數的不準確。針對這個問題可以通過圖像的膨脹和填充將圖片變得更完整。
如圖5可知,車輛的二值圖像已經是一個完整的塊,但圖像仍然含有噪聲及小物體(如青色框框出部分),計算機同樣也會將其默認為車輛信息。因此我們需要將這些噪聲和小物體去除掉。
2.3圖像去噪
在車輛的前景圖像中由于噪聲的存在以及二值化閾值取得不合理會導致二值化圖像中小目標的出現,從而影響計算機對車輛的識別。因此,我們需要將圖像中這樣的小物體去除。首先我們要區分開車輛的前景圖像和小物體,我們可以從面積來識別車輛。一般小目標二值化后的面積要比車輛的面積小得多,通過設定合適的閾值,可以將小目標去除,這樣就可以得到僅為車輛前景圖像的二值化圖[6]。如圖6。
2.4車輛計數
車輛前景圖像經過二值化,膨脹,填充等一系列處理之后,圖像中每個車輛都有自己獨立的區域,計算機就可以對圖像中目標進行計數。由于每個區域的圖像像素是連續的,在二值圖像中表現為連通性,因此可以利用計算連通圖的數量來求出目標數量。在MATLAB中利用bwlabel函數[7]可求出連通圖的數量,對于圖6中的車輛計數結果如圖7。
雖然攝像頭置高可以解決部分車輛重疊問題,但由于車輛陰影的影響還會有部分車輛會粘連在一起。由圖8可知:目標塊2,3,4,5這四個都是一輛車得二值化圖像塊,但目標塊1卻不是一輛車的二值化圖像塊。目標塊1是幾輛車粘連在一塊了,這樣就導致計算機對車輛的計數有誤差。
但是從各個塊得外接矩形可以明顯比較出圖像塊1的外接矩形形狀和其他四個有明顯差別。根據這個差別我們可以通過外接矩形的長寬比來賦予計算機識別車輛粘連問題的能力。通過給車輛塊的外接矩形的長寬比定義設定閾值,在設定的閾值范圍內就表示有輛車。從而計算出粘連在一塊的車的數量。下面是車輛計數結果:
圖像中目標塊數為5塊,真實車輛塊數為7輛(2輛汽車,1輛電瓶車)。
3 結束語
實驗結果表明,該文方法魯棒性好,實用價值高,能夠準確地對車輛進行計數,得到實時路況信息,在只能交通領域有著廣泛的應用前景。
參考文獻:
[1] 章毓晉.圖像理解和計算機視覺[M].北京:清華大學出版社,2000.
[2] 盧強,陳泉林,林康紅,奉玲,等.智能交通監控系統中路況圖像背景去除算法研究[J].電子技術應用,2001(11):35-36.
[3] 董長虹,賴志國,余嘯海. Matlab圖像處理與應用[M].北京:國防工業出版社,2004.
[4] 夏良正.數字圖像處理[M].南京:東南大學出版社,2001.
[5] 容觀澳.計算機圖像處理[M].清華大學出版社,2000.
計算機視覺的前景范文4
關鍵詞:無損檢測;農產品;分級
引言:自1993年開始,我國果品總產量超過印度、巴西和美國,躍居世界首位。因此,水果的品質分析就顯得更加重要。水果品質檢測主要包括硬度、糖度、酸度等多種指標檢測,傳統的檢測方法主要采用的是化學方法,測量過程復雜,等待時間長,也就降低了其實際的使用意義。無損檢測技術(Nondestructive Determination Techonol ogies,簡稱NDT)主要指的是在不破壞或損壞被檢測對象的基礎上,利用農產品內部結構異?;蛉毕荽嬖谒鸬膶帷⒙?、光、電、磁等反應的變化,來探測各種農產品等內部和表面缺陷,并對缺陷的類型、性質、數量、形狀、位置、尺寸、分布及其變化做出判斷和評價。
一、農產品無損檢測技術介紹
(一)核磁共振技術
核磁共振技術(NMR)是一種探測濃縮氫質子的技術,它對農產品中的水、脂的混合團料狀態下的響應變化比較敏感。自1946年美國科學家F.Bloch和E.M.Purcell發現了核磁共振現象以來,核磁共振技術在研究物質的結構方面得到了廣泛應用。核磁共振能生成果實內部組織的高清晰圖像,不僅可用于檢測果品的壓傷、蟲害、成熟度,在測定蘋果、香蕉的糖度等方面也具有潛在價值。對于采收成熟度直接影響品質的品種,利用核磁共振技術可大大提高收獲、運輸的可靠性。目前,該項技術真正用于果品的內部檢測和質量評價還有很多問題有待研究,但由于其卓越的優點,將會是一種很好的果品無損檢測方法。
(二)聲學特征的應用
聲學特性反映的是聲波和農產品相互作用的基本規律,利用聲學特性主要是指根據農產品在聲波作用下反射特性、散射特性、吸收特性、衰減系數和聲波傳播速度及本身聲阻抗、固有頻率等的變化與農產品內部組織變化如結構、成分、物理狀態等物化特性信息間的關系進行。用于檢測的超聲波一般為低能超聲波,在被檢測物中傳播時不會引起其物理或化學特性的變化。低能超聲測量中最常用的3個參數為:聲速、聲衰減系數、聲阻抗。聲學無損檢測技術與光學、電學及其他無損檢測技術相比,有適應性強、投資較低、操作簡便快捷等優點,適用于在線檢測,在農產品檢測領域的應用前景良好。
利用農產品聲學特性對其內部品質進行無損檢測和分級是生物學、聲學、農業物料學、電子學、計算機等學科在農產品生產和加工中的綜合應用,該技術適應性強,檢測靈敏度高,對人體無害,成本低廉,易實現自動化,是果品無損檢測技術發展的重點領域。雖然國外學者對此技術已做了較多基礎研究,但這些研究基本上是研究農產品聲學特性共振頻率、反射折射透射特性、吸收特性、衰減特性、傳播速度、聲阻抗等中的某一特性與農產品某一品質指標的關系,而對多種聲學特性對農產品某一內部品質指標或多種內部品質指標的綜合影響的研究報道很少,阻礙了聲學檢測精度的提高。
(三)近紅外分析法的應用
近紅外光譜分析技術(Near Infrared Spectroscopy Analysis,簡稱NIR)是利用樣品中有代表性的有機成分在近紅外光譜區域的最強吸收波長不同,以及吸收的強度與有機成分呈線性關系的原理進行定量分析。通過對已知有機成分含量的樣品與其近紅外光譜特征的回歸分析,建立定標方程,即可對含有同一種有機成分的樣品進行定量估測。
近紅外線波長為800~2500 nm,近紅外線照射在果實上,果實中構成糖和酸的官能基(-OH,-CH2,-NH)吸收與相應分子固有振動相一致的特定光線,近紅外分光法就是利用上述特性,從被吸收的光量非破壞檢測糖、酸、水分和葉綠素等成分的一種技術。該方法僅在建立標定線時破壞果實測定其化學成分,標定線做成后,只需測定樣品的近紅外線分光頻譜,就可得到成分的預測值,還能在瞬間同時測定多個成分。
(四)X射線檢測技術的應用
X射線檢測技術是指利用X射線的穿透能力對果蔬品質進行檢測的一種方法。X射線具有很好的穿透能力,而物質的密度大小又影響了其穿透量的多少,通過對透過穿透量多少的分析從而可以對物質的內部品質進行分析。檢測時所需的X射線強度弱,所以通常稱為軟X射線檢測技術。X射線檢測技術本來是為檢測一些不易拆卸分解的大型構件或機械零件的內部缺陷而開發應用的,近來已被成功地移植到農產品加工領域。
(五)機器視覺技術的應用
20世紀70年代開始,計算機視覺技術開始被應用到工業和農業之中,主要進行的是植物種類的鑒別、農產品品質檢測和分級。由于圖像處理技術專業的出現以及計算機成本的降低,機器視覺技術在農產品品質檢測與分級領域的應用中越來越具有吸引力。
計算機視覺是以計算機和圖像獲取部分為工具,以圖像處理技術、圖像分析技術、模式識別技術、人工智能技術為依托,處理所獲取的圖像信號,并從圖像中獲取某些特定信息。計算機視覺技術無需接觸特定對象便可從獲取的圖像中得到大量的信息,通過對這些信息的分析得到物體尺寸、表面缺陷、外觀形狀、表面色度等具體信息,進而實現外觀質量的綜合評價。
現在,用于農產品品質檢測與分級的可見光快速檢測主要是基于計算機視覺的檢測技術,利用光學傳感器或掃描攝像機攝像,綜合測出果品的表面顏色、對特定光的透光率、形狀和大小,并與事先貯存在計算機中的數據模型進行對比,推算出成熟度和糖分。
(六)電子鼻技術的應用
電子鼻技術是近年來興起的一種農產品無損檢測的方法,電子鼻一般由氣敏傳感器陣列、信號處理子系統和模式識別子系統等3大部分組成。它以特定的傳感器和模式識別系統快速提供被測樣品的整體信息,從而指示樣品的隱含特征。與普通的化學分析儀器,如色譜儀、光譜儀等不同,電子鼻得到的不是被測樣品中某種或某幾種成分的定性與定量結果,而是給予樣品中揮發性成分的整體信息,也稱“指紋”數據。
由于在同一個儀器裝置里采用了多類不同的矩陣技術,使檢測更能模擬人類嗅覺神經細胞,根據氣味標識和利用化學計量統計學軟件對不同氣味進行快速鑒別。在建立數據庫的基礎上,對每一樣品進行數據計算和識別,可得到樣品的“氣味指紋圖”和“氣味標記”。
二、無損檢測技術的應用前景
無損檢測技術作為一種新興的檢測技術,在不破壞果蔬品質的基礎上,對果蔬的品質進行檢測和分級利用光學、電學以及電腦信息技術等的先進技術對果蔬的品質進行準確、快速的檢測。隨著我國人民生活水平的提高,我們對新鮮果蔬的品質要求也越來越高,無損檢測技術適合加工高效率、大規模的要求,因此,這種檢測方法必將在未來的農產品檢測和分級中得到廣泛的應用。
參考文獻:
計算機視覺的前景范文5
關鍵詞:農業機械;技術手段;應用;發展前景
我國在國際上的地位正在逐漸提高,這與我國的經濟發展是分不開的,經濟的發展需要基礎的支持,農業就是我國的基礎,我國是農業大國,農村人口基數大。隨著近幾年我國農業的發展,很多高新技術也被運用到農業的機械設備中,使農機設備向著智能化的方向發展,有效地提升了農業生產的整體效率。在農業的生產中使用高新技術還能夠提高農業的生產效率,保證農機相關機械的正常運作。
1農業機械技術的應用分析
1.1計算機技術
這里所說的計算機技術主要指的是計算機視覺技術,這一技術最早被運用在農業機械上是在20世紀70年代中期,當時主要運用的是計算機技術中的視覺技術,利用這一技術的主要目的是可以對農產品的品質質量進行分級別檢查。計算機視覺技術是以圖像處理為基準,隨著圖像處理以及視覺模擬技術的發展,計算機視覺技術不僅可以用來檢查農產品的品質,而且還可以用來對農產品進行播種、收割。雖然計算機視覺技術在我國農業技術領域的應用時間還不是很長,在實際的使用中還有很多的問題出現,但是相信隨著科學技術的不斷發展,計算機視覺技術必將會改變傳統的農業作業模式,為現代化農業發展提供技術上的支持。
1.2網絡信息技術
網絡信息技術在我國農業機械上的應用是非常成功的,信息技術與地理信息系統的有機結合不僅可以為農業的生產提供高精度的監控,而且還能夠對農業生產中出現病蟲害的情況進行及時的檢測,然后根據定位系統來進行田間作業。
1.3液壓技術
液壓技術主要依靠的是微電子技術和工業傳感技術,在數據的采集上,運用液壓技術主要完成的是能量的轉換和匹配,其目的是為了讓農業機械的效率能夠得到進一步的提高,讓機械設備的相關系統特征可以得到完善,讓機械設備的可靠性能夠得到提升,這也很好地符合了環境保護的相關標準要求。而大部分的農業機械都是采用內燃機作為原動力,所以很多時候都會出現工作負荷,一般情況下,我們都是通過電液控制手段來完成負載與原動力之間的匹配情況,盡可能地減少功率傳輸過程中出現的損失,從而提高農業機械系統的工作效率。
1.4人工智能技術
隨著信息全球化的不斷深入,高端技術不僅在大型的企事業單位中被運用,在農業中也得到了廣泛的應用,比較有成果的就是美國利用人工智能技術研發出激光拖拉機、機械的內部導航裝置,等等,這些裝置可以對拖拉機的運行方向及所處位置進行實時的測定,在了解地區土地信息之后,再制定合理的土地種植方案、農藥及種子的數量,等等。
2農業機械技術的發展趨勢
2.1推廣農業機械產品的技術發展
目前在我國的農業機械發展上,已經開始運用機電智能化技術和計算機技術,這使得農業機械化設備的科技含量有了極大的提高,不僅有效地提高了農業機械的作業效率,而且也提升了農業的生產效率。
2.2農業資源的利用率得到了提升
只有提高了農業資源的開發利用率,才能夠確保農業實現可持續發展,同時也為保護生態環境奠定基礎,如回收農業生產的廢棄物,普及無害化的處理設備,運用無害化技術來處理廢水可以有效地達到保護環境的作用。而在農業種植的過程中,使用有機肥料還可以進一步提高農業資源的利用效率。除此之外,大力發展節能型動力機械設備可以有效地避免出現資源浪費,從而提高農業資源的整體利用效率。
2.3提高農業機械產品的質量監督水平
要想提升農業的機械化水平,還要從規范設計的基本要求出發,全面提高農業產品的質量。在質量提升的過程中,還要注重農業產品的整體造型和外觀,農機設備的耐久性也要經得起考驗。選用與農機設備相配套的發電機及元件,能夠最大程度上提高農業機械產品的質量。在農業機械設備完成安裝之后,還要對其進行試運行,只有保證了設備各項指標都正常的基礎上,才能夠真正的投入使用,這也是提高農業機械產品可靠性的前提。
2.4加大政府的補貼力度
各級地方政府要加大農業機械的技術推廣,做好農業機械的培訓工作。國家還要將拖拉機、插秧機等農機具作為農具購置補貼的關鍵,普及農業機械知識。這樣也能夠更好地提高農業機械化的發展進程。
2.5確保農業機械技術的安全生產
關注安全監督管理及裝備的創建工作,加大農業機械的安全投入,以便更好地滿足農業機械工作安全監督管理的需求。除此之外,最重要的是,要將農業機械的安全檢驗工作納入到各級縣市政府的財政預算當中。
3結語
隨著科學技術的飛速發展,一些高新技術正在逐漸地被運用到農業的機械設備中,這些機械設備的出現不僅提高了農業的整體生產水平,而且還進一步提升了農業的生產效率,很好地實現了農業的可持續發展。在今后的農業發展過程中,農業機械也必定是智能化的,所以要求操作人員要不斷地提高自己的專業素養,全面推廣農業機械新技術,只有這樣才能夠真正意義上實現我國農業機械的智能化。
作者:徐家亮 劉曉鵬 單位:黑龍江省克東縣農機安全監理站
參考文獻:
[1]陶樂然.長春星宇小區新技術應用[C]//增強自主創新能力促進吉林經濟發展———啟明杯•吉林省第四屆科學技術學術年會論文集(下冊).2006.
[2]劉蒙之.傳播新技術與國家發展———一種政治經濟學的觀察[C]//中國傳播學會成立大會暨第九次全國傳播學研討會論文集.2006.
[3]張仁江,田莉.制造業企業新技術采納:動因、路徑及障礙分析———基于T公司的縱向案例研究[C]//第六屆(2011)中國管理學年會———技術與創新管理分會場論文集.2011.
[4]胡札進,姚尚斌,徐七三“.雙低”儲藏與四項儲糧新技術的綜合應用[C]//全面建設小康社會:中國科技工作者的歷史責任———中國科協2003年學術年會論文集(上).2003.
[5]柳旭.淺析電視空間新技術對審美體驗的影響[C]//2009中國電影電視技術學會影視技術文集.2010.
計算機視覺的前景范文6
在用常見的手勢進行交流時,人們很容易就能互相理解,在經過學習之后,聾啞人或是正常人都可以運用手語進行交流。不過,想象一下,當你對計算機(或機器)做一個手勢,它就能領會你的意圖會是怎樣的情景呢?如果計算機(或機器)看得懂手語,又意味著什么呢?姑且不管實現這樣的人機交流有何深遠的意義,還是先讓我們來探究一下這樣的可行性吧,想想看得懂手語的計算機(或機器)能有什么用途。
人機交互:從呆板到員活
人類之間的交流往往聲情并茂,既采用自然語言(口語、書面語言),還廣泛采用人體語言(表情、體勢、手勢)。與人類之間的交流相比,人機交互就顯得呆板多了。以計算機的輸入方式為例,人要向計算機下達指令,最常見的方式還是通過鍵盤輸入。當然,手寫輸入也正為許多人所接受和喜愛,語音輸入的研究也進行得熱火朝天,最初單一而呆板的輸入方式已經得到了擴展。然而,科學研究是永無止境的,人體語言這種簡單快捷的信息交流方式得到了很多研究者的關注,他們想,能不能把這種靈活的信息交流方式也引進人機交互中呢?
于是研究人員展開了對人體語言理解的研究。人體語言的感知、人體語言與自然語言的信息融合對提高計算機的人類語言理解水平,加強人機接口的可實用性有著積極的意義。手語(手勢)是人體語言的一個非常重要的組成部分,它是包含信息量最多的一種人體語言,它與語言、書面語等自然語言的表達能力相同。因而完全可以把手語作為人機交互的一種手段,它具有很強的視覺效果,生動、形象、直觀??梢?,將手勢運用于計算機能夠很好地改善人機交互的效率。
計算機怎樣識別手勢?
從不同的角度可以對手勢進行不同的分類。分為交互性手勢和操作性手勢,前者手的運動表示特定的信息(如樂隊指揮),靠視覺來感知,后者不表達任何信息(如彈琴);分為自主性手勢和非自主性手勢,后者需要與語音配合用來加強或補充某些信息(如演講者用手勢描述動作、空間結構等信息),分為離心手勢和向心手勢,前者直接針對說話人,有明確的交流意圖,后者只是反應說話人的情緒和內心的愿望。
手勢的各種組合、運動相當復雜,不過簡單來看,手勢主要有如下的特點:手是彈性物體,因此同一手勢之間差別很大,手有大量冗余信息,由于人識別手勢關鍵是識別手指特征,因此手掌特征是冗余的信息:手的位置是在三維空間,很難定位:手的表面是,非平滑的,容易產生陰影。
了解了手勢的這些特點,就可以在手勢研究中對手勢做適當的分割、假設和約束。例如,可以給出如下約束:如果整個手處于運動狀態,那么手指的運動和狀態就不重要,如果手勢主要由各手指之間的相對運動構成,那么手就應該處于靜止狀態。比如鼠標和筆式交互設備就是通過識別手的整體運動來完成人與計算機的交互,但它們不能識別手指的動作,其優點是僅利用軟件算法就能實現,適合于一般桌面系統。只有當用鼠標或筆式交互設備的運動或方向變化來傳達信息時,才可將鼠標或筆式交互設備看作手勢表達工具。筆式交互設備發展很快,它提供了充分的交互信息,如壓力、方向、旋轉和位置信息,但現有交互主要是簡單地替代鼠標。
計算機識別手勢的手段主要有兩種:
1.數據手套。數據手套是虛擬現實系統中廣泛使用的傳感設備,用戶通過數據手套,能做出各種手勢向系統發出命令,與虛擬世界進行各種交互操作:比如通過一只與數據手套對應的在計算機屏幕上顯示的虛擬手,使用戶成為虛擬世界中的一員:抓取物體,如果手套有力反饋,還能讓用戶感覺到物體的重量和材質等。美國在“洞穴”虛擬系統中就是利用數據手套來研制武器。數據手套的主要優點是可以測定手指的姿勢和手勢,但是相對而言代價較為昂貴,并且有時會給用戶帶來不便(如出汗)。
2.計算機視覺。即利用攝像機輸人手勢,其優點是不干擾用戶,這是一種很有前途的技術,目前有許多研究者致力于此項工作。但在技術上存在很多困難,目前的計算機視覺技術還難以勝任手勢識別和理解的任務。
目前較為實用的手勢識別是基于數據手套的,因為數據手套不僅可以輸入包括三維空間運動在內的較為全面的手勢信息,而且比基于計算機視覺的手勢在技術上要容易得多。
更好地為人服務
日本三菱電子研究實驗室的研究人員已經使用低成本的視覺系統,通過手勢就可以控制一臺電視機。由計算機控制的美國航空航天局虛擬太空站也是采用美國Cybernet公司開發的手語識別軟件,通過一部架設在頂部的攝像機來追蹤指揮者的手勢。當系統捕捉到揮手等手勢時,就會做出相應的反應,讓指揮者像航天員一樣在計算機虛擬的阿爾法國際太空站上移動(確切地說是飄動)。
Cybemet公司的軟件還能識別一系列的特定手勢,就像工地上的工人或交通警察經常用的那種手語,通過這些手勢你能夠旋轉在虛擬旅行中看到的三維圖像,還可以向上或是向下改變你的視角。美國航空航天局正在考慮把這套系統用于真正的太空站,因為笨重的航天服和微重力環境使得鼠標和鍵盤都變得難以操縱。也許不久之后,航天員就能用簡單的手語來控制機器人在太空中抓取物體。
手語(手勢)識別系統的研究還有助于改善和提高聾啞人的生活學習和工作條件,為他們提供更好的服務。同時也可以應用于計算機輔助啞語教學、電視節目雙語播放、虛擬人的研究、電影制作中的特技處理、動畫的制作、醫療研究、游戲娛樂等諸多方面。另外,手語識別系統的研究涉及到教學、計算機圖形學、機器人運動學、醫學等多學科。因此,手語識別系統的研究非常有意義。