前言:中文期刊網精心挑選了計算機視覺基本原理范文供你參考和學習,希望我們的參考范文能激發你的文章創作靈感,歡迎閱讀。
計算機視覺基本原理范文1
關鍵詞:計算機視覺;定標方法;應用特點
中圖分類號:TP319文獻標識碼:A文章編號:16727800(2012)007014902
作者簡介:許志雄(1968-),男,浙江紹興人,江漢石油鉆頭股份有限公司工程師,研究方向為計算機多媒體。
0引言
計算機技術的應用在諸多領域占據了主要位置,并得到了人們的極大重視。在此形勢下,攝像機的高清晰度亦成為了人們追逐的目標,而在計算機視覺中的定標方法有各種不同的處理方式,從而為攝像機的發展提供了一個絕好的機會。由此,計算機視覺中的攝像機定標方法成為當今世界攝像機研究領域里至關重要的一個方面,以攝像機得到的圖像信息作為出發點來計算三維空間中自然場景的幾何信息成為計算機視覺的基本任務之一,并且它的應用特點也得到了人們的密切關注。
1攝像機視覺投影原理
透鏡成像的原理利用了光的折射現象,而攝像機的視覺投影原理和透鏡的成像原理相差無幾,只不過在一些細節上進行了相應的改變,使成像更加清晰,以更好地滿足人們的需求。攝像機視覺投影原理就是利用鏡頭的光學原理進行視覺成像,而其中又有許多理論支持,包含鏡頭與焦距和視角。焦距是指鏡頭的焦點之間的距離,對于攝像機而言,就是指從鏡頭的中心位置到攝像管,也可以說是成像的位置之間的距離就是攝像機鏡頭的焦距,只有調整好了這兩者之間的距離,才能保證攝像機的攝像效果,這也是保證攝像機正常工作的首要任務。視角要受到鏡頭焦距的限制,由鏡頭焦距對攝像的大小情況而決定,攝影師們就是通過對焦距的不斷變換來改變對任務的造型,從而改變人們的視覺效果。對于拍攝相同距離的目標而言,鏡頭焦距越大,攝像的水平視角就會變得越窄,這樣帶來的后果就是拍攝到的目標的范圍就越小,使得拍攝效果大打折扣,從而給攝像機帶來不利的使用效益。因此,必須在兩者達到一個較好的組合效果之時,才能夠充分發揮攝像機的作用,并將攝像藝術發揮到極致。由此可見,計算機視覺中的攝像機定標方法將會給攝像機的拍攝效果帶來巨大的轉變。
2計算機視覺中的攝像機定標方法
2.1三維定標法
在人們的平常思維中,凡是物體的影像必定是三維的,本文的理論研究也同樣基于這樣的想法。在討論單幅圖像的設計標定之時,我們所追求的理論基礎就是需要攝像機的定標物是人們所追求的那種三維的效果,在此基礎上再進行相關的理論研究,以達到相得益彰的效果。在此過程中,首先要準確定位定標物上一些比較重要的點的三維坐標,這樣才能夠為后來的工作提供方便;然后在與定標物相對應的成像上找到相應的點的位置,這是至關重要的一步,這也決定了后面成像的具體設計方法;最后在那些比較重要的點的圖像上標出其具體的三維坐標,達到定標物的實際成像效果圖,這樣就可以完全解決攝像機的成像問題了。這種定標方法的基本原理就是充分分析定標物的三維信息,同時與它的具體成像位置相關聯,在這兩者之間形成一種具體的相對應關系。由此我們可以充分利用計算機的快速運算,實現攝像的功能,并適時進行程序功能改進,優化定標物參數的獲取方法,從而達到增加攝像機清晰度的目標。
2.2平面定標法
與上面的定標方法相對立的一種方法就是多幅圖像的設計標定。在這樣的時代背景下,人們的要求應盡可能得到滿足,因而理論研究者會在這個方面下足功夫,弄懂這里面的個中玄機,利用多幅圖像對平面的定標物來進行物體的標定工作,以達到攝像機定標的目的。這樣的平面定標方法就是充分利用平面物體的運動特性,在它和攝像機之間找到一個平衡點,觀察兩者的相對運動,這樣的定標方法也給拍攝運動中的物體帶來了生機。此方法在實施之余也會帶給人們不一樣的感受,讓人們充分體會到攝像的魅力。當然這種考慮運動的平面定標法會受到特征點的增多的影響,隨著點的不斷增加,定標情況就會越來越好,定標物的精度也會不斷提高,于是在定標物相同的前提下,平面定標法自然就可以從定標物上獲得更多的數據信息,為準確對定標物進行定位測量提供了更多的依據。因此,這種方法的效果要比前面的方法好很多,得到推廣的力度也會大大增加,所得到的經濟效益也會增加,設備的成本在原來的基礎上還有降低的趨勢。所以,理論研究者的研究領域就會逐漸向這一方面進行轉變。
2.3兩步定標法
有了前面的研究成果作支撐,攝像機定標方法的進一步研究就會顯得異常容易,人們的進一步要求也會得到滿足,可謂一舉兩得。理論研究者們在有了豐富的理論和實踐基礎之后,利用直接線性的定標方法進行攝像機參數的進一步優化提高,通過透視原理來修改以前的參數,然后將修正的參數進行初始值的確認,把它們作為現在研究階段的起點,在這樣的起點之上綜合考慮各種外界因素,利用最優化的計算機算法進行攝像機成像程序的改進,把原來的程序進行升級處理,使得定標物的精確度得到進一步的提高,這就是我們所提到的兩步定標法。它的基本原理其實很簡單,只不過是充分利用了原有的理論,并進行了一定的創新而已。但就是這樣的創新步伐的邁出,給計算機視覺中的攝像機定標方法帶來了新的生機,也給攝像機鏡頭的優化帶來了很多指導方法。在圖像中心到圖像點的距離保持不變的前提下,參數的數量會顯著減少,這樣不僅節省了材料的用量,而且還進一步提高了攝像機的攝像清晰度,有效彌補了以前清晰度不高的缺點。這樣一來,攝像機的成像效果大大改進,于是才有了現代攝像機的高清效果,確實讓人們享受到了科技帶來的福音。
3計算機視覺中的攝像機定標方法的應用特點
3.1建立于主動視覺上的自我標定
由于計算機視覺中攝像機定標方法的不斷推廣,一些計算機技術在攝像機的制作過程中得到了較好的應用。但是在這之中必不可少地存在一些制作人員或設計人員的主觀因素,這樣攝像機的標定方法中就會形成形色各異的特點,而且彼此之間可能會出現較大的不同,特別是在主動視覺上的自我標定。在主動視覺中,我們所用到的攝像機可以在一個被控制的平臺上被人們固定,利用計算機的高運算能力,計算機可以把平臺上所出現的參數精確地讀出來,我們只需要利用控制攝像機的運轉順序,讓攝像機作一定的周期運動,就可以在這個過程中得到更多的圖像,然后再利用所成的圖像和固定的攝像機的運動參數來確定攝像機的運動情況。這種自我標定方法比較簡單,但是必須為人們提供精確控制攝像機運動的平臺,這種以主觀意識為主的標定特點強化了個人的主觀能動性,讓人們更加易于接受。
3.2進行有層次劃分的逐步標定
近年來,人們對攝像技術的理論研究已經日趨成熟,并根據自己的意愿進行相關的研究工作,把自己的想法融入到攝像機的設計中,真正做到有層次的逐步標定,把所要的標定物以逐個擊破的方式實現有層次的程序算法,從而讓人們在邏輯上能夠有所認識,并且易于接受,從而達到有層次劃分的逐步標定的目的。分層逐步標定法已為標定研究領域中普遍認同的方法之一,在實際的應用中逐漸取代了直接標定的方法。因為進行有層次劃分的逐步標定是符合人們的想法的,而且這種方法的特點是以射影標定作為基礎,以某一幅圖像作為基準圖像,進行其它圖像的射影對齊工作,從而將攝相機中成像未知參數的數量減少,更易于為人們所接受。可以說,進行有層次劃分的逐步標定是人們在實踐中得出的一套符合大勢所趨的標定方法,為世人所推崇。
4結語
綜上所述,計算機視覺中攝像機定標方法在人們的不斷認識中得以應用和推廣,在時代的不斷進步中逐漸向前發展。同時,攝像機標定方法的應用特點也大相徑庭,各有千秋,從而實現百家爭鳴的態勢,進一步推動計算機視覺中的攝像機研究工作的向前發展。
參考文獻:
計算機視覺基本原理范文2
【關鍵詞】課程 計算機視覺 圖像檢索
1.課程設置、建設與改革自述
1.1 綜合基礎與應用,精選教研內容
從專業學位教育的高層次應用型人才培養目標出發,我以學生專業應用能力的培養作為教研的重點,同時,考慮到“計算機視覺”是一門數學要求較高、理論性較強的專業基礎課程。課程的基礎理論教研十分重要,我在規劃教案時,綜合安排基礎理論與應用實踐的教研內容。
1.2 強調學生應用能力,優化教研方法
將啟發式教研方法融入到整個教研過程中,將課堂講授的重點放在問題由來、概念形成、研究思路與方法上,并通過介紹人工智能與計算機視覺學科交叉中出現的最新研究與應用。把新理念、新思路、新方法和新問題引入課堂,調動學生學習的積極性和主動性,拓寬他們視野和思路。
通過較為熟悉的分析,“計算機視覺”課程中的教研方法較為新穎,使他們從一開始就建立了所學理論與實際工程控制問題的聯系。
按“計算機視覺”的基礎理論和知識內容分環節來實施教研,每個環節以實際工程問題開始,以理論學習為基礎,各教研環節之間既是工程問題的系統化深入,也是理論知識體系的循序推進。
按“計算機視覺”的基礎理論和知識內容分環節來實施教研。每個環節,以理論學習為基礎,以提出和解決實際實驗案例中的識別問題為結束,各教研環節之間既是三維重建問題的系統化深入,也是理論知識體系的循序推進。
他們都十分贊同我以強調學生自主學習和應用能力為目的的啟發式和交互式教研方法。尤其是以論文報告和答辯形式提交作業。強調了理論和應用的結合。每一次的作業貫穿整個教研環節,使他們對問題的發現、理解和解決成為一個逐漸明確、細化和深入的過程,因此。雖然作業要求較高、工作量較大,但做起來并不會感到壓力和困難。同時,他們大多之前沒有撰寫科研論文和報告的經歷,通過作業也可以使他們在這方面的能力得到鍛煉和提高,最后考試結業。
與此同時。研究生們也暢談了他們對課程教研中一些問題的看法.研究生們十分重視專業應用能力和實際動手能力的培養與提高。也非常看重扎實理論基礎的必要性,都認為理論學習與專業應用能力培養應該沒有矛盾,但在有限的2年時間內,如何實現兩者的全面提高,他們大多存在疑慮。同時,他們也認為目前大多數的課程教研具有明顯的理論或實踐的偏向性,缺乏科學合理的平衡。
針對我在教研中所提出的案例和問題,學生們反映,盡管十分熟悉,但對問題的本質和要求仍只是停留在理性認識上。無法建立與實際對象的對應關系。另外,他們提出,案例僅從單一課程角度講授,在有限課時內難以從多學科的角度介紹濾波,三維重建,運動恢復,圖像檢索案例,雖然是實際科研項目,但課堂不可能展示整體實物,學生缺乏工業現場的實際感受。使得學生對案例的整體理解難以跳出課堂的思維界域。
針對此,我計劃在加強現代化教育手段方面進行一些建設與探索,努力向學生提供信息容量大、表現形式豐富的綜合性輔助認識手段??紤]到“計算機視覺”通常需要運用計算機技術解決工程問題,我們將在以后教研中,增加計算機輔助教研的功能。如利用Matlab工具對所學內容及實際視覺問題進行可視化仿真演示。我們也將用虛擬儀器工具搭建案例的虛擬系統,試圖通過這樣的虛擬系統,向學生提供有利于啟發思維的靈活的認識與實踐環境。增強學生的感性認識;同時,盡管采用了多媒體教研。計劃在以后的教案中增加更多的現場視頻材料以及圖形和圖像資料,使學生更容易理解和記憶,增強抽象理論的可接受性。這些工作都需要我們在教研和科研工作之余投入大量的熱情和精力。
2.教研手段(課程建設中積極營造數字化、信息化環境和外語教研環境,網絡教研和網上教研資源的開發與建設情況)
2.1本課程的主要特色
體現機器視覺與機器聽覺融合。①機器視覺:圖像處理、圖像與視頻壓縮、模式識別和機器學習、生物特征識別、三維視覺信息處理。②機器聽覺:聽覺計算模型、語音信號處理、口語信息處理。此外還在同濟大學開設計算機視覺,和圖像處理方面課程,該課程構成本課程基礎, 及對大量應用實例介紹設計方法,系統性能,并對結果進行祥細分析和點評。學生通過聽課可以跟隨教師本人了解和掌握計算機視聽覺。充分領略數字技術用于語音通信這一廣闊的領域神奇魅力。腦、 機接口的研究有廣闊的應用前景, 正成為腦科學、康復工程、神經工程及人機交互( puter interface, HCI) 領域的一個研究熱點。
2.2本課程的建設總目標和成果
以后開展圖像,圖形,語音處理,多媒體的內容的檢索,三維景物物體的重建,自然語言理解的研究方向:視覺與聽覺的生理學和心理學基礎,從生理與心理學的角度探索視覺與聽覺的感覺和知覺機理,為視覺與聽覺信息處理提供基本理論和方法,完成同濟大學研究生精品課程建設。以近幾年為研究生講授“計算機視覺”課程講義的電子教案為基礎,結合開發科研項目,并參考相關文獻資料和最新動態編寫計算機視聽覺電子教案,和教材。
機器視覺:圖像處理、圖像與視頻壓縮、模式識別和機器學習、生物特征識別、三維視覺信息處理。
機器聽覺:聽覺計算模型、語音信號處理、口語信息處理、自然語言處理、智能人機交互。
2.3 本課程的建設分年度目標和步驟
教材內容:針孔攝像機,輻射學術語;局部影調模型,點,線和面光源,光度學體視;顏色;線性濾波器,平滑抑制噪音,邊緣檢測;紋理,用濾波器輸出表示統計量,紋理量,紋理合成,由紋理推斷形狀;基本的多視角幾何,立體視覺;用聚類實現分割;擬合直線與曲線,用最大似然率進行擬合,魯棒性;隱變量與EM;用卡爾曼濾波來跟蹤,數據相關;攝象機標定;使用特征對應和攝像機標定的基于模型的視覺;使用分類器的模版匹配;基于關系的匹配;在數字圖書館中檢索圖像,基于圖像的繪制。
準備離散時間語音信號處理的原理,介紹語音信號處理研究及其應用方面的最新動態,其中包括語音處理,語音時頻分析以及非線性聲學語音產生模型,而這些講授內容在以往任何一本語音信號處理教科書都不曾提及,深入介紹以下內容:語音編碼,語音增強,語音綜合,說話人識別,語音信號恢本復,動態范圍壓縮語音信號處理基礎,語音的時域的分析語音信號頻域分析,語音信號線性預測分析,矢量量化,語音編碼,語音合成,語音增強,說話人識別。
3.構建研究實踐型模式,探究研究生指導
通過研究生指導模式的學習,兩種指導方式之一是對傳統面對面的與基于網絡兩種指導方式的混合。師生之間定期與不定期面對面的交流對于保證研究生指導質量提高有著重要關系?;ヂ摼W突破時空限制為高校師生提供一個開放的、共享、個性化、多維交互的教與學的平臺。我提供優秀研究資源,學生也可以通過網絡共享研究資源。師生都可以Web對于優化研究資源的共享、促進師生之間的社會互有著重要作用使得研究生指導模式充分發揮面對面指導。研究生指導主要注重科研素養培養。研究生培養根本目標發展能力。課程學習對于系統提高研究生對專業關心課程學習狀況必要,要為學生提供學習方法指導與建議,要鼓勵學生結合課程學習進行相關討論。
基于自主與協作的探究性學習是研究生學習的主體地位,發揮作用。我在教研中培養研究生發現問題、分析問題、解決問題的能力正是為了支持研究目標在于獲得親身參與研究探究體驗:培養“教研模式中”包括個人理解專業研究領域相關問題的內涵與特征。旨在使學生能夠切實掌握專業與研究領域所涉及基本原理與能夠利用這些原理與方法分析確定方案實施、“know“know 是相互交織相互作用的層面,主要是為了增強指導以便根據不同層包括若干個問題常常需投人較多的精力與時間。應該安排較長時間且要充分利用網絡技術平臺支持。提升研究質量有效地避免傳統指導誤區。在指導時過于強調研究生所獲取學術成果而忽視指導過程體現在兩方面:一目標評價標準單一往往給研究生層面:①面向研究生個體的“個別指導”;②面向小組集中:③自主調控評價,必須與教師、同伴、專家進行交流、協作才有可能真正地提高效率,實現學習目標,培養學團隊意識,其次要幫助研略,在各層面都有明確的目標相應指導內容,并要注意這三個層面整合。使之過程得到全面發展。養成科學態度和科學道德?!翱蒲心芰Πl展、輕綜合素質培養”,研究生導師不但應該是研究生的指導者。指導教師可以按“科研項目一要問題一具體任務”的層次。以教師的、助學促學”盡可使每個研究生都能達到預期培養目標。評價要更關注總結性評價”與“過程性評價”工具以豐富研究生指導過程中教研交互的教育學中社會互。傳統環境下的社會互往往是面對面的交互。網絡平臺可以利用構建社會網絡支持社會交互。強調的研究科研成果而深層次交流方式不同指導目標、不同指導層次整合,指導教師角色轉變,變革評價方式,豐富指導教師來促進“自主一協作”探究學習,對研究生“混、他評”與“自混評關注教研評價的。”教研模式下網絡技術與內涵表現在:①利用技術促進教研資源的整合,優化教研資源管理,教研資源共享,促進師生與教研內容的交互;②利用Web工具,有效地整合現實交互空間虛擬交互空間另外還地加速或加強人際聯系,幫助師生了解探究式應用實踐探索。
研究生是否發表了高水平的科研成果,研究生入學初期,以Web的應用為核心的互聯網絡不但為高校師生的交流提供了新的溝通與互動方式。以獨特高校師生的思維方式生存方式發生了系列改變。也成為高校師生教研與生活中的重要信息工具為研究生指導提供了豐富的資源與多維立體環源。網絡平臺也用于共享、深化面對面交流中所總結形成相關觀點與資料。要求其他每位學生都至少要提一個問題所提出問題進行進一步的討論。了解專業研究領域的基本問題、核心問題與前沿問題研究生自己在調研基礎上提出研究進行獨立自主的探究。所以除了關注在專業領域內研究能力的發展之外還要注意教育科研能力的培養引導學關注“專業發展”。 用于規劃了解學生的已有基礎,以幫助后期制定更為合理個別指導計劃:第二,通過召開定期的討論會、師生個別交流,包括兩種類型:①旨在提高新生適應研究生學習與生活的適應性:②面向科研任務的研究小組。面向任務方式沖擊著高校師思維方式與文化理念,非常重視網絡平臺研究指導中的應用,建立了向團隊公用資源平臺教研主要采用研究式教研方法, 要求研究生自學其基本原理, 然后利用實際數據,由導師提供或從期刊文獻中獲取,完成數據預處理、計算、結果表達、解釋的全過程, 并以論文形式提交給教師, 同時在課堂上向大家介紹自己的研究成果。這樣做一方面提高了學生應用知識的能力以及研究成果的文字組織和語言表述能力。 另一方面, 研究生的每篇習作就是一個很好的實例, 教師可以從中發現學生對知識理解的偏差, 及時予以糾正, 使學生對方法的掌握更加準確和牢固。將網絡共享平臺中上傳所有研討記錄訓練,將研究分個層面:①選擇專業研究內的基本問題或重要問題或熱點問題對之進行深入探究。掌握本專業領域基本研究方法;②以自己課體依托,在課題下設置子課根據研究與研究興趣跨年級構建小組,每個小組負責不同的子課題與任務③鼓勵研究途徑。一年級開始參與課題研究,二年級學期要求開始提出自己一些問題或鼓勵結合確定畢業論文選題使他們在更大程度職業能力發展;推薦專業相關資料;對(共8人)進行指導,效果較明顯。在學習方面,24名本科生通過畢業答辯。研究生八人以學生身份公開發表學術科研論文。 他們在這方面的能力得到鍛煉和提高。
通過"混合型-探究式"研究生指導模式的學習實踐三個維度的"混合":對傳統面對面的與基于網絡的兩種指導方式的整合,對提升研究生課程學習績效、促進研究生科研能力發展、促進研究生職業能力發展三個指導目標的整合,對個別指導、小組集中指導、團隊集中指導三個指導層面的整合;說明了該模式中三個層面的"探究":對專業問題的探究,對專業與研究領域內基本原理的探究,對綜合科研任務的探究;同時介紹了在實踐層面應用"混合型-探究式"研究生指導模式的實際效果。以重點學科為依托,吸取國內外大學研究生培養經驗,對創新型研究生培養模式方法進行探索,在研究生培養模式改革中,提出“四個轉變”的指導思想,即變“單人指導”為“團隊指導”,變“單一培養模式”為“多元培養模式”,變“以教師為中心”為“以學生為中心”,變“面向培養結果”為“面向培養過程”。形成以研究生為中心的培養模式,突出研究生探索精神、科學思維、創新意識的培養。切實 行的措施 引導 究生遵守科學 道德,保持科學沖動,增強創新意識,提高科學能力。
考慮到“計算機視覺教研探究研究生指導”通常需要運用計算機技術解決工程問題,我將在以后教研中,增加計算機輔助教研的功能。如利用Matlab工具對所學內容及實際視覺問題進行可視化仿真演示。我也將用虛擬儀器工具搭建案例的虛擬系統,試圖通過這樣的虛擬系統,向學生提供有利于啟發思維的靈活的認識與實踐環境。增強學生的感性認識;同時,盡管我采用了多媒體教研。我計劃在教案中增加更多的現場視頻材料以及圖形和圖像資料,使學生更容易理解和記憶,增強抽象理論的可接受性。
參考文獻:
[1]David A.Forsyth and Jean Ponce , Computer Vision-A modern Approach
[2]賈云得.機器視覺.電子工業出版社,1999
[3]Thomas F.Quatieri離散時間語音信號-原理與應用,電子工業出版社,2004
[4]Shapiro.L.G and stockmen,G.C,計算機視覺.北京-機檻工業部,2001
[5]Haralick,R.,1992/1993 Computer and Robot vision ,volume I and II
[6]張雄偉,陳亮等.現代語音處理技術及應用.機械工業出版社,2003
[7]Thomas F.Quatieri離散時間語音信號-原理與應用,電子工業出版社,2004
[8]鄭燕林等“混合型-探究式”研究生指導模式的構建與實踐,學位與研究生教育,2010
計算機視覺基本原理范文3
關鍵詞: 扣件缺失檢測;圖像處理;Canny算子;模糊C均值聚類
中圖分類號:TP391 文獻標識碼:A 文章編號:1009-3044(2014)10-2367-04
Abstract: The traditional fastener detection methods are inefficient and unreliable, can not meet the needs of the modern railway maintenance. This paper proposes a vision-based technique for detecting rail fastening automatically. First, a criss-crossing localization method was proposed to position the fastener for the canny edge processing gray images, and the edge characteristic information of fastener was extracted. Finally, fuzzy C-means clustering algorithm was used to cluster the extracted features, fastener missing detection can be realized by calculating the membership between the unknown samples and the standard modes of fastener. The experiment showed that this image processing and classifying algorithm can realize the automatic detection of missing fastener effectively; the detection rate is above 96%.
Key words: fastening missing detecting; image processing; canny algorithm; fuzzy C-means clustering
鐵路線路維修保養對于軌道交通系統的安全運行具有重要作用,其重要工作之一是檢查扣件是否缺失。實際中,由于安裝保養不到位、列車行駛的振動和人為盜取等原因,線路上扣件可能會缺失,這給會對鐵路行車安全形成巨大威脅,甚至釀成重大交通事故。目前,對鐵路扣件的檢查主要依靠人工巡查的方法,效率低、勞動強度大、可靠性差、漏檢率高。近些年,隨著計算機技術、模式識別和圖象處理技術的發展,研制基于計算機視覺的自動化扣件缺失檢測系統來代替巡道工的視覺檢查工作成為可能,該檢測方法具有效率高、成本低和可靠性好等優點,是鐵道和地鐵線路維修的新趨勢。
日本于20世紀90年代中期開發了一些采用圖像處理技術實現軌道裂紋、腐蝕及扣件狀態自動識別的設備。美國ENSC0公司在20世紀90年代末研發了軌道視覺檢查系統自動檢查軌道狀態[1,2]。德國SBG公司研制的GeoRail系統采用數字掃描相機和先進的圖象處理技術,實時檢測軌道表面和軌枕的缺陷,及扣件缺失、道床斷面的異常等;德國BENNTEC公司開發了RailCheck系統也能實現類似功能[3,4]。法國研制開發了巡查線路設備狀態的自動檢查系統,并在TGV高速線路和普通線路上投入了實際運行[5,6]。國內有北京福斯達公司高速車載式軌道圖像識別系統,另有一些基于計算機視覺針對扣件螺母缺失進行檢測的專項研究[7]。
上述檢測系統都是采取用高速攝像機采集扣件完整圖片,然后進行圖像處理,判斷扣件是否存在。但是現有系統在圖像處理上耗時較多,很難適應速度要求極高的高速軌檢車。此外,列車行進過程中狀態復雜,所采集的圖片參數不一,具有較大的模糊性,目前的扣件缺失檢測方法并不能有效的處理扣件狀態特征間的模糊性。
本文針對已有研究成果的不足,運用Canny算子及模糊聚類等主要技術,設計了一種基于計算機視覺的扣件缺失檢測系統,解決現有技術識別速度慢、通用性差的缺陷,可應用于鐵路鋼軌扣件缺失的在線快速探測。
1 扣件缺失檢測系統設計
基于計算機視覺的扣件缺失檢測系統基本原理是首先采用高速CCD相機拍攝軌道扣件圖像作為系統輸入,通過一系列分析由系統自動判定扣件的缺失狀態。該系統包括硬件和軟件模塊,硬件主要由圖像獲取系統和圖像識別系統組成。圖像獲取系統包括高速CCD相機、照明設備、圖像存儲模塊和GPS定位模塊;圖像識別系統可以是DSP或工控機,包括:圖像預處理、扣件圖像定位、特征提取、分類識別模塊,主要功能有:
1)圖像預處理:對圖像進行灰度化、降噪、濾波處理,突出圖像中的扣件區域,抑制或消除不必要的信息,提高圖像質量,便于扣件識別。
2)定位與特征提?。簭牟杉恼鶊D像中定位出扣件位置;然后從扣件圖像中提取出能夠反映扣件狀態的特征信息,用于扣件缺失判定。
3)扣件識別:采用提取所得的扣件特征信息,建立識別模型,檢測扣件是否缺失。
系統安裝示意圖如圖1所示:
2 扣件的定位與特征提取
2.1 扣件定位基本原理
由于采集的圖像除了包含鋼軌和扣件,還包括道床、軌枕區域,如果直接在原圖上提取扣件狀態,受到的干擾多,運算量很大。因此需要對扣件進行定位,從原始圖像中裁剪出扣件。
在鋼軌表面區域,灰度只在水平方向上有明顯跳變,在垂直方向是連續的;而鋼軌以外的區域,道砟的紋理比較復雜,在各個方向都存在跳變,可以根據這個特征找到鋼軌邊緣。同理,可以找到軌枕的邊緣。根據鋼軌邊緣和軌枕邊緣的交叉點就可以根據先驗信息提取出扣件。該方法稱作十字交叉法,具體步驟為:
1)采用Canny算子對圖像進行邊緣處理;
2)采用區域掃描統計法,以鋼軌寬度為區域寬度,在二值圖像上從左向右移動,統計區域內的亮點數目,投影在水平方向,投影在水平方向,其最大值即為鋼軌的左邊界;
3)以同上的方法,做橫向(從右到左)區域掃描統計,獲得鋼軌的右邊界;
4)從上向下移動,進行區域掃描,確定鋼軌上邊界,從下向上移動,進行區域掃描,確定軌枕下邊界;
5)根據先驗知識(扣件長寬)提取扣件區域。
2.2 基于Canny算子的邊緣檢測
1986年,Canny提出了邊緣檢測的三個判斷準則:信噪比準則、定位精度準則和單邊緣準則,并在此基礎上提出了Canny邊緣檢測算子,其詳細檢測算法可參考文獻[8]。
按照Canny算子計算方法對檢測圖像進行邊緣檢測,其結果如圖2所示。
2.3 扣件區域提取
根據2.1節所述的十字交叉扣件定位方法,在圖像的Canny邊緣檢測基礎上,采用區域掃描法,提取扣件所在區域。首先對檢測圖像進行從左至右的區域掃描,區域寬度近似鋼軌寬度;然后,以軌枕為區域為寬度進行從上到下垂直區域掃描,對圖2的掃描曲線如圖3所示。
水平方向和垂直方向的區域掃描結果的最小值,即為鐵軌的左邊界和軌枕上邊界,分別為:278和141。
同理,對圖像進行從右到左和從下到上區域掃描,確定鐵軌的右邊界和軌枕下邊界為:380和320。
最后,根據先驗知識(扣件的長和寬),提取出扣件。為了方便圖像的模式識別,將扣件區域位置大小統一設為120×200像素。對Canny邊緣檢測結果進行扣件區域截取,其結果如圖4所示。
2.4 扣件特征提取
提出一種基于扣件邊緣幾何結構分析的特征提取方法,利用Canny算子實現對扣件輪廓邊緣的提取,根據輪廓特征可實現扣件缺失檢測。
本文2.3節中,檢測到扣件的邊緣圖像后,將圖像平均分割為20份,每份包含30×40個像素,每個像素的值為0或1,將所有像素相加并除以總像素點,即可得到反映扣件狀態的特征向量。
篇幅有限,文中列出4個樣本下的特征向量,如圖5所示,可見無扣件狀態下的特征向量與有扣件下的特征向量有明顯區別,但兩類間也有明顯的模糊性。
4 基于模糊C均值聚類的扣件識別
模糊聚類分析作為一種無導師的學習方法,利用分類模式之間的模糊關聯度進行分類,更相似的劃為一類,更不相似的劃作另外一類。在分類過程中不斷計算所劃分各類的中心,以待分類模式與已判定為某類的模式中心的隸屬度作為其分類的準則,與已知聚類中心具有最大隸屬度的類別即為未知狀態的類別。該文將有無扣件分別作為聚類分析的兩個類別,可實現扣件缺失檢測。
模糊C均值聚類算法是Bezdek提出的作為早期硬C均值聚類(HCM)方法的一種改進算法[9]。FCM把n個向量xi(i=1,2, ??? ,n)分為C個模糊組,并求每組的聚類中心,使得非相似性指標的價值函數達到最小。FCM的價值函數(或目標函數)表示如下[10]:
由上述兩個必要條件,模糊C均值聚類算法是一個簡單的迭代過程。
下文以有無扣件下的20個樣本為例進行聚類分析,所得各樣本的隸屬度如圖6所示。在圖6中,“隸屬度1”表示各個樣本與有扣件聚類中心的隸屬度;“隸屬度2”表示各樣本與無扣件聚類中心的隸屬度;前20個樣本為有扣件狀態,后20個樣本為無扣件狀態。從圖6可知:前20個樣本與有扣件的聚類中心有最大隸屬度,即屬于有扣件狀態;后20個樣本與無扣件的聚類中心有最大隸屬度,即屬于無扣件狀態。這與實際結果吻合。
當出現如圖7所示的干擾物時,該狀態下的特征與上述聚類中心的隸屬度如下表1所示。
從表1可知,圖7的四個狀態與有扣件狀態下的聚類中心有最大隸屬度,即實現干擾物狀態下扣件狀態的正確判別。經過大量實驗驗證表明,該方法的識別準確度的可達96%,且隨著先驗知識庫的增加,準確度也會逐步提升。
5 結論
采用CCD相機采集軌道扣件圖像,首先對原始圖像進行小波閾值濾波,其次在對圖像進行Canny算子邊緣處理后采用十字交叉法對扣件位置進行定位,定位扣件位置,提取扣件的邊緣特征信息,最后利用模糊C均值聚類算法實現扣件缺失識別。通過鐵路現場實驗結果表明本文的圖像處理方法和識別分類算法能有效實現扣件系統缺失的自動檢測,準確率高,并得到如下結論:
1)將降噪后圖像進行Canny算子邊緣處理能凸顯圖像中的鋼軌和軌枕,然后采用十字交叉法能準確提取扣件區域。Canny算子扣件圖像邊緣輪廓信息中,能夠提取較為準確扣件狀態特征向量。
2)模糊C均值聚類算法對扣件特征向量進行分類,產生有無扣件的標準聚類中心,然后按照最大隸屬度進行扣件缺失檢測,效果好、精度高,且其擴展性好,在使用過程中逐步完善先驗知識庫,提高可靠性及精度。
參考文獻:
[1] Singh M, Singh S, Jaiswal J, et al. Autonomous rail track inspection using vision based system[C]//Computational Intelligence for Homeland Security and Personal Safety, Proceedings of the 2006 IEEE International Conference on. IEEE, 2006: 56-59.
[2] Sholl H, Ammar R, Greenshields I, et al. Application of Computing Analysis to Real-Time Railroad Track Inspection[C]//Automation Congress, 2006. WAC'06. World. IEEE, 2006: 1-6.
[3] Killing J, Surgenor B W, Mechefske C K. A machine vision system for the detection of missing fasteners on steel stampings[J]. The International Journal Of Advanced Manufacturing Technology, 2009, 41(7-8): 808-819.
[4] De Ruvo P, Distante A, Stella E, et al. A GPU-based vision system for real time detection of fastening elements in railway inspection[C]//Image Processing (ICIP), 2009 16th IEEE International Conference on. IEEE, 2009: 2333-2336.
[5] Deutschl E, Gasser C, Niel A, et al. Defect detection on rail surfaces by a vision based system[C]//Intelligent Vehicles Symposium, 2004 IEEE. IEEE, 2004: 507-511.
[6] Marino F, Distante A, Mazzeo P L, et al. A real-time visual inspection system for railway maintenance: automatic hexagonal-headed bolts detection[J]. Systems, Man, and Cybernetics, Part C: Applications and Reviews, IEEE Transactions on, 2007, 37(3): 418-428.
[7] 王凌, 張冰, 陳錫愛. 基于計算機視覺的鋼軌扣件螺母缺失檢測系統[J]. 計算機工程與設計, 2011, 32(12): 4147-4150.
[8] Canny J. A computational approach to edge detection[J]. Pattern Analysis and Machine Intelligence, IEEE Transactions on, 1986 (6): 679-698.
計算機視覺基本原理范文4
關鍵詞:圖像識別;SURF算法;特征點;魯棒性
中圖分類號:TP391 文獻標志碼:A
圖像識別,是利用計算機對圖像進行處理、分析和理解,以識別各種不同模式的目標和對像的技術。圖像的局部不變特征有著在多種圖像變換(如光照變換,幾何變換等)下的不變性、獨特性、低冗余性以及無需預先對圖像分割等特點,已經被廣泛應用于圖像匹配領域?;谔卣鞑蛔兊姆椒ň哂芯雀摺绦兴俣瓤?、壓縮信息量和魯棒性好等優點。尺度不變特征轉換(Scale-invariant feature transform,SIFT)算法便是其中的代表,該算法由David Lowe于1999年在ICCV上提出,并于2004年完善總結。SIFT算法匹配能力較強,能提取穩定的特征,可以處理兩幅圖像之間發生平移、旋轉、仿射變換、視角變換和光照變換等情況下的匹配問題,但該算法數據量大,復雜度高,耗時長,同時也存在著特征提取及匹配速度慢,在灰度變化相似的區域容易產生誤匹配的缺陷,限制了該算法的應用。SURF算法是針對SIFT算法的不足而改進的一種有效算法。
1SURF算法描述
快速魯棒特征[1](Speeded-up Robust Features,SURF)是一種高魯棒性的局部特征點檢測器,由Herbert Bay等人于2006年在ECCV上提出的。該算法比SIFT更快更加具有魯棒性,對圖像分辨率、旋轉、尺度縮放、平移和亮度變化等保持不變,而且對仿射變換、噪聲以及視角變化等也能保持一定程度的穩定性。
SURF算法的基本流程主要包括:特征點檢測、特征點描述和特征點匹配三部分。該算法中有三個關鍵技術,分別為:使用積分圖像完成圖像卷積操作,減少了時間計算的復雜度,提高計算速度;采用基于Hessian矩陣的檢測器檢測特征值,其在可重復性和穩定性方面都優于基于HarTis的檢測器;采用Haar小波作為特征描述子,Harr特征速度快,能夠減少計算時間并增加魯棒性。
1.1積分圖像
積分圖像是一種對原始圖像的特征表示方法。對于一幅灰度的圖像,積分圖像中的任意一點(x,y)的值是指從圖像的左上角到這個點所構成的矩形區域內所有的點的灰度值之和[2]。圖1所示填充區域即為點(x,y)的積分值。
1.2尺度空間的建立
圖像的尺度空間是在視覺信息(圖像信息)處理模型中引入一個被視為尺度的參數,通過連續變化尺度參數獲得不同尺度下的視覺處理信息,然后綜合這些信息以深入地挖掘圖像的本質特征。一幅圖像的尺度空間可定義為原始圖像與高斯核的卷積運算,圖像的尺度大小可以用高斯標準差來表示[3]。在計算機視覺領域, 尺度空間被表示為一個圖像金字塔。在SIFT算法中,輸入圖像函數反復與高斯函數的核卷積并反復對其進行二次抽樣,但因為每層圖像依賴于前一層圖像, 并且需要重設圖像尺寸,所以使得運算量較大。SURF算法與SIFT算法在使用金字塔原理上的不同之處在于SURF算法申請增加圖像核的尺寸,允許尺度空間的多層同時被處理,并且不需要對圖像進行二次抽樣, 從而提高了算法性能。同時SURF算法采用了尺度插值和3*3*3的非極值抑制方法以提取尺度不變的特征點。圖2中A圖是運用傳統方式建立的一個圖像金字塔結構,運算會反復使用高斯函數對子層進行平滑處理, 且圖像的尺寸是變化的。B圖的SURF算法保持原始圖像不變而只是改變濾波器的大小。
1.3Hessian特征檢測
2算法實現
根據SURF算法的基本原理,設計算法的實現過程。首先通過視頻采集設備獲取模板圖像,并對其建立積分圖像和構建尺度空間結構,再通過視頻采集設備捕捉當前視頻幀,然后檢測出模板圖像及當前視頻幀的特征點, 并保存每個特征點各項特性的描述信息,最后比較模板圖像與當前幀圖像特征點的描述子信息進行圖像匹配。
3OpenCV技術
OpenCV(Open Source Computer Vision Library)[5]于1999年由Intel建立,是一個基于(開源)發行的跨平臺計算機視覺庫,可以運行在Linux、Windows和Mac OS操作系統上。OpenCV輕量級而且高效,由一系列C函數和少量C++類構成, 實現了計算機視覺,圖像處理和模式識別等方面的很多通用算法。
OpenCV為Intel公司的Integrated Performance Primitives(IPP)提供了透明接口,這意味著如果有為Intel處理器優化的IPP庫,OpenCV將在運行時自動加載這些庫。OpenCV致力于真實世界的實時應用,通過優化的C代碼的編寫對其執行速度帶來了可觀的提升,編寫程序過程中調用OpenCV的基礎函數庫, 即可完成十分復雜的開發任務, 極大的提高開發效率。
3.1OpenCV的特點
1) 跨平臺,Windows,Linux,Mac OS;
2) 免費,開源;
3) 代碼經過優化,可用于實時處理圖像;
4) 統一的結構和功能定義;
5) 強大的矩陣運算和圖像處理能力;
6) 具有底層和高層的應用開發包;
7) 用戶接口方便靈活。
3.2OpenCV的功能
1) 對圖像數據的操作,包括分配、釋放、復制和轉換數據。
2) 具有對矩陣和向量的操作以及線性代數的算法程序,包括矩陣、解方程,特征值以及奇異值。
3) 具有基本的數字圖像處理能力,如可進行濾波、邊緣檢測、角點檢測、采樣與差值、色彩轉換、形態操作、直方圖和圖像金字塔等操作。
4) 對運動的分析,如對光流、運動分割和跟蹤的分析。
5) 對目標的識別,可采用特征法和隱馬爾科夫模型(HMM)法。
6) 具有基本的GUI功能,包括圖像與視頻顯示、鍵盤和鼠標事件處理及滾動條等。
3.3OpenCV模塊
1) CV核心函數庫,實現圖像處理,結構分析,運動分析,對象識別,攝像機標定和3D重構等功能。
2) CVAUX輔助函數庫,實現通過立體視覺來實現的動作識別,基于輪廓線的形狀匹配,模式識別,紋理描述等功能。
3) CXCORE數據結構與線性代數庫,實現數據變換,矩陣運算等功能。
4) HIGHGUI圖像界面函數庫,實現圖像獲取,用戶界面設計等功能。
5) ML機器學習函數庫,包括模式分類和回歸分析等。
4Android上的系統實現
Android是基于Linux開放性內核的操作系統,是Google公司在2007年l1月5日公布的手機操作系統。Android采用軟件堆層的架構,主要分三部分:底層以Linux核心為基礎,提供基本功能;中間層包括函數庫和虛擬機;最上層是各種應用軟件。Android應用程序用Java語言編寫。每個應用程序都擁有一個獨立的Dalvik虛擬機實例,這個實例駐留在一個由Linux內核管理的進程中[6]。
在Android系統上使用OpenCV來實現該系統,需利用JNI編寫相應的本地代碼組件并通過Android NDK工具集將其嵌入到Android應用程序中。首先,利用Android應用程序框架編寫相應的Java代碼;然后通過JNI與OpenCV提供的函數編寫本地C/C++代碼,并使用Android NDK將本地代碼文件編譯生成可由Java代碼調用的共享庫(動態鏈接庫),最后通過SDK生成完整的Android應用程序[7]。
4.1JNI
JNI(Java Native Interface),即JAVA本地調用。它允許Java代碼和其他語言編寫的代碼進行交互。
5結論
本文提出了一種基于SURF算法的圖像識別方法,并運用此方法實現了一套基于Android平臺的圖像識別系統。由于系統需要進行大量的圖像處理運算, 因此通過使用Android NDK調用OpenCV圖像處理函數庫以提高編程效率,。系統通過手機攝像頭提取視頻幀, 并使用SURF算法對其進行快速魯棒特征檢測。實驗結果表明, 該方法復雜度低、實時性好并且具有良好的魯棒性,將系統用于移動設備圖像識別加密,以及視頻監控等方面,會使其擁有更好的識別效率和可靠性。
參考文獻:
[1]彭欣,劉富強,宋華軍.基于SURF目標跟蹤算法研究[J].長春理工大學學報, 2011,34(2):138-141.
[2]徐秀云.基于特征點的景象匹配技術研究[D].南京:南京理工大學,2009:1-68.
[3]高健, 黃心漢, 彭剛,等. 一種簡化的SIFT圖像特征點提取算法[J].計算機應用研究,2008,25(7):2 213-2 215.
[4]VASILEIOS K,CHRISTOPHOROS NIKOU,ARISTIDIS LIKAS.Visual Tracking by Adaptive Kalman Filtering and Mean Shift[J].Springer-Verlag Berlin Heidelberg,2010,6040:153-162.
[5]黎松,平西定,丁益洪.開放源代碼的計算機視覺類庫OpenCV的應用[J].計算機應用與技術,2005,22(8):134-136.
[6]韓超,梁泉.Android系統原理及開發要點詳解[M]北京:電子工業出版社,2010:70-93.
[7]韓露.一種Java與OpenCV結合實現的目標檢測模塊[J].計算機應用,2008(3):773-775.
[8]HUIYU ZHOU,YUAN YUAN,CHUNMEI SHI.Object tracking using SIFT features and mean shift[J]. Computer Vision and Image Understanding,2009,113:345-352.
[9]HERBERT BAY, ANDREAS ESS, TINNE TUYTELAARS,et al.Speeded-Up Robust Features(SURF)[J].Preprint submitted to Elsevier,2008:233-245.
[10]TA D N CHEN,W C GELFAND,N PULLI K.SURFTrac:Efficient Tracking and Continuous Object Recognition using Local Feature Descriptors[C]//Coumputer Vision and Pattern Recognition(CVPR'09),2009:2 937-2 943.
[11]紀華,吳元昊,孫宏海,等.結合全局信息的SIFT特征匹配算法[J].光學精密工程,2009,17(2):439-444.
[12]CHAVES A,GUSTAFUSON D.Vision——Based Obstacle Avoidance Using SIFT Features[C]//Proceedings of the 5th International Symposium on Advances in Visual Computing.2009:550-557.
[13]公磊,周聰.基于Android的移動終端應用程序開發與研究[J].計算機與現代化,2008(8):85-89.
計算機視覺基本原理范文5
關鍵詞:計算機網絡;紅外遙控;機器人控制系統;操作功能
基于計算機網絡發展的移動機器人是現代機器人控制系統的發展趨勢,移動機器人是一種具有導航技術、自動控制理論、計算機編程技術、網絡控制以及人工智能等一系列高科技的綜合應用,如今廣泛運用于建筑、工廠自動化、軍事、采礦、農業以及服務業等各種領域。然而,傳統的機器人通過有線或者無線手柄進行控制,手柄可以設置的命令個數有線,由此限制了機器人的操作功能,并且不利于機器人控制的二次開發。筆者研究的網絡紅外遙控機器人可以通過計算機遠程遙控實現對機器人的無線控制,極大拓展了機器人的使用功能以及研發方向,具有重大的意義。
1.硬件系統設計
1.1硬件系統的結構
如下圖1所示,網絡紅外遙控機器人主要有紅外收發模塊、微控制器模塊、電極驅動控制模塊以及信號傳感模塊和電源等組成部分。
1.2基本原理
該硬件系統的基本原理是:首先由信號傳感模塊來感知機器人的外部操作環境,包括光強度、溫度以及超聲測距反饋信號等,信號的傳遞為控制系統的行為提供了外部信息以及反饋信號;然后使用電機控制系統根據接收到的指令,驅動整個系統的運行,使得整個機器人完成指令動作;紅外收發模塊則能夠實現無線命令以及信號在傳感模塊與控制模塊之間傳遞與輸送,起到聯系機器人與計算機的作用;最后,微控制模塊可以說是整個機器人控制系統的核心,整個系統的運作都依靠微控模塊接收和處理機器人外部信號,進而控制機器人的動作,微控模塊使用RS232來和計算機通信[1]。
1.3微控模塊設計
微控模塊采用德國儀器公司的MSP430F149微控制器,其特點是低功耗且具有強抗干擾力。該微控制器擁有16位寄存器和常數寄存器、16位RISC結構以及最大代碼效率,同時還帶有兩個16位監時定時器,一個內部比較器,48個I/O口的微處理器,兩個通用接收發射器,以及8通道12位A/D轉換器,其中轉換器具有采樣保持、帶內部參考電壓以及自動掃描的功能。總體而言,該型號的MSP擦寫次數可以高達10萬次,具有工業級水平。
該微控制器模塊中電路接口如下圖2所示:外接高頻(8MHz)和低頻(32kHz)兩種晶振,保證了MSP能夠根據需要調整高速或者節能的狀態。
2.紅外遙控設計
2.1紅外發射電路原理
外發射端在發射數據或者信號時,將待發送的2進制數據調制成一系列脈沖信號,其發射頻率是38kHz,采用脈寬調制PWM方式發送。紅外載波可以通過單片機內部的定時器的PWM功能或者硬件電路實現。
紅外發射電路中通常使用TSAL6200紅外發射二極管,該型號的二極管是塑封的,在信號發射過程中將周期信號轉換成一定頻率的可以識別的紅外光信號,同時其脈沖比較穩定,保持脈沖間隔數據“0”和“1”不變動,確保數據傳遞的連續性[2]。
2.2紅外接收電路原理
紅外接收過程使用HS0038B紅外接收器,其環氧包裝可以作為過濾器使用,并且抗干擾能力強,輸出較為穩定。當接收到38kHz的載波信號后,接收器輸出低電平,反之輸出高電平,以此將紅外光信號的間隔調節成較為連續的具有一定周期性的方波信號,最后經過單片機處理,可以恢復出原來的數據信號。
2.3紅外通信協議
如下圖4所示,紅外通信協議能夠保證紅外數據同步,從而正確識別接收到的紅外信號。紅外通信中的差錯控制方式采用自動請求重發方式ARQ。接收時,接收器首先接收到數據包中的地址碼,隨后進行地址碼匹配。如果地址不匹配,則丟棄數據包,并發送“請求重發信號”;如果地址符合,則檢查校驗碼,在校驗正確的情況下,識別數據包中的數據,并發送“確認信號”,如果校驗錯誤則發送“請求重發信號”。若在接收中的任何環節出現差錯,均向發送方返回“請求重發信號”[3]。
結束語
本文設計的基于計算機的紅外遙控機器人控制系統,主要從基礎原理出發,采用分模塊的設計思路,使得設計的各個模塊能夠緊密聯系,完成整個移動機器人的控制活動。通過計算機遠程遙控實現對機器人的無線控制,極大拓展了機器人的使用功能,同時期望讀者在實際應用中能夠自主開發,進行進一步的研發與創新。
參考文獻:
[1] 閆明明,楊平,熊靜琪等.基于“計算機控制技術”的機器人行走控制實驗設計[J].實驗技術與管理,2014,(3):173-175.
計算機視覺基本原理范文6
【關鍵詞】主動表觀模型 特征點標定 形狀建模
人臉是人類日常生活中表達喜怒哀樂等情感的重要載體,長期以來人類一直通過繪畫雕塑等多種方式來描述人臉。人臉圖像技術隨著計算機視覺的發展逐漸興起,而人臉圖像技術的基礎和核心便是人臉特征點標定。人臉特征點標定是指利用計算機視覺技術對人面部器官的特征部位進行自動的特征搜索、輪廓擬合、特征點定位與紋理提取。主動形狀模型算法(active shape model,ASM)和主動表觀模型算法(active appearance model,AAM)是當前使用較為普遍的兩種特征點標定算法,其基本原理都是利用統計規律得到目標物體形狀向量,然后通過灰度建模實現特征點的最佳匹配,重復循環搜索直到收斂,完成標定工作。
1 AAM實現特征點標定的基本流程
1.1 形狀建模的實現
主動表觀模型通過對樣本集中人臉圖像進行樣本標準化和主成分分析(principal component analysis,PCA)來實現形狀建模。
首先對訓練集中的樣本圖像進行手動特征點標定并用圖像上所有特征點的坐標值組成的向量來唯一表示樣本圖像。由于不同樣本圖像之間在尺寸和方向上存在差異,需要采用Procrustes分析來實現樣本圖像標準化。對完成標準化之后的樣本圖像通過主成分分析來計算形狀參數。主成分分析的核心思想是求樣本數據中的主成分,在不丟失樣本數據主要信息的同時實現數據降維。在這里我們利用主成分分析時,首先計算樣本數據的協方差矩陣,然后計算出該矩陣的所有特征值和特征向量。選取若干數值較大特征值作主成分,并將其對應的特征向量作為主成分矩陣。根據主成分分析的原理,主成分矩陣中的特征向量所包含的形狀變化信息量多,因此可以采用樣本數據的主成分來對樣本圖像的形狀變化信息進行統計分析同時用主成分矩陣來對形狀向量進行表示。這里引入一個形狀向量模型參數的概念,完成形狀建模。
1.2 紋理建模的實現
主動表觀模型通過對人臉圖像面部像素進行提取來得到形狀無關灰度信息,再通過對灰度信息進行主成分分析來得到解釋面部圖像灰度變化的紋理模型。
對于人臉樣本圖像,由于人臉只占圖像的一部分,而且位置和像素數量也存在差異,因此必須先對樣本圖像進行變形,才能進行形狀無關紋理信息的提取與分析。首先對平均人臉形狀進行Delaunay三角剖分,將人臉劃分成若干三角網格。然后對所有劃分的網格進行仿射變換。完成這兩步處理之后就可以得到形狀無關紋理圖像。按照特定順序對這些紋理圖像進行像素提取,得到一組灰度向量。對所有灰度向量進行歸一化處理然后再次進行主成分分析,求出這組數據的主成分矩陣并利用KL變換得到平均灰度向量,完成紋理建模。
1.3 統計表觀模型的建立
在求得形狀參數和紋理參數之后,任何圖像的形狀和紋理理論上被完全分離,利用形狀參數和紋理參數可以表示出任何人臉圖像。但實際中形狀模型和紋理模型之間仍然具有一定的相關性,需要再次使用主成分分析來消除這種相關性,得到統計表觀模型。
一般情況下,形狀參數和紋理參數在數值上會有較大的差異,需要引入一個權值來平衡兩個參數的差異。選取一個對角矩陣并將其設為權值,通過權值的引入對形狀參數和紋理參數數值差異進行平衡,可以得到一個連接參數。對連接參數再次進行主成分分析,得到一個新的參數,稱之為表觀模型參數。我們可以用這個表觀模型參數來分別表示形狀向量和形狀無關的灰度向量,從而得到表觀模型。
2 目標人臉圖像的搜索與擬合
目標圖像的搜索與擬合是主動表觀模型的核心內容。目前常用的一種圖像搜索與擬合算法是標準梯度遞減最優化算法。該算法的核心思想是假設誤差圖像與參數的增加量之間存在線性關系,通過調整表觀模型參數和形狀模型參數來縮小合成圖像與目標圖像之間的灰度差值。循環迭代直到合成圖像與目標圖像之間的灰度差值最小,完成對目標圖像的搜索與解釋。其主要步驟可以簡化為:
步驟一:給定初始表觀參數和初始形狀參數,計算得到合成圖像的形狀向量和紋理向量,通過對目標圖像進行采樣和歸一化處理得到目標圖像的紋理向量;
步驟二:根據合成圖像的紋理向量和模型覆蓋區域的紋理向量進行誤差計算,得到初始誤差;
步驟三:計算和調整表觀參數和形狀參數;
步驟四:根據對表觀參數和形狀參數的計算調整求出新誤差;
步驟六:重復步驟四和步驟五,不斷比較新誤差與初始誤差的差值,當其差值小于設定閾值時,認為其收斂,循環結束。
3 實驗驗證
本文利用MATLAB工具對主動表觀模型算法進行了驗證。根據Yale提供的人臉數據作為樣本庫,利用MATLAB對目標人臉圖像進行了特征點的自動標定實驗。實驗結果論證了主動表觀模型算法不僅能夠實現對目標人臉特征點的自動標定,而且標定速度和精度也較為理想。
4 結語
文章利用MATLAB工具進行了目標人臉圖像特征點的自動標定實驗并且驗證了主動表觀算法的可行性及有效性。主動表觀模型不僅能夠快速準確地對目標人臉進行特征點自動標定,而且能夠對人臉圖像進行較好的特征描述和紋理表達,因而可以廣泛應用在計算機人臉圖像技術研究領域。
參考文獻
[1]張浩,莊連生,王涌,莊鎮泉,李斌.主動表觀模型在光照變化影響下的人臉特征點定位[J].電路與系統學報,2009,01:72-76+71.
[2]王濤.基于PCA人臉圖像壓縮與重建算法的研究與實現[D].昆明理工大學,2014.
[3]謝玉鵬,吳海燕.基于AAM的人臉圖像描述與編碼[J].計算機仿真,2009,06:272-276.
[4]章毓晉.基于子空間的人臉識別[M].北京:清華大學出版社,2009:68-69.
[5]王國胤,龔勛.人臉感知:從二維到三維[M].北京:科學出版社,2011:37-38.