計算機視覺行業研究范例6篇

前言:中文期刊網精心挑選了計算機視覺行業研究范文供你參考和學習,希望我們的參考范文能激發你的文章創作靈感,歡迎閱讀。

計算機視覺行業研究

計算機視覺行業研究范文1

[關鍵詞] 物流企業; 自動化; 算法

[中圖分類號] F252; TP39 [文獻標識碼] A [文章編號] 1673 - 0194(2013)06- 0058- 03

0 引 言

隨著物流業被列入我國十大行業振興計劃,物流業已經成為我國經濟發展的不可缺少的重要組成部分。物流業是我國經濟運行的基礎,是推動國民經濟發展的重要支柱性產業之一。隨著國家持續加強和改善宏觀調控政策,物流業發展環境和條件不斷改善,物流業保持了較快的增長速度。但由于中國物流業起步較晚,存在物流成本較高、管理落后等問題,離一體化、信息化的物流業還有一定差距。中國物流業只有應用現代物流的理念,采用先進的信息技術與運作方式,才能應對擁有技術、資金和管理優勢的外國企業的競爭。實現傳統物流業向現代物流業的轉變,也是物流業自身結構調整和產業升級的需要,是整個國民經濟發展的必然要求。我國經濟要集約式發展,必然需要推進現代物流?,F代物流的根本宗旨是降低物流成本、提高物流效率、滿足客戶需求,其中信息化是現代物流的核心。隨著信息技術的不斷更新和物流企業自身的發展,使得新興的信息業務與傳統物流業務之間相互介入,模糊了新興信息技術及業務與傳統物流業務的界限,從而模糊了物流業的產業屬性和產業界限, 即發生了產業融合現象。產業融合是由于技術進步和放松管制的原因,發生在產業邊界和交叉處的技術融合,在經過不同產業或行業之間的業務、組織、管理和市場的資源整合后,改變了原有產業產品和市場需求的特征,導致產業的企業之間競爭合作關系發生改變,從而最終造成產業界限的模糊化甚至重劃產業界限。

產業融合促進了傳統產業創新, 進而推進產業結構優化與產業發展,即產生創新性優化效應。物流信息化的重要性已經引起國內很多學者的重視,并紛紛提出相應的觀點和建議。馬健(2005)認為物流企業將在建立呼叫中心、應用系統領域和網絡計算機領域出現信息化融合的趨勢,并提出物流企業應采取的戰略。鄧小瑜(2011)等從技術融合、產品融合、業務融合、產業衍生4個層面闡述了物流業如何進行信息化建設。物流業與信息業的融合包含通過融合信息技術提高來增強企業競爭力和將信息業務增加到物流服務中形成新的業務2個方面。

視頻攝像頭在日常生活中非常普遍,但是利用率較低,大部分監控系統都是提供視頻數據的線性存儲,成為事后證據查找的有效手段。近年來,隨著計算機視覺的發展,很多學者開始研究視頻理解,尤其是針對視頻信息檢測與識別技術,建立有效的算法,實現底層圖像處理技術與高層視頻內容分析之間的關聯,從而推動了計算機視覺在物流領域的應用,提高物流企業的競爭力。

1 計算機視覺的相關知識

1.1 計算機視覺的概念

20世紀80年代初,Marr從信息處理的角度,提出了第一個比較完善的計算機系統視覺框架。計算機視覺是指利用計算機模擬人眼的視覺功能,對圖片或視頻進行采集、加工、處理和識別,從中提取三維景物的形態和運動信息,解決物流、工業、商業等領域產品圖像自動檢測識別問題,提高檢測識別效率和自動化程度。計算機視覺自動識別技術作為一門交叉學科,近年來受到各相關行業的高度重視。計算機視覺的處理流程為:攝像機圖像采集圖像處理計算機幀存儲、圖像識別控制邏輯顯示器顯示。

1.2 亮度要求

基于計算機視覺的硬件環境中,亮度是非常重要的因素。在計算機視覺中亮度的作用是突出物體的重要特征或使物體本身可見,而弱化物體其他不需要的特征或物體所處的背景。如果物體太亮或太暗,都會影響對物體的處理。

彩色物體反射光譜的某些部分,吸收其他部分。因此開發人員可以利用這個特點來提高某些物體的可視度。開發人員可以利用顏色之間的對比增強某種顏色或抑制其相反的顏色。例如,如果一個紅色的物體在一個綠色背景中則應該加強紅色,這時可使用紅色照明。這樣紅色的物體會顯得明亮,同時會變暗綠色的對象。

LED是目前用于計算機視覺的主要照明技術,相比白熾燈、日光燈等使用時間短、亮度逐漸減弱的特點,LED燈的壽命超過100萬小時,而且耗電小,產生熱量少。

1.3 計算機和攝像機的接口

常用的計算機和攝像機接口包括IEEE 1394、Ethernet、USB2.0 and Gigabit Ethernet等。

1.4 RGB介紹

RGB 顏色空間是實際應用最多的一個顏色空間,在使用計算機進行圖像處理時,數字圖像一般用RGB 空間存儲和表示,分3個通道:紅(Red)、綠(Green)和藍(Blue),分別反映了顏色在某個通道的亮度值。3種原色光不同比例混合即使得人得到不同顏色的感知,這就是RGB顏色空間的由來。RGB 空間中每種顏色都能用三維空間中的一個點來表示。

2 計算機視覺在物流領域的優勢

隨著物流業的迅速發展,計算機視覺在條形碼識別、運動物流跟蹤方面逐漸得到應用。與傳統方法相比,計算機視覺應用在物流領域的優勢為以下方面。

2.1 靈活、低成本

物流系統中一般采用傳感器來收集相關信息,但是傳感器的位置是固定的,如果需要多方位的信息,必須同時需要多個傳感器才能完成。利用計算機視覺攝像機和計算機來完成,只需要通過程序的設置和一臺攝像機就可實現多方位信息的收集。

2.2 高效、準確

在一些人眼難以滿足要求的場合,或不適于人工工作的環境下,用計算機視覺來代替人工視覺可以提高生產效率、信息的準確率。

3 計算機視覺在流水線中多方位跟蹤計數的算法

物流企業在流水線產品的計數方法目前主要采用傳感器,而利用攝像機所提供的視頻信息可以實現多方位的跟蹤。計算機視覺是一個集成系統,圖像分析的時間有限,算法必須簡單有效。本文采用的物流流水線視頻圖像如圖1所示。圖中紅色矩形表示流水線中傳輸的物品,綠色區域為流水線中的物品處理區域。

系統會在視頻圖像中設計①、②、③、④四個計數區域,在物品進行相關處理前進行計數。計數方法為將每幀圖像變為黑白圖,圖像中的紅色變為白色,其余都變為黑色。當每幅圖像中的紅線部分中的白色像素超過一定閾值時,認為物體撞線,如圖2所示,這時確定有需要計數的物品通過,可以開始計數。

3.1 主要算法

3.2 算法的運行結果

OpenCV是Intel公司開發的開源計算機視覺庫。它提供了幾百個C/C++函數,實現了計算機視覺領域中大部分最常用的算法。利用Intel開發的開源視覺庫Intel OpenCV和VC6.0將上述算法轉換為對應的源代碼,可實現4個區域的物品計數。

3.3 算法的評價

該算法利用計算機視覺技術實現了物流流水線上的多方位計數,提高物流企業的信息化水平,節約了資金。算法簡單,運行速度快,完全可以滿足物流企業的實際需求。

4 結論與建議

本文所提出的算法實現了計算機視覺技術在物流企業的應用,為信息產業和物流業的融合提供了新的思路。但信息產業與物流產業的融合并不意味著引入信息技術后物流業的競爭力一定能提高。Berry(1995)指出了企業可以從6個方面來利用技術手段來提高競爭力,根據Berry的建議和我國物流業的實際情況,本文認為從以下幾個方面來考慮如何通過與信息技術的融合提高物流企業的競爭力。

4.1 要有一個戰略性的全局行動綱領

技術只是一種手段,使用技術的目的是為了企業發展服務,應符合全局發展的需要。因此物流企業高層管理者應該參與技術戰略的制定,保證技術戰略與全局戰略一致,并有CIO(首席信息官)監控具體執行情況。而不應該盲目使用一些新技術或進行信息改革,造成企業不必要的損失。

4.2 解決主要問題

物流業作為服務行業其最終目的是為客戶服務,使用信息技術的有效性應建立在為客戶解決實際問題的基礎上。因此信息產業與物流業的融合應體現在為客戶提供更多的便利,或提供增值服務的基礎上。

4.3 使用物流公共信息平臺和建立物流信息系統,保證系統有效運轉

通過現代物流公共信息平臺的建設,企業可以及時獲得需求信息,政府可獲得物流業相關的調控和管理的宏觀信息,實現互聯互通。通過企業流程再造,利用含有CRM(客戶關系管理)等模塊的ERP系統,采用EDI(電子數據交換系統)、GPS、條形碼、無線射頻技術等先進技術,建立真正適應企業發展的符合現有服務模式的管理信息系統。

4.4 創新型物流人才的引進和培養

物流企業在自身提高業務流程和信息化水平的同時,還應注重創新型人才的引進和培養,特別是有國際大型物流企業管理和技術經驗的復合型人才。

主要參考文獻

[1] L Leonard,Berry. On Great Service:A Framework for Action[M]. New York NY:The Free Press,1995.

計算機視覺行業研究范文2

關鍵詞:計算機視覺分析;微小尺寸;精密校正;閾值;圖像分割

中圖分類號:TP274.4

計算機視覺分析理論是基于精密模式識別和人工智能程序化校驗技能進行綜合整編的方法,利用光學信息對真實物理結構的實時反映,配合人機協調手段進行二維圖像的呈現。在工件表面進行質量檢測和圖片制備要素分析的系統環節中,闡述物體在空間環境之間的關系樣式,爭取三維場景的科學搭建。集合要素內容包括邊緣、線條和曲面的配備,建立以工業部件為中心的坐標體系,并適當運用不同符號表現模式實現必要三維結構和空間關系的調整,促進精密儀器細節檢驗工作質量的不斷提高。

1 計算機視覺檢測技術的相關理論研究

1.1 技術原理分析

滲透性計算機輔助支持結構的視覺鑒定技術在被測實體中的圖像顯示支持功能基礎形勢上進行質量狀況的把控,這其實就是根據既定的偏差標準實現規模物件的逐個排查。細致的檢測工作在深度零件的誘導性特征和完整性配件的支持下,對整體完好效果的幾何制備模型進行測量[1]。近階段的視覺規范系統利用電耦合器件和攝像機進行主題元素的捕捉,并利用計算機內部程序的數字信號轉化工具實現圖像的并行處理。采用目標圖像的特殊坐標記錄,利用灰度分布圖內的多種綜合功能處理系統改善的要務。常規視覺下的檢測過程相對比較繁瑣,主要是將被檢測物體放置于照明效果相對均勻的可控制背景環境中,聯結CCD技術和圖像卡實現被測部件和數字圖像的共性要素融合,保證計算機自動化處理程序的錄入。當然,這類研究系統是需要利用相關軟體進行放大的,其主要必備功能就是進行圖像的預處理、識別和有效分析,將整個過程內部的實際結果數值,包括被測部件的自身缺陷、尺寸等進行整理。

1.2 計算機視覺微小尺寸精密檢測工業應用技術的現狀

在科學設計信息內容和工業加工制備要領集成化對待的環節中,通常不會直接進行部件表面的接觸,一般運用計算機程序下的掃描認知和圖像即時呈現功能進行快速的比對檢測,整體信號抗干擾能力較強,因此在現代工業生產技術領域內部廣受好評。電子工業是在建立計算機視覺分析工藝之后表現最為活躍的行業類型,在此基礎上衍生的印刷電板路和集成電路芯片就是利用標準模型的整改,實現規模工序的緊密排列。目前,時下流行的汽車生產、紡織、商品包裝等也逐漸向這類手段靠攏,全面改善了現代化工業制備的應用效果。

2 應用視覺微小尺寸分析技術內部拓展機能的補充

灰度圖像的主要分割方法包括灰度閾值校正、邊緣檢測制備等手段。

2.1 灰度閾值校正

這是區域分割方法中一種常見的手段,主要配合多個或單個閾值將圖像自身的灰度級別劃分為幾個項目組,對相同像素的單位數據進行整編。根據實效范圍進行分類,包括局部和全局閾值探究兩種手段,全局規模下的閾值分析方法就是利用整幅圖的灰度直方分布圖進行內部最優閾值分割,包括單閾值和多閾值兩種形式;同時還可以將初始分析的圖像進行子元素的拆解,之后利用單個子圖像的既定閾值范圍進行最優化分割[2]。分割的基本原理公式為:

其中,合理閾值的選取是非常重要的,目前閾值確定的手段主要包括直方圖雙峰對照法和最大類間方差累積法等。這種利用灰度閾值實現精準質量的劃分手段,計算執行工作相對比較簡單,并且實際工作效率水平較高,即便是實際需要分割的物體與圖像背景對比深度較強也可以收放自如,但唯一的缺點就是缺少對空間信息的掌控,涉及亮度不足的圖像問題,這種閾值分割技術的施工質量往往不會太高。

2.2 邊緣檢測制備工序

圖像內部元素的分割其實就是進行部件邊界效益的提取,而邊緣檢測制備工序則是利用像元及鄰域的整體狀態進行物體邊界相關結構的搭建。邊緣檢測分割制備技術具體包括并行和串行兩種模式,并行手法是運用梯度信息的提取實現不同類別算子的整理;串行邊界分割原理則是根據適當強度標準和相似走向的兩個邊緣端點位置實現連接,主要代表算法包括啟發式智能搜索手段等。這種串行算法較并行邊界積累統計原則來說具有更強的抗干擾能力,但實際的邊緣檢測同樣不能完好地維持連續效果,需要利用其余技術內容進行邊緣制備技巧的修復。

(1)原始圖像 (2)Robert算子邊緣檢測 (3)Sobel算子邊緣檢測

(4)Prewitt算子邊緣檢測 (5)Kirsch算子邊緣檢測 (6)Gauss-Laplace算子檢測

圖1 微小雙聯齒輪邊緣檢測

3 視覺檢測系統的創新性改進

根據以上現狀問題,創新式視覺整改校驗系統利用照明光源、攝像機和圖像采集卡等結構實現計算機輸出結果質量的補充。其主要運行過程如下:利用被測部件在均勻照明背景的全面優化控制基礎,實現物體結構的全面清晰呈現,使用攝像機對相關圖像信號進行梳理并轉化為電荷信號,配合相關的圖像資源采集卡進行部件數字化圖像的格式轉化;計算機內部軟體操作程序將得到的數字圖像進行處理和識別,并將最終結果數據輸出,實現現代工業技術整體質量規??刂频募榷ㄒ?。

系統硬件在實現部件轉化圖像信息的環節中,連接檢測機理下的連續軟件規劃和照明光源等相關設備進行圖像適當分辨率的調整,維持圖像較為清晰的對比效果。全面控制獲取數字圖像的時間,抵抗不良因素的干擾影響,維持內部成本經濟規模的合理控制,促進科技應用和可持續發展經濟戰略雙重價值標準的同步進展。其中,光源設備的選擇必須落實到部件既定的幾何形狀條件下,利用相關性能參數進行實際工作要求的提供,包括光源位置、亮度、壽命特性等因素的堆積,常用的可見光源包括水銀燈、熒光燈等,但這類光源使用壽命有限,因此現下多配用LED光源進行快捷反應、小功耗標準的補充,并且長期使用后的照明效果比較穩定[3]。而攝像機等結構主要還是校正參數的表達方式,進行圖像合理分辨率的整改,促進圖像采集數字化協調功能的發展,提高系統工作速度等。

4 結束語

計算機視覺檢測系統在進行一定部件性能評比的活動中有著很高的貢獻,不僅配合硬件的照明、參數制備要領制備功能,同時促進數字化圖像對比的速度,使得工業生產環節中的部件檢查工序得到大范圍整改,滿足可持續發展戰略規模的視覺意義,促進現代智能化分析處理技術的全面覆蓋。

參考文獻:

[1]陸春梅.基于數字圖像處理技術的接桿激光環焊焊縫視覺檢測系統研究[D].上海交通大學,2008.

[2]羅敏.基于機器視覺的黑片缺陷檢測圖像邊緣提取算法研究[D].沈陽理工大學,2010.

計算機視覺行業研究范文3

【關鍵詞】機器視覺;應用研究

機器視覺是一門涉及人工智能、計算機科學、圖像處理、模式識別、神經生物學、心理物理學等諸多領域的交叉學科。機器視覺主要利用計算機來模擬人或再現與人類視覺有關的某些智能行為,從客觀事物的圖像中提取信息進行處理,并加以理解,最終用于實際檢測和控制。隨著現代計算機技術、現場總線技術與大規模集成電路技術的飛速發展,機器視覺技術也日臻成熟,已經廣泛應用在國民經濟發展的各行業。

1.機器視覺系統組成

一個典型的機器視覺應用系統包括圖像捕捉、光源系統、圖像數字化模塊、數字圖像處理模塊、智能判斷決策模塊和機械控制執行模塊,如圖1所示。首先采用CCD攝像機獲得被測目標的圖像信號,然后通過A/D轉換成數字信號傳送給專用的圖像處理系統,根據像素分布、亮度和色彩等信息,進行各種運算來抽取目標的特征,然后再根據預設的判別標準輸出判斷結果,去控制驅動執行機構進行相應處理。

總之,隨著機器視覺技術自身的成熟和發展,可以預計它將在現代和未來制造企業中得到越來越廣泛的應用。

2.機器視覺技術的應用

在國外,機器視覺的應用主要體現在半導體及電子行業,其中大概40%-50%都集中在半導體行業。具體如PCB印刷電路;SMT表面貼裝;電子生產加工設備;機器視覺系統還在質量檢測的各個方面已經得到了廣泛的應用,并且其產品在應用中占據著舉足輕重的地位。

而在中國,以上行業本身就屬于新興的領域,再加之機器視覺產品技術的普及不夠,導致機器視覺在以上各行業的應用幾乎空白。目前隨著我國隨著配套基礎建設的完善,技術、資金的積累,各行各業對采用圖像和機器視覺技術的工業自動化、智能化需求開始廣泛出現,國內有關大中專院校、研究所和企業近兩年在圖像和機器視覺技術領域進行了積極思索和大膽的嘗試,逐步開始了工業現場和其它領域的應用。

(1)工業中的應用

雖然機器視覺技術從20世紀80年代才開始起步,但由于其突出的優點,在各種工業領域被廣泛應用,特別是近幾年發展十分迅速,國內外的成果也是層出不窮。

在國外,機器視覺技術廣泛應用于機器零部件的裝配、非接觸測量、產品質量檢測、在線過程控制、數控機床加工、過程監控等領域。英國ROVER汽車公司800系列汽車車身輪廓尺寸精度的100%在線檢測,是機器視覺系統用于工業檢測中的一個較為典型的例子,該系統由62個測量單元組成,每個測量單元包括一臺激光器和一個CCD攝像機,用以檢測車身外殼上288個測量點。汽車車身置于測量框架下,通過軟件校準車身的精確位置。測量單元的校準將會影響檢測精度,因而受到特別重視。每個激光器/攝像機單元均在離線狀態下經過校準。同時還有一個在離線狀態下用三坐標測量機校準過的校準裝置,可對攝像頂進行在線校準。檢測系統以每40秒檢測一個車身的速度,檢測三種類型的車身。系統將檢測結果與人、從CAD模型中撮出來的合格尺寸相比較,測量精度為±0。1mm。ROVER的質量檢測人員用該系統來判別關鍵部分的尺寸一致性,如車身整體外型、門、玻璃窗口等。實踐證明,該系統是成功的,并將用于ROVER公司其它系列汽車的車身檢測。

機器視覺在國內的應用主要集中于檢測與定位等幾個方面,這樣的工業產品占據了中國市場的絕大部分。機器視覺在工業檢測中的應用最為常見的是對各種機械零件的幾何尺寸進行測量,在半導體及電子行業,國內高等院校和科研單位也研究出基于機器視覺的管腳尺寸自動檢測裝置。此外,機器視覺還被用于對于如刀具等工業設備的檢測和數控機床的加工。在很多工業領域存在著高精度定位的問題,如鉆床數控系統鉆頭定位、金屬板材數控加工軌跡坐標定位等。目前機器視覺技術由于其高精度的優點在這方面得到廣泛的應用。華中科技大學在金屬板材數控加工中利用機器視覺技術對加工軌跡坐標定位。提出一種基于機器視覺的非接觸式加工軌跡坐標定位方法,完成了金屬板材數字化成形中支撐模型的非接觸式高精度快速定位。湖南大學進行了鉆頭視覺定位研究,在視覺定位中采用間接定位方式,間接實現鉆頭刃磨初始狀態的定位。中國計量學院等單位進行了基于機器視覺的PCB數控鉆機定位研究。大量的實踐證明采用機器視覺系統進行定位并且綜合運用數控伺服傳動技術以及各種先進控制技術能夠有效實現精確定位。利用機器視覺系統節約了大量的人力和物力,降低了產品生產成本。

(2)農業中的應用

計算機視覺技術在農業上的應用研究,起始于20世紀70年代末期,主要應用于植物種類的鑒別、農產品品質檢測與分級等。隨著計算機軟硬件技術、圖形圖像處理技術的迅猛發展,它在農業上的應用研究有了較大的突破,在農業領域的生產前、生產中、收獲時和產后的各個環節中,均可以利用計算機視覺技術來實現這些農業生產的視覺化。計算機視覺在產前的應用主要是檢驗種子質量;在產中的應用包括田間雜草識別、植物生長信息的監測、病蟲害的監視和營養脅迫診斷等方面;在農作物收獲時的應用主要體現在農業機器人的研制與開發上;在產后的應用包括水果分級和農產品的加工等。在農田作業機械上,機器視覺技術被不斷的開發和應用。農藥的粗放式噴灑正是農業生產中效率最低、污染最嚴重的環節。利用機器視覺技術可以實現農藥的精量噴灑,近年來,機器視覺技術在播種機械方面的應用主要是檢測播種質量;在自動收獲機等農田自動作業機械上,更需要依靠機器視覺系統來確定作物行與機械的相對位置,以控制自動作業機械在作物行間自動行進,

機器視覺技術在農業生產上的應用可提高生產的自動化水平,解放勞動力,具有良好的應用前景。同時還應看到,由于農業對象的特點,機器視覺理論和技術的局限性以及硬件條件的限制,機器視覺技術在農業生產的應用距離實用和普及還有相當長的距離。相信隨著相關技術的發展,很多問題會得到好的解決,機器視覺技術在農業生產中的應用會極大地加快農業現代化的進程。

(3)醫學上的應用

隨著藥品和醫療器械安全性問題重要性的不斷提升,越來越多的生產廠商將機器視覺技術引入實際生產中來,以達到提高生產效率,加強產品品質保障的目的。同樣,在醫療系統中機器視覺也得到了越來越多的應用。

機器視覺科技醫藥領域的應用主要分為醫學與藥物兩部分。機器視覺技術在醫學疾病診斷方面的應用主要體現在兩個方面:一是對(X射線成像、顯微圖片、B超、CT、MRI)圖像增強、標記、渲染處理,主要利用數字圖像處理技術、信息融合技術對X射線透視圖、核磁共振圖像、CT圖像進行適當疊加,然后進行綜合分析協助醫生診斷;二是利用專家知識和3D重構對物體三維信息與運動參數進行分析并給出形象準確的解釋,如診斷與手術等。機器視覺技術的應用不僅節省了人力,而且大大提高了準確率和效率。在藥物方面,機器視覺系統對藥用瓶的缺陷檢測,也包括了藥用玻璃瓶范疇,也就是說機器視覺也涉及到了醫藥領域,其主要檢測包括尺寸檢測、瓶身外觀缺陷檢測、瓶肩部缺陷檢測、瓶口檢測等。除此之外,對藥劑雜質的檢測、對醫學用具質量的檢測、對藥物外包裝泄露的檢測等等都在保障著藥物的質量安全,保障著人們的生命健康。

(4)交通領域的應用

隨著計算機的普及和相關軟件的不斷更新升級,機器視覺技術在交通領域所發揮的作用愈為重要。機器視覺技術在交通領域的應用范圍較廣,主要包括視頻檢測系統、智能車輛的安全保障系統、車牌識別和交通指揮等。

視覺技術應用于視頻檢測時,視頻檢測系統的目標就是用數字圖像處理和計算機視覺技術,通過分析交通圖像序列來對車輛、行人等交通目標的運動進行檢測、定位、識別和跟蹤,

并對目標的交通行為進行分析、理解和判斷,從而完成各種交通流數據的采集、交通事件的檢測,并盡快進行相應處理。視頻的交通事件和參數檢測系統有高度的網絡化和智能化,可實現遠程監控和設置。視覺技術應用于智能車輛安全保障系統,主要用于路徑識別與跟蹤、障礙物識別、駕駛員狀態監測、駕駛員視覺增強等。德國UBM大學Dick-manns教授領導的智能車輛研究小組一直致力于動態機器視覺領域的研究,研制的EMS-Vision視覺可較好地模擬人眼功能。車牌識別技術(VLPR)是計算機視覺和模式識別技術在現代智能交通系統中的一項重要研究課題,是實現交通管理智能化的重要環節。隨著圖像處理技術的日趨成熟,更多算法的融入綜合,使得車牌識別技術逐漸成熟。單一算法很難達到良好的識別效果,只有多種方法結合,才能實現車牌識別的高效性和準確性。過去的10多年里,有些國家已經成功開發了一些基于視覺的道路識別和跟蹤系統。其中,具有代表性的系統有:LOIS系統、GOLD系統、RALPH系統、SCARF系統和ALVINN系統等。

機器視覺技術在交通各領域都發揮著越來越重要的不可替代的作用。在取得較大成績的同時仍有不足。其一應盡快開發出具有高性價比的實用化的激光距離成像系統,能夠獲取高質量的原始圖片至關重要;其二,處理各種交通事件的及時性決定了所有的圖像處理的速度應盡可能的快,目前的各種算法都各有優劣,如何能在最短的時間內完成圖像的識別工作成為我們下一步要努力的方向。

3.發展趨勢

在機器視覺賴以普及發展的諸多因素中,有技術層面的,也有商業層面的,但制造業的需求是決定性的。制造業的發展,帶來了對機器視覺需求的提升;也決定了機器視覺將由過去單純的采集、分析、傳遞數據,判斷動作,逐漸朝著開放性的方向發展,這一趨勢也預示著機器視覺將與自動化更進一步的融合。未來,中國機器視覺發展主要表現為以下一些特性:

(l)隨著產業化的發展對機器視覺的需求將呈上升趨勢。

(2)統一開放的標準是機器視覺發展的原動力。

(3)基于嵌入式的產品將取代板卡產品。

(4)標準化一體化解決方案是機器視覺發展的必經之路。

(5)機器視覺系統價格持續下降、功能逐漸增多。

4.結語

機器視覺技術經過20年的發展,已成為一門新興的綜合技術,在社會諸多領域得到廣泛應用。大大提高了裝備的智能化、自動化水平,提高了裝備的使用效率、可靠性等性能。隨著新技術、新理論在機器視覺系統中的應用,機器視覺將在國民經濟的各個領域發揮更大的作用。

參考文獻

[1]李福建,張元培.機器視覺系統組成研究[J].自動化博覽,2004(2):61-63.

[2]范祥,盧道華,王佳.機器視覺在工業領域中的研究應用[J].現代制造工程,2007(6):129-133.

[3]張萍,朱政紅.機器視覺技術及其在機械制造自動化中的應用[J].合肥工業大學學報(自然科學版),2007, 30(10):1292-1295.

[4]馬彥平.計算機視覺技術在農業生產中的應用與展望[J].中國農業資源與區劃,2009,30(4):21-27.

[5]饒秀勤.基于機器視覺的水果品質實時檢測與分級生產線的關鍵技術研究[博士學位論文].杭州:浙江大學,2007.

[6]馮新宇,龐艷輝.車牌識別技術實現方法初探[J].交通科技與經濟,200712:50-511.

[7]徐琨,賀昱曜,王夏黎.基于背景模型的運動車輛檢測算法究[J].微計算機信息,2007,4-1:120-1211.

計算機視覺行業研究范文4

[關鍵詞]變電站工作區;安全監控;智能視頻監控

中圖分類號:TM63;TM769 文獻標識碼:A 文章編號:1009-914X(2016)13-0321-01

1. 引言

在變電站中,完成各類作業的主體之一是人員,因人在完成各類作業時需要在變電站內不斷運動,因此在變電站工作現場安全區域監控中人的行為監控是重點之一。

目前在變電站工作現場安全管理方面存在以下問題:

1)部分工作人員自覺性不高,導致習慣性違章屢禁不止。如跨越護欄進入帶電區域的現象、不正確佩戴安全帽、不正確穿著工作服、不按照安規要求搬運工具、登高不佩戴安全帶、監護人離崗等違章行為時有發生。

2)當有監督管理人員在現場監管時,極少部分工作人員對監督管理人員要求、提醒及規章制度不屑一顧,對作業現場安全隱患麻痹大意,因此很有可能在不經意間導致事故發生,威脅人員生命安全,威脅電網運行安全。

目前,隨著計算機技術及視覺監控系統的不斷發展,變電站工作現場安全監控系統開始得到應用。特別對于無人值守變電站工作現場的安全監控問題,對作業人員擅自穿、跨越安全圍欄或超越安全警戒線進行警告監測,糾正違規違章行為,防止因現場監控不到位引發的誤操作、誤入工作現場等惡性事故的發生,對提升電力作業現場安全管理水平有重要意義。因此,需要探尋全新的安全監管手段,實現作業現場高效監管,提高監管水平,降低作業安全風險。

2. 發展現狀

(1) 安全系統工程

安全系統工程是以信息論、控制論等為基礎,專門研究如何用安全工程、系統工程、可靠性工程的原理和方法,對研究對象中的風險進行辨識、評價、控制和消除,以實現系統及其全過程安全的科學技術。

安全系統工程產生于20世紀60年代初期美英等工業發達國家。美國、英國、日本等公司相繼發表了火災爆炸指數評價法、埃德蒙德評價法、化工企業六步驟安全評價法等多種評價方法,用于化學企業安全評價。以此同時,許多系統安全分析方法和評價方法在電子、航空、鐵路、汽車、冶金等行業得到了應用。

我國安全系統工程的研究、開發是從20世紀70年代末開始的。天津東方化工廠應用安全系統工程成功地解決了高度危險企業的安全生產問題,為我國各個領域學習、應用安全系統工程起了帶頭作用。其后,機械、冶金、航空、交通運輸、核電等行業的企業廣泛借鑒引用國外的系統安全分析方法,對現有系統進行分析和評價,取得了良好的應用效果。

(2) 變電站安全管理方法

近年來,變電站工作現場安全管理實行“安全第一、預防為主、綜合治理”的安全工作方針,加強基礎管理,狠抓現場管控,檢修現場安全措施管理方面主要有工作票制度、運行人員操作票制度和現場作業危險點分析預控卡以及繼保人員使用的二次工作安全措施票,把安全意識、制度約束、作業行為落實到現場安全管理全過程,使設備常規監督、狀態檢修、跟蹤預控等各項措施實現無縫滲透。目前,變電站檢修現場安全措施管理存在以下問題:一是作業現場失去安全監護違章作業。二是作業人員素質不高,責任心不強。三是擅自擴大工作范圍。四是對作業人員的安全教育及交底不足、不到位。五是現場監督工作不到位。

(3) 安全監控方法

計算機智能視頻監控是計算機視覺領域一個新興的應用方向和備受關注的前沿課題。伴隨網絡技術和數字視頻技術的飛速發展,監控技術正向著智能化、網絡化方向不斷前進。監控系統功能日益強大,但是依然需要工作人員不間斷地分析監視場景內的活動,日夜值守,工作量繁重。因此計算機視覺和應用研究學者適時提出新一代監控―視頻監控的概念。視頻監控在不需要人為干預情況下,利用計算機視覺和視頻分析的方法對攝像機拍錄的圖像序列進行自動分析,實現對動態場景中目標的定位、識別和跟蹤,并在此基礎上分析和判斷目標的行為,從而既能完成日常管理又能在異常情況發生時及時做出反應。計算機視頻監控系統不僅符合信息產業的未來發展趨勢,而且代表了監控行業的未來發展方向,蘊藏著巨大的商機和經濟效益,受到學術界、產業界和管理部門的高度重視。

目前,對計算機視頻監控的研究與應用方興未艾。計算機視頻監控是利用計算機視覺和圖像處理的方法對圖像序列進行運動檢測、運動目標分類、運動目標跟蹤以及對監視場景中目標行為的理解與描述。其中,運動檢測、目標分類、目標跟蹤屬于視覺中的低級和中級處理部分,而行為理解和描述則屬于高級處理。運動檢測、運動目標分類與跟蹤是視頻監控中研究較多的三個問題;而行為理解與描述則是近年來被廣泛關注的研究熱點,它是指對目標的運動模式進行分析和識別,并用自然語言等加以描述。

3. 理論依據

(1) 安全系統工程

對于變電站安全監控系統而言,它是安全系統工程學在變電站安全中的具體應用,其主要目的是通過對變電站工作人員和設備工作安全相關的監控對象某個或某一類屬性的檢測、監控、分析評價,及時發現其屬性在變電站運營過程中狀態的變化情況。如果出現設備故障隱患、人員異常行為等危機安全的現象,提醒相關人員及時采取有針對性的措施,對監控對象進行處置、維修和養護,以保證變電站處于良好的運行狀態,從而保證電力系統穩定安全地工作。

(2) 安全監控技術

目前,智能視頻監控技術應用于變電站工作現場安全監控管理中。計算機視覺的研究目的是利用計算機代替人眼及大腦對于景物環境進行感知、解釋和理解。如果把攝像機看作人的眼睛,而智能視覺監控系統則可以看作人的大腦。智能視覺監控系統能夠識別不同的物體,發現監控畫面中的異常情況,并能夠以最快和最佳的方式發出警報和提供有用信息,從而能夠更加有效的協助安全人員處理危機,并最大限度的降低誤報和漏報現象。一般而言,智能視覺監控的主要研究內容包括目標檢測與分類、目標跟蹤、目標匹配額、目標定位、目標識別和行為理解(行為分析、語義描述)等。

4. 應用情況

從國外的應用情況來看,智能視頻監控技術具有兩種應用模式:一是與傳統的模擬視頻監控系統結合使用,二是基于網絡的全數字化智能視頻監控系統。目前,我國的從事智能視頻監控系統的公司一般都是與國際上比較好的智能視頻領域的公司合作。2005年5月,北京兆維泰奇科技有限公司與瑞士Visio Wave公司合作基于網絡智能化的安防監控解決方案。2007年3月,深圳貝爾信科技與以色列IOimage公司建立合作伙伴關系并成為中國區產品總與技術支持中心,推出了 bellsent系列產品,已成功在機場、油田、博物館、鐵路干線、倉庫等地方成功應用。

5. 結語

視頻監控系統未來發展會越來越智能化,在有效采集信息的基礎上,智能視頻監控系統比普通的網絡視頻監控系統具備更強大的圖像處理能力和智能因素,其能感知和理解的信息包括人臉(用戶身份)、人和物的行為、人員流動、人和物的消失出現、人群聚集狀態、人體疲勞狀態、煙霧產生和蔓延等,所有需要用到這些信息的應用領域,都有可能成為智能視頻分析的用武之地。變電站工作現場安全監控系統使用智能監控技術,實現對變電站工作現場的全自動化管控,對人身安全和設備安全以及對提高整個網絡的安全水平都有重要意義。

計算機視覺行業研究范文5

關鍵詞: 機器視覺; 圖像檢測; 航空輪胎; 表面質量

中圖分類號: TP 23文獻標識碼: A

引言近年來,隨著生產工藝飛速發展,人們開始關注產品的外觀質量,比如印刷品、包裝、工藝品等以外觀質量為重要附加價值的產品,又比如航空輪胎等表面缺陷會直接影響到使用效果甚至會給使用者的生命財產安全帶來無可挽回的損失的產品。眾所周知,機器視覺已經發展成為重要的工業生產加工手段之一,在中國成為全球重要的制造中心之一的背景下,中國成為繼美國、歐洲和日本后的全球第四大機器視覺市場,同時也是最具發展潛力的市場。一方面外國企業積極入駐中國帶來了巨大的視覺系統需求,另一方面國內企業不斷擴大生產規模,加大了對視覺系統的需求,以航空輪胎為例,未來十年,國家將在大飛機項目中投入500~600億資金,大飛機項目的發展,必將會帶動航空輪胎行業大規模的發展,對航空輪胎的質量要求也會更加嚴格。1國內外相關技術研究國外對機器視覺技術的研究,由于開展的比較早,而且具有資金、技術以及硬件方面的優勢,已經走在了國內的前面。國外的機器視覺系統的應用領域涉及到了社會生產的各個方面,有原始的在線監視,也有外觀檢測以及動作、行為控制,許多工業加工成套生產設備都集成了機器視覺系統,成為加工生產線的標配,比如印刷生產線上的機器視覺質量控制系統,又比如汽車制造業中的移動三坐標測量系統[1]。由于經濟和技術原因,國內絕大多數圖像處理技術公司都以國外產品為主,沒有或者很少涉足擁有自主知識產權的機器視覺在線檢測設備,對視覺技術的開發應用停留在比較低端的小系統集成上,對需要進行大數據量的實時在線檢測的研究很少,也很少有成功案例。但是,隨著國內經濟發展和技術手段不斷提高,對產品質量檢測要求就更高,對在線檢測設備的需求也就更大,具有巨大的市場潛力。計算機、攝像機等電子技術的飛速發展大大提高了機器視覺系統的硬件水平,同時圖像處理理論和算法的快速發展也給機器視覺系統提供了強大的軟件支持。但是,仍然伴隨著一些問題,主要有以下兩點:光學儀器第35卷

第3期謝,等:機器視覺在輪胎檢測領域的應用研究

(1)算法的精確性提高伴隨著計算量的成倍增加,處理時間就成為了實時檢測的軟肋;(2)硬件的分辨率提高了,圖像的分辨率、精度也隨之提高了,但是數據量計算量都因此成倍增加。因此,如何保證檢測的實時性和準確性,是機器視覺系統在工業應用中需要解決的核心問題。2視覺檢測核心技術

2.1機器視覺圖像處理技術機器視覺就是用機器代替人眼來做測量和判斷。機器視覺系統是指通過機器視覺產品(即圖像攝取裝置,分CMOS和CCD兩種)將被攝取目標轉換成圖像信號,傳送給專用的圖像處理系統,根據像素分布和亮度、顏色等信息,轉變成數字化信號;圖像系統對這些信號進行各種運算來抽取目標的特征,進而根據判別的結果來控制現場的設備動作。有大量的文獻和著作給與介紹和討論,其中比較著名的馬頌德的《計算機視覺》介紹了計算機視覺的算法和理論,以及Richard Hartley的《Multiple View Geometry in Computer Vision》介紹了在計算機視覺中的幾何理論和方法[2]。機器視覺中的圖像處理方法,主要包括圖像增強、數據編碼和傳輸、平滑、邊緣銳化、分割、特征抽取、圖像識別與理解等內容。經過這些處理后,輸出圖像的質量得到相當程度的改善,既優化了圖像的視覺效果,又便于處理器對圖像進行分析、處理和識別[3]。機器視覺理論應用于現代檢測領域,是上世紀末本世紀初計算機視覺的一個新的研究方向。它使用計算機視覺的理論方法來識別物體的關鍵點,經過分析處理以后,轉換成坐標數據,然后產生檢測數據。國內已有學者把機器視覺技術運用于檢測領域[4]。但是在輪胎檢測領域,機器視覺技術的應用還僅僅停留在理論之上,還沒有可實際應用的商品化的設備,更不用說結合機器視覺和嵌入式兩種技術的便攜式檢測儀了。

2.2嵌入式技術嵌入式系統一般指非PC系統,有計算機功能但又不稱之為計算機的設備或器材。它是以應用為中心,軟硬件可裁減的,適應對功能、可靠性、成本、體積、功耗等綜合性嚴格要求的專用計算機系統。嵌入式系統幾乎包括了生活中的所有電器設備,如掌上PDA、移動計算設備、電視機頂盒、手機上網、數字電視、多媒體、汽車、微波爐、數字相機、家庭自動化系統、電梯、空調、安全系統、自動售貨機、蜂窩式電話、消費電子設備、工業自動化儀表與醫療儀器等。嵌入式系統有以下幾大優點[56]:(1)嵌入式系統通常是面向特定應用的,它通常都具有低功耗、體積小,集成度高等特點;(2)嵌入式系統和具體應用有機地結合在一起,它的升級換代也是和具體產品同步進行的,因此嵌入式系統產品一旦進入市場,就具有較長的生命周期;(3)由于空間和各種資源相對不足,嵌入式系統的硬件和軟件都必須設計,量體裁衣、去除冗余,力爭在同樣的硅片面積上實現更高的性能,這樣才能在具體應用中對處理器的選擇更具有競爭力。本研究選取嵌入式系統中的DSP(數字信號處理器)來進行開發,具體型號為TI公司的TMS320。它具有很高的編譯效率和執行速度,在信號處理方面具有優勢,它的特點如下:(1)程序和數據具有獨立的存儲空間,有著各自獨立的程序總線與數據總線,可以同時對數據和程序進行尋址,大大提高了數據處理能力;(2)由于廣泛采用了流水線操作,減少了指令的執行時間,可以同時運行8條指令;(3)與一般計算機不同,乘法(除法)不由加法和移位實現,它具有硬件乘法器,乘法運算可以在一個指令周期內完成;(4)指令周期降到了1.67 ns。隨著工作頻率進一步提高,指令周期將進一步縮短;(5)擁有自己獨特的專門為數字信號處理而設計的指令系統;(6)相比傳統的處理芯片,它還具有體積小、功耗小、使用方便、實時處理迅速、處理數據量大、處理精度高、性能價格比高等許多優點。3輪胎檢測系統構成

3.1研究目標機器視覺用于產品表面缺陷檢測需要面對以下主要問題:(1)數據處理量非常龐大;(2)如何快讀匹配圖像;(3)如何快速實現缺陷分割并剔除偽缺陷;(4)如何選取缺陷特征,用以實現缺陷識別。以具體產品為例,相對其他輪胎產品,航空輪胎對質量檢測的要求較為嚴格,只要航空輪胎的檢測技術到位,其他輪胎產品也基本可以檢測。以航空輪胎的缺陷檢測為例,根據GB/T 9747-2008《航空輪胎試驗方法》、GB/T 13652-2004 《航空輪胎表面質量》和GB 15323-1994 《航空輪胎內胎》等標準的要求,研究表面缺陷在線檢測的圖像處理方案;開發一套基于機器視覺的產品表面缺陷的在線檢測設備,同時根據GB/T 13653-2004 《航空輪胎X射線檢測方法》所述,配合X射線發射儀,利用一對一的服務器/客戶機構架的機器視覺對標準中所描述的航空輪胎的一系列缺陷,如斷層、氣泡和裂口等進行高精度、高實時性、高連續性以及非接觸式的在線缺陷檢測。具體技術指標:(1)能檢測出最小直徑0.3 mm的輪胎內部缺陷(即橫向縱向最小均為0.3 mm)并能對缺陷進行分類識別,主要包括結構類、氣泡類和夾雜物類,對缺陷的檢出率要求大于90%;(2)對缺陷部位進行定量和定位分析:讀出缺陷的尺寸(誤差0.5 mm),測出缺陷距離輪胎表面的深度,決定缺陷在輪胎內部的位置;(3)在線檢測設備的檢測檢測速度與X射線管旋轉速度同步,X射線管旋轉一周即完成一個輪胎一個圓周的缺陷檢測。

3.2研究內容和技術路線

3.2.1確定機器視覺檢測系統的基本框架在數據量大時,采用一個處理器搭配一臺攝像機的一對一方式。在產品表面檢測中,由于航空輪胎的圓周面比較大,數據量也就比較大,通常采用的機器視覺單攝像機方式,很難滿足圓周面檢測分辨率高、數據量大的要求,而多臺攝像機能滿足分辨率和數據量的要求,卻又相應帶來實時性差的問題。若采用多臺攝像機的方式,就需要配備多套成像系統,一套成像系統造價在10萬元左右,基于成本和計算數據量的考慮,本研究選用一對一方式,利用分時運動克服單臺攝像機采集數據量不足的缺點。具體來說,就是在經典的服務器/客戶端模式架構的基礎上設計一種基于機器視覺的系統結構以實現輪胎圓周面產品表面缺陷的在線檢測,該結構主要由四部分組成:服務器(嵌入式系統)、客戶端(圖像處理子系統)、信號模塊(PLC)、輸出單元。系統框架如圖1所示。每隔一定的時間(系統初步設定為5 s),服務器通過PLC控制步進電機驅動輪胎做圓周轉動,每轉過一個固定角度(系統定為120°),服務器就調動客戶端完成此區域內相對獨立的視覺檢測任務,一次間隔只檢測輪胎的三分之一(120/360),經過3個時間間隔,客戶端即完成了整個輪胎360°的全面檢測,然后利用拼接原理把各部分拼接起來,統一到一個坐標系下。拼接測量的關鍵是利用重疊區計算出各次測量時基準的不同,然后消除不同,統一在一個坐標系下。拼接測量的方法可以直接計算出被測輪胎的全面信息。為了保證服務器和客戶端之間圖像檢測數據可靠、實時的交互,本研究采用千兆以太網的方式傳輸數據。作為整個檢測系統的管理控制單元和人機交互接口,服務器不僅要完成檢測任務的調度,還要可以設定檢測參數,接收和實時顯示客戶端上傳的圖像數據和處理結果(缺陷等),并將信息存入數據庫中。此外,服務器還接收PLC傳來的位置檢測信號,用于與客戶端的同步,并且根據檢測結果中的位置信號,對執行機構發出動作信號,標記并剔除有缺陷的產品。在客戶端處理核心中安裝有圖像采集卡,接收服務器設置的參數和任務調度,控制采集卡和攝像機完成圖像實時采集,利用圖像處理算法處理和分析圖像數據,將最終得到的缺陷位置和分類信息上傳給服務器,保存缺陷圖像以備查。

3.2.2設計編寫表面缺陷檢測的圖像處理方案在表面缺陷檢測中,根據圖像數據的特點,本研究提出以下圖像處理過程:缺陷分割、特征提取及缺陷分類。首先是缺陷分割:在表面缺陷檢測的時候,利用圖像處理算法,處理采集到的產品表面圖像,將缺陷從復雜的背景圖像中分離出來。接著是特征提?。禾崛∪毕莺?,對缺陷的各種標識性屬性進行提取,主要是幾何特征和灰度統計特征,以保證后續的缺陷分類和識別。幾何特征指的是輪廓特征,比如長度、形狀、面積、重心等?;叶冉y計特征指的是分布位置、統計值、均方差等等。還有缺陷分類:本研究采用改進的BP算法[7]對網絡進行訓練,構建神經網絡分類器來實現輪胎缺陷分類,為了提高檢測系統對偽缺陷的適應性,本研究將部分偽缺陷也作為網絡輸出并對其進行訓練。由于圖像處理中需要運用大量的計算機內存處理算法,為避免編程中出現內存泄露進而造成計算機內存資源流失的現象,決定采用對內存進行托管的C#語言進行編程。

3.2.3服務器和客戶機系統之間的同步服務器/客戶端模式架構的機器視覺系統具有獨立性和并行性的特點,它不得不面臨的一個重要問題是如何解決服務器和圖像處理子系統之間的同步問題,包括攝像機同步采集、數據同步處理和輪胎運動同步控制等。本研究利用攝像機本身的外同步特性,采用對攝像機提供統一的線掃描觸發信號保證攝像機采集同步。機器視覺系統基本組成模塊見圖2。

4結論實際測量結果證明,應用視覺檢測方法可以較好地解決傳統測量方法中時間長、工作量大、測量效率低的問題。該方法能夠充分利用現代計算機技術的優勢,設備簡單、易用,克服了傳統測量儀器的許多誤差來源,具有快速、準確、非接觸測量的優點。在實驗室中初步完成了實驗系統的核心部分(如圖3所示),與傳統的測量方法相比,原先需要15 min的測量時間,現在只需要15~30 s就可完成,操作也更加簡單便捷。該系統可檢測出最小直徑0.3 mm的輪胎內部缺陷(即橫向縱向最小均為0.3 mm)并能對缺陷進行分類識別,主要包括結構類、氣泡類和夾雜物類,對缺陷的檢出率為96%。

參考文獻:

[1]彭向前.產品表面缺陷在線檢測方法研究及系統實現[D].武漢:華中科技大學,2008.

[2]ZHANG Z.Determining the Epipolar geometry and its uncertainty[J].A Review Int Journal on Computer Vision,1998,27(2):161-195.

[3]章毓晉.圖像處理和分析[M].北京:清華大學出版社,1999.

[4]朱方文.基于LAP方法的機器人靈巧手控制[D].上海:上海大學,2006.

[5]張嘉琪.基于嵌入式系統圖像處理平臺的萬壽菊水分狀態檢測系統的研究[D].重慶:西南大學,2009.

計算機視覺行業研究范文6

關鍵詞:圖像處理 OpenCV C C++

中圖分類號:TP31 文獻標識碼:A 文章編號:1672-3791(2016)10(a)-0007-02

圖像識別技術已經應用到生活中的許多方面。文字識別系統,直接把圖片上的文字掃描成文本文檔格式。人臉識別技術已經用到了智能手機之中,現在的手機解鎖可以直接使用人臉識別。指文圖像識別的應用更為廣泛,如辦理身份證、入學考試、駕照等用來確認身份。百度、Google、蘋果等公司研究的無人駕駛汽車,將該技術用于對障礙物、路標、行人及其他車輛的判斷。道路交通監控系統中,系統自動檢索違規車輛,并對車輛的車牌等信息進行識別。通過車牌提取、圖像預處理、特征提取、車牌字符識別等技術,識別車輛牌號,目前,字母和數字的識別率可達96%,漢字的識別率可達95% [1-2]。所有的這些都用到了圖像識別功能,要編寫圖像識別程序使用OpenCV是一個不錯的選擇。

1 OpenCV簡介

OpenCV是Intel公司于1999年推出的一種面向圖像處理的開源計算機視覺庫,其中,OpenCV是Open Source Computer Vision Library的縮寫,如今由Willow Garage提供支持,其中包括了3個版本OpenCV1、OpenCV2、OpenCV3,除了OpenCV1現在很少使用外,其他兩個版本已經有了很多改進的版本。OpenCV有開源的函數庫,可以滿足不同領域的圖像處理需求,使用時以函數調用的形式提供給用戶,也可以對其代碼進行改進,便于用戶實驗教學或程序開發使用。

2 OpenCV的特點

(1)開源。OpenCV是一個開源的圖像處理函數庫,無論是商業應用,還是做科學研究,完全是免費的,與Linux類似它的源代碼也是公開的,這樣程序的安全性就得到保障,OpenCV的函數庫是用C語言和C++語言進行編寫的,源代碼可讀性比較高,發現其中不足之可以自行進行修改,避免編譯后的可執行文件出現漏洞。

(2)跨平臺。OpenCV是一個基于BSD許可(開源)發行的跨平臺計算機視覺庫,可以運行在Windows、Linux、Mac OS和嵌入式等操作系統上[3]。

(3)應用領域廣。OpenCV圖像處理可以使用到多個領域當中,包括生物醫學、工業、軍事安防、機器視覺、航空航天等。目前已知OpenCV編程系統在航空航天定位、衛星地圖繪制、工廠大規模生產視覺檢測等方面得到了廣泛的應用,同時對于無人飛行器的視覺捕捉技術也有極大的幫助[4]。

(4)支持多種語言進行開發。OpenCV中包括了多種編程語言的接口,其中支持的編程語言包括C、C++、C#、Java、Python等。

3 OpenCV與圖像處理應用軟件

在計算機學習中也會學到一些其他的圖像處理軟件,如Photo Shop、Windows畫圖工具等在計算機中使用的圖像處理工具。在手機中有一個比較流行的軟件,在拍好照片后可以對個人照片進行智能美化,這些軟件都是應用軟件缺少編程需要的接口,這些軟件處理圖像后只是給出結果,無法取到程序處理所需要的中間參數,只能局限于最后的結果展示,如果只是單純的圖像制作, Photo Shop類的圖像處理工具已經足夠了。但是對于圖像識別、機器視覺等,需要對圖像內容做出判斷,用類似于Photo Shop這樣的圖像處理軟件就無法完成了,因為無法集成到所編寫的程序當中。OpenCV是一個圖像處理函數庫,其中包涵了對于計算機操作系統和計算機語言編譯平臺支持的API接口以及源碼庫,可以在編寫的程序中去處理圖像,不但可以得到圖像處理后的結果,還可以對圖像中間的處理過程進行控制,可以對圖像中的內容用自己編寫的程序代碼進行判定,實現識別操作。

4 學習OpenCV的基礎

C和C++語言在工科類專業中一般設置必修課程,C語言常作為一門基礎的編程語言來教,有的學生覺得C比較容易,有的學生感覺比較難,這個取決于每個人對計算機語言的理解能力與對計算機語言的興趣,C和C++的區別在于C++增加了類,支持面向對象編程。新版OpenCV函數庫是基于C++的,打開源代碼的文件夾可以看到許多以.cpp結尾的C++代碼文件,所以對于C和C++的掌握情況直接關系到對OpenCV的學習。

5 OpenCV的運行環境

在學習每種計算機語言之前都要對每種計算機語言的IDE(Integrated Development Environment,集成開發環境)進行安裝和配置,集成開發環境不只是用來編輯程序代碼,還包括了對代碼的編譯、調試與運行等。如Java語言,在Windows操作系統中Java語言最簡單的編輯環境是記事本,對于Java的編譯與運行需要用到命令窗調用所安裝JDK(Java Development Kit,Java開發包)中的編譯程序與運行環境,如果是集成的IDE,如Eclipse、MyEclipse等,點擊IDE上的運行或是調試按鈕,就可以在IDE中的結果輸出窗口上直接查看運行結果。OpenCV是用C和C++語言所編寫的圖像處理函數庫,它沒有自己獨立的IDE,所以它需要借助其他編程語言的IDE進行編寫和調用,如Microsoft Visual Studio、QT Creator等。

配置開發環境是學習OpenCV中重要的一步,但是這個過程相對于初學者來說有些復雜。首先,要從網上下載并安裝計算機語言的開發環境,如微軟的Visual Studio、QT集成開發環境等。其次,下載并安裝OpenCV的安裝包,安裝OpenCV是一個解壓的過程。下一步,就是對開發環境的配置,其中要對系統變量、包含目錄、附加依賴項進行配置。然后進行調試運行。在對開發環境配置時,為保證OpenCV庫與本地開發環境兼容性更好,最好使用CMaker(Cross Platform Make)在本地環境中對OpenCV源代碼重新編譯。

6 OpenCV中的Hello World

在學習C或是java語言時,常常會有一個重要的標志就是‘Hello World!’,標志著系統配置完成并且整個IDE環境運行正常,編譯系統成功的編譯了所寫的代碼,并且在操作系統中執行成功。OpenCV中這個標志有所不同,它的‘Hello World!’是在IDE中寫好代碼后,調用OpenCV中的函數打開一幅代碼中指定的圖片并顯示到新建的窗口中,標志著IDE中的參數是正確的,這是進行圖像操作的重要一步。

7 OpenCV圖像像素操作

對于數值的計算是第一步一般輸出一個結果,在學任何一門計算機語言時會有一個很好的例子“計算器”,那圖像如何去表示?其實圖像是多個結果的一個集合,就像在C語言中打出星號所組成的菱形,每一個星號可以比喻成一個圖像中的像素點。對于圖像處理過程中常常見到的有3種:第一種,RGB圖像,彩色的圖像,每個像素點由3個數值表示。第二種,灰度圖像,像以前的黑白電視機,每個像素點由一個數值就可以表示。第三種,二值圖像,每個像素點由一個數值表示。在OpenCV中有多種方法可以對圖像進行操作,其中比較方便的就是利用cv::Mat類,對圖像進行打開、顯示、修改和保存,這也是進行圖像操作的重要一步。

8 OpenCV的文檔

大家在OpenCV官網提供的文檔中可以得到更多幫助。在OpenCV的文檔中包括了對組件結構的介紹,了解OpenCV的組件結構對學習OpenCV是十分有利的,該介紹包括了一系列的動態或靜態庫,如矩陣數組的定義、圖像處理模塊包含的內容、視頻分析所需要的算法、基本的多視覺算法、外部特征的檢測類、物體的檢測類、UI類的使用、圖像算法的硬件加速等,在編寫代碼時可以查找其類中對象所包含成員和方法。一些OpenCV圖書所帶的光盤中或互聯網上網友提供的圖像處理代碼,由于編程使用的操作系統或編譯環境不同,有些代碼會包含未知的頭文件或者缺少頭文件,代碼本身并沒有錯誤,但總是編譯出錯,了解了這些知識后在編程時,有利于定位在程序中所引用的文件所屬的位置,從而有效地處理文件引用出現的問題。

無論對什么樣的物體進行識別,圖像識別過程基本是不變的,包括:圖像預處理、圖像分割,特征提取、判斷匹配、輸出結果。圖像預處理中會用到圖像的灰度化、圖像的二值化、去除圖像的噪聲等算法。特征提取中會用到圖像變換、圖像邊緣檢測等算法。判斷匹配中用到直方圖、投影等算法。圖像分割有3種:基于閾值的分割、基于區域分割、基于邊緣的分割[5]。在OpenCV的文檔中都詳細提供了基本算法類的定義與方法,通過OpenCV的代碼庫中的基本算法類或幾個基本算法類的組合可以實現以上所列算法的所有功能。

9 結語

據統計,一個人獲取的信息大約有75%來自視覺 [6]。在工業4.0的時代里機器也需要有自己的視覺系統,基于圖像處理的機器視覺在人工智能領域會得到更廣泛的應用,如:無人駕駛汽車、智能機器人、智能安防系統等。OpenCV是一個進入這些行業的重要工具之一,圖像處理的學習過程是一個循序漸進的過程,希望學習者在OpenCV的基礎上提高對于圖像處理的認識及對圖像處理的技術水平。

參考文獻

[1] 姚楠,耿奇.基于MATLAB GUI 的車牌自動識別系統設計[J].軟件,2016,37(3):44-46.

[2] 李珊珊,劉純.基于FPGA 車牌識別系統的設計與實現[J].軟件,2012,33(3):72-74.

[3] (加)Robert Laganière,著.OpenCV計算機視覺編程攻略[M].2版.相銀初,譯.北京:人民郵電出版社,2015.

[4] 陳雪嬌.基于OpenCV的計算機視覺技術研究[J].電腦知識與技術,2015(30):137-138,141.

亚洲精品一二三区-久久