計算機視覺研究方向范例6篇

前言:中文期刊網精心挑選了計算機視覺研究方向范文供你參考和學習,希望我們的參考范文能激發你的文章創作靈感,歡迎閱讀。

計算機視覺研究方向范文1

【關鍵詞】農產品 計算機視覺技術 品質檢測

農產品品質檢測工作中除了采取人工檢測法以外,還可以采取半自動或自動檢測法,如在水果分級檢測工作中的質量分級檢測法、光電分選法以及大小分級法等。然而農產品品質會受到自然生長環境或人為因素等方面的影響,農產品的色澤、大小及形狀等并不相同,無法采取單一指標進行檢測。因此充分應用計算機視覺技術,對農產品的品質進行檢測,極為重要。

1 計算機視覺技術

計算機視覺技術又被稱為機器視覺技術,指的是通過人類設計,在計算機環境下,達到再現或模擬人類視覺相關的職能行為的一種技術,包括了印刷和手寫文字的識別技術,圖像模式識別技術,物體三維表面形狀識別技術、距離識別以及速度感知等技術。該技術是諸多學科的結合與交叉,涉及到數學、生理學、信息處理、物理學、光學以及計算機等多種學科。探究計算機視覺技術的目的在于實驗人類視覺的再現及延伸,即再現高等動物的視覺系統,并對物體形狀以及類別進行識別。

此外,計算機視覺技術處理的原始資料多是圖像,所以該技術和圖像處理以及模擬識別等有著緊密的聯系。現階段,計算機視覺技術在諸多領域有著較為廣泛的運用,包括了醫學輔助診斷、資源調查、衛星圖像解釋、軍事指導、災害監測、氣象以及工業產品的外觀篩選及檢測等。同時研究該技術在農業工程領域中的應用,也成為了熱門話題。

2 在農產品品質檢測中,計算機視覺技術的具體應用

筆者在查閱相關文獻資料的基礎上,探究在農產品品質檢測工作中,計算機視覺技術在產品表面缺陷以及損傷識別工作中的具體應用;果形識別工作中的具體應用;農產品尺寸以及面積檢測工作中的具體應用。

2.1 在產品表面缺陷以及損傷識別工作中的具體應用

在對農產品進行分級的過程中,依然存在著一大問題,即農產品表面缺損以及損傷識別。而早在1984年就已經出現了采取線掃描和模擬攝像機針對蘋果表面損傷進行檢測的實驗報道,實驗結果顯示,采取數據技術能夠檢測出蘋果表面損傷,其檢測結果完全能夠達到人工分級的精度。與此同時,還出現了一種機器視覺系統,該系統將不規則的圖像信息與正常的圖像信息區分開來,在去除蔬菜內的雜物以及檢測農產品的污點等方面能夠取得較好的應用效果。此外,在1989年,國外出現了一種全新的計算方法,即運用紅外線掃描攝像機,處理蘋果表面的灰度圖像,既能夠確定蘋果表面的損傷面積,還能夠區分不同損傷區。然而還技術是以機械裝置的設定為基礎,需要消耗2s的時間,對一個蘋果進行檢測,蘋果表面缺陷分級精度以及損傷分級進度并不高。

我國在1997年,出現了運用計算機圖像處理技術對蘋果損壞自動化檢測的試驗研究,該試驗結果顯示,該技術的損壞檢出率較高,能夠規避果梗區以及花萼區對于壞損區域識別的具體影響,且該檢測技術的魯棒性較強。

2.2 在果形識別工作中的具體應用

果形識別是影響水果質量的重要因素之一,對于水果品質檢測有著重大意義。當水果成熟后,水果的外形將會發生巨大的改變,且無法采取數學方法進行鑒別,采取其他方式進行果形識別極為重要。

在1981年,有研究人員就針對形狀識別中的圖像特征進行了探討,提倡采取結構分析法以及外形輪廓曲線檢測法,針對水果外形進行識別。并在1985年,以數字圖像分析技術以及模式識別技術為依據,針對番茄定向、番茄形狀、表面缺陷以及尺寸進行分類的特殊算法,運用灰度梯度曲線,明確番茄表面缺陷以及花萼位置等。而我國則在2000年,按照果實形狀分析,通過連續性指標、半徑指標、連續指標對稱性、半徑指標對稱性等特征參數,表示果形,并首次采取參數形狀分析法。

2.3 在農產品尺寸以及面積檢測工作中的具體應用

農產品分級中,以農產品外形尺寸為依據。在1987年,國外就已經開始研究機械視覺技術在牡蠣肉分級以及尺寸檢測工作中的具體應用。并在1992年,針對人工檢測以及機器視覺檢測進行進行了對比分析,試驗結果顯示,和人工檢測技術相比,采取視覺檢測技術,能夠提高檢測的精確度,減少檢測消耗時間;同時在評價以及推廣種質資源中,準確的測量以及詳細的記錄種質形態的指標,有著極為重要的意義。為了能夠精確、快速地計算出玉米種質尺度,在1995年,有研究人員就提出了自動化選擇技術,該技術在處理玉米種質圖像中,其辨別精度極高。

而我國在2002年,有研究人員就針對水果品質進行動態、實時監測的智能化分級生產線進行了研究,該生產線,首先通過水果輸送翻轉系統,利用滾筒式輸送翻轉裝置,將水果往前輸送,在輸送過程中,以水平軸為中心,保證水果表面能夠被系統檢測到,以此獲得圖像信息。然后利用計算機視覺識別系統,對水果等級進行判斷,明確圖像信息。該系統具備了視覺識別功能。最終通過分級系統,完成水果分級工作。

3 結語

在二十世紀七十年代以后,計算機視覺技術就已經得到了較為迅速的發展,在我國,該技術在農產品品質檢測中的具體應用也得到了人們的高度關注,同時也取得了一定的成效。計算機視覺技術作為人眼的延伸技術之一,其具備了人腦功能,運用該技術代替以往的人工操作技術,已經成為了農產品品質檢測工作的必然發展趨勢。

參考文獻

[1]朱從容.計算機視覺技術在水產養殖中的應用[J].浙江海洋學院學報(自然科學版),2008,10(04):191-192.

[2]王勃,徐靜.計算機視覺技術在蘋果葉片營養診斷上的應用[J].農機化研究,2008,(03):887-888.

[3]李朝東,崔國賢,盛暢,等.計算機視覺技術在農業領域的應用[J].農機化研究,2009,10(12):667-668.

作者簡介

陳超(1995-),男,福建省福州市人?,F為北京交通大學在校學生。研究方向為電子科學與技術。

計算機視覺研究方向范文2

關鍵詞:計算機視覺技術 鐵路檢測 應用

中圖分類號:TP391 文獻標識碼:A 文章編號:1007-3973(2012)002-075-03

1 前言

自1825年世界第一條鐵路在英國出現以來,鐵路已經成為人們不可或缺的交通工具,越來越多的人在使用鐵路出行,由于近年來鐵路事故頻頻發生,促使了計算機視覺技術在鐵路檢測上的廣泛使用并大力發展。

傳統的鐵路檢測一直是靠人工和靜態檢測,這種檢測缺乏實時性和準確性,并且效率低下,根本無法滿足鐵路的發展。這就要求研究一種新的檢測方法來適應環境的發展,人們就試圖將計算機視覺技術應用于鐵路檢測上,并取得了很好的效果。將計算機視覺技術應用在鐵路檢測上顯著提高了鐵路檢測的實時性、準確性,有效的減輕了人工檢測中工作條件惡劣,工作量大等缺點。它能在列車行駛的過程中就能對鐵路和列車狀況進行檢測,并及時的做出預警,防止安全事故的發生。目前有關鐵路檢測主要集中在鐵路信號檢測、軌道檢測、接觸網檢測、電力機車檢測及站臺環境監測等五個方面。

2 計算機視覺技術

計算機視覺,也稱機器視覺。它是利用一個代替人眼的圖像傳感器獲取物體的圖像,將圖像轉換成數字圖像,并利用計算機模擬人的判別準則去理解和識別圖像,達到分析圖像和作出結論的目的。

計算機視覺是多學科的交叉和結合,涉及到數學、光學、人工智能、神經生物學、心理物理學、計算機科學、圖像處理、圖像理解、模式識別等多個領域。計算機視覺已有多年的發展歷程。隨著計算機、控制理論、模式識別、人工智能和生物技術的發展,計算機視覺在機器人、工業檢測、物體識別的應用越來越廣,研究方向也從二維到三維,從串行到并行,從直接依賴于輸入信號的低層處理到依賴于特征、結構、關系和知識的高層處理。

一般的計算機視覺系統是有CCD(電荷耦合器件)攝像機、裝備有圖像采集板的計算機、光照系統以及專用圖像處理軟件等組成。CCD攝像機將所要研究的對象和背景以圖像的形式記錄下來,這其實是一個光電傳感器,將光學信號轉成電信號,圖像采集板把采集的電信號轉為數字信號,即數字化,一般情況下在攝取圖像時都需要一個照明系統提供光照,然后再用專用的圖像處理軟件對圖像進行處理,輸出分析結果。

3 計算機視覺技術在鐵路信號中的應用

鐵路信號燈和現在的交通公路上的紅綠燈是一個功能,但鐵路和公路不同,鐵路有限定的道路,列車必須在限定的股道上行駛,所以一旦與其他車輛相遇的話根本沒有辦法避讓,如果發生車禍將會對國家和人民的生命和財產造成嚴重的損失,因此列車必須嚴格按照信號燈的指示行駛。

鐵路信號燈識別主要是利用了信號燈在不同情況下會發出特定色彩光的特點。文獻[1]在HSV空間中對S分量圖像邊緣檢測和膨脹等,結合各種信號燈色調H分量的取值范圍得到信號燈區域,然后多次腐蝕直到消除孤立點得到信號燈的邊緣,最后填充信號燈區域,從而實現了信號燈的識別。在文獻[2]也與此類似。文獻[3]將彩色圖像由RGB模式轉化為HSI模式,用彩色特征聚類分析法來對圖像進行分割,文中提出了基于顏色和形狀相結合的復雜環境中目標檢測與識別方法,用Hough變化來提取目標邊界,從而提取出特定目標,而后得到指示燈區域所有像素的H,S統計值確定信號燈的顏色。在文獻[4]提出一種基于改進的Hough變化的吊車信號燈識別算法。Roberto將攝取的圖片轉換到HIS顏色空間,用基于形狀特征和模板匹配的方法探測到相關的鐵路標志而放棄無關的基礎設施。

為了部分消除因為光照條件、背景和拍攝角度對目標識別的影響,文獻[5]提出使用一種利用sift特征的方法,它首先建立已知樣本模型的特征集,然后將視頻流每幀灰度圖像的sift特征與之比較,從而實現對目標的檢測或跟蹤。實驗表明該方法不僅能避免目標的錯誤識別,而且也明顯優于基于邊緣檢測的算法,在識別準確率上達到了90%。

4 計算機視覺技術在軌道檢測中的應用

隨著世界鐵路運營速度的不斷提高,列車在行駛時對軌道的撞擊、摩擦加劇,這就會造成軌道的變形、零件松動、磨損乃至缺失等,這些都會對列車的安全性造成嚴重影響,極有可能會造成鐵路安全事故的發生。因此軌道設備具備良好的狀態是鐵路運輸安全的重要保證。

隨著電子技術和檢測技術的發展,軌道檢測技術也經歷了翻天覆地的變化,其中也有不少研究機構將計算機視覺技術應用于軌道檢測上,且取得了若干有效的檢測方法。

軌道表面缺陷對列車行駛的質量和鐵路系統的安全性會造成嚴重的影響,文獻[7]提出了一種軌道表面缺陷檢測的實時視覺檢測系統。利用跟蹤提取算法分割出軌道的灰度圖像,然后用局部歸一化法增強軌道圖像的對比度,最后用基于投影輪廓的缺陷定位法檢測缺陷。該算法對噪聲有較強的魯棒性和計算速度快,在一定程度上克服了光照不均和軌道表面反射性質不同對圖像的影響,但對局部歸一化過程中參數的選擇有待進一步研究,以使該系統有更強的魯棒性。該系統在216km/h速度下能進行實時檢測,但隨著檢測速度的提高檢測的準確度會明顯下降且缺乏實時性。

文獻[8]利用一排結構光視覺傳感器,將鋼軌輪廓的大圓周和小圓周的中心作為檢查點。首先結構光視覺傳感器拍攝鐵軌側面并且將其標記 在參考坐標幀中,最后通過比較測量的鋼軌輪廓與參考輪廓的比較計算出鐵軌磨損程度。該方法簡單快速精確且不需要特殊的圖像處理設備,在列車較高速度時仍然能達到良好效果。

5 計算機視覺技術在接觸網檢測中的應用

接觸網是沿鐵路線上空架設的向電力機車供電的特殊形式的輸電線路。其由接觸懸掛、支持裝置、定位裝置、支柱與基礎幾部分組成。它是軌道交通的主要組成部分,主要為機車提供動力,接觸網的連接件由于受外界因素的影響容易產生過熱現象,嚴重時會導致供電中斷,引發列車停運事故。

我國的計算機視覺技術的接觸網檢測系統是基于德國相關技術而建立起來的,目前基于計算機視覺技術的接觸網磨耗檢測主要有兩種方案:(1)基于鏡面反射,激光照射接觸線,線性CCD照相機捕獲反射圖像;(2)基于漫反射原理和CMOS(互補金屬氧化物半導體)照相機。由于長期的頻繁摩擦,接觸網與受電弓接觸部分很少被空氣氧化,所以用光進行照射時該部分光反射率明顯高于其他部分,因此這也為計算機視覺技術用于接觸網檢測提供了可能。

基于機器視覺的接觸網檢測系統主要是建立在圖像識別和圖像處理等視覺技術基礎之上的,檢測的內容涵蓋接觸網的所有基本幾何參數。隨著鐵路的發展,原有的檢測系統已經暴露出了一些問題,已無法滿足需求,所以研究人員在系統硬件設備不變的情況下提出了許多改進的算法,如文獻[9]針對現行的接觸網定位器傾斜度檢測方法效率低下、精確度不高的缺點,提出了一種基于計算機視覺的接觸網定位器傾斜度自動測量裝置,應用圖像分割、剔除干擾線、圖像細化等算法,對采集的圖像進行處理,然后利用改進的霍夫(Hough)變換檢測細化后的圖像,對相鄰的特征像素點進行聚類并感知編組,最后用隨機Hough變換使感知編組后的每條線段更接近直線,進而計算裝置中定位器的傾斜度,實驗證明該算法精度高、速度快。

6 計算機視覺技術在電力機車檢測中的應用

在列車的行進過程中,機車車輪與鋼軌接觸面不斷發生摩擦,也就是輪緣與踏面的摩擦。從而會造成踏面的擦傷或剝離,而剝離會嚴重影響列車運行的安全性和平穩性以及軌道設施的使用壽命,因此需要對輪緣進行定期的檢測和維修。

傳統的檢測方法需要人工逐項檢測,存在費時費力、工作量大、工作環境差、效率低等缺點,所以人們就提出了一種基于計算機視覺技術的檢測技術,該技術是一種非接觸式檢測方法,它能檢測出所有關于火車輪緣輪廓的幾何參數,從而計算出火車輪緣的磨損情況。這種檢測方法檢測速度快、準確率高且大大減輕了勞動強度,在實驗中取得了滿意的效果,并且在實際檢測中也得到了廣泛的應用。

文獻[10]中研發設計了一種利用CCD成像測量技術、圖像處理理論和計算機控制等相關技術,提出了一種非接觸式的在線測量系統。采用二元多項式方法對由于硬件裝置引起的誤差的圖像進行幾何校正,用統計均值法對圖像進行分割,從而求出車輪踏面的各項參數,通過在實驗室對標準物進行測試實驗而得到的測量數據結果進行分析而得出。此系統能夠完成對火車輪對幾何參數的測量,并且可得到相對準確的測量結果。

為了解決檢測輪緣高度和寬度存在精度難以保證及穩定性不高的問題,文獻[11]提出了一種基于三角法測量的在線監測系統,該系統由CCD高速攝像機和結構光發射器完成數據的采集,然后利用三角測量原理導出測量模型和計算模型,根據輪緣高度和寬度的定義完成對高度和寬度的測量,最終對輪緣磨損程度進行量化,實驗表明該算法測量精度高,結果穩定可靠。

7 計算機視覺技術在站臺環境監測中的應用

近年來鐵路交通事業發展迅速,鐵路客流量也不斷增大,如中國每年的春運期間都有上億人次通過火車返鄉,各種危害乘客安全的事故也時有發生,因此世界各國特別是中國站臺監控就顯得越來越重要,目前的站臺監控主要是依靠安裝在各個角落的閉路電視或專業技術人員,這不僅需要專業技術知識還需要大量的人力物力。隨著計算機、圖像處理等技術的快速發展,對站臺的自動監控也逐漸成為發展趨勢。

近年來人們做了許多關于站臺人群檢測的研究,這些研究大都使用鐵路站臺中的閉路電視(CCTV)系統,在現代的CCTV系統中基本上使用的是數字化圖像,在人群監測過程中大量使用了數字圖像處理技術,如邊緣檢測、細化、像素計算等,通過圖像的處理可以輕易的得到想要的結果。

文獻[12]仍采用原有的CCTV監控系統拍攝的灰度圖像作為處理對象,利用基于視覺的經過最小二乘法和全局搜索的混合算法訓練的工業的額神經網絡來估算站臺的擁擠程度,該系統在實際的運行中獲得了較高的精確度,雖然不能計算人數但卻能實時的預測人群的密度。

文獻[13]所設計的系統就較為復雜,它利用多臺攝像頭對站臺進行檢測。首先判斷站臺上列車的四種狀態,如:沒有列車、有列車、列車正在出站、列車正在入站等,然后對物體或行人檢測及跟蹤,最后對所檢測的結果綜合分析,做出合理的預警或警告。

8 計算機視覺技術在鐵路檢測上的發展趨勢

隨著計算機視覺技術的鐵路檢測中的應用越來越廣泛和深入,并且隨著計算機視覺技術等關鍵技術的不斷發展,計算機視覺技術在鐵路檢測上應用發揮更大的作用,它就目前而言在鐵路檢測的應用上仍然存在技術難題需要研究:

計算機視覺研究方向范文3

近年來,計算機視覺在安防領域的應用正備受關注,身份識別是核心問題。人臉識別是一種基于臉部特征信息進行身份識別的技術,人臉檢測是其中的基礎和關鍵部分。介紹了四種不同的人臉檢測技術,分析了相關的算法和理論,概述了各自的優缺點。最后,討論了人臉檢測技術今后的研究方向及發展趨勢。

【關鍵詞】計算機視覺 身份識別 人臉檢測

1 人臉檢測問題綜述

在國土安全和社會安全問題日益突顯的背景下,世界各國家都對安防領域進行不遺余力地投入。隨著計算機視覺技術的不斷發展,基于生物特征識別的身份識別技術受到人們的廣泛關注,在未來一段時間內生物識別技術將成為信息產業的一次革命。其中人臉識別技術作為一種極具潛力的生物識別方式,以其識別速度快,主動性強,性價比高等顯著的技術優勢,在各個領域都體現出了巨大的商業價值和社會價值。

人臉檢測是人臉識別的前提和關鍵,一般采用相機實時采集含有人臉的圖像或視頻流,并自動在圖像中對人臉進行檢測和跟蹤。人臉的自動檢測是一項頗有難度的工作,主要體現在:(1)不同族群年齡等問題導致人臉的差異性。(2)人臉上的胡須等附屬物對檢測造成的干擾。(3)人體姿態變化和遮擋物存在對檢測的影響。(4)環境和硬件條件對圖像采集效果的影響。針對這些問題,國內外著名高校和科研機構進行了很多相關的研究,致力于解決在復雜背景下如何準確高效地進行人臉檢測的問題。

2 實現人臉檢測的相關技術

根據近年來計算機視覺領域人臉檢測問題的研究進展,本文在這里進行總結性綜述,目前人臉檢測的方法可以分為基于知識和統計兩類,有以下四種常用的檢測算法。

2.1 模板匹配

模板匹配可以分成固定模板和變形模板。固定模板指的是根據先驗數據歸納出一個統一的模板,然后根據一個能量函數確定被檢測區域中和模板相關程度較高的位置,即人臉位置。由于不同人物之間臉部的差異性很大,加上環境等因素的影響,此方法并不具有很強的實用性。變形模板原理上和固定模板的操作方式相同,不過變形模板自身的參數模型在一定范圍內具有可變性,因此檢測的動態范圍更大,檢測效果相對較好一些。

2.2 樣本學習

由于人臉的復雜性,顯式描述十分困難,因此基于統計模式的檢測方法受到了人們的廣泛關注。此方法將人臉看做一種模式,通過對大量樣本圖像的機器學習完成分類器的構造,利用分類器實現對人臉的檢測判別,在這里問題被轉化為模式識別中的二分類的形式。

首先,需要建立一個樣本空間,其中包括“人臉”和“非人臉”的正負兩種樣本,對樣本圖片歸一化處理后,順序展開后進行主分量分解,在大量樣本形成的高維矩陣中計算其特征值和特征向量,然后采用一定的學習機制在特征空間中建立分類,以此可得到用來檢測樣本圖片是否為人臉的正負判別規則式,二者為互斥關系。此檢測方法具有較高的準確度,但是需要大量的正負樣本圖片,MIT等一些高校和研究機構建立了開放的人臉庫。

2.3 人工神經網絡

人工神經網絡(ANN )是將模式的統計特性包含在ANN的結構和參數中,對于人臉這類復雜的、難以顯式描述的抽象型模式,這一檢測方法具有其自身特別的優勢。

神經網絡方法本質上也是基于樣本學習,首先使用經過預處理的“人臉”樣本以及采用“自舉”方法收集分類器錯分的樣本作為正負樣本訓練各個ANN,然后根據結果進一步對分類器進行修正,構造多層感知器(MLP)網絡作為分類器對人臉進行檢測。人工神經網絡是并行分布式系統,采用了與傳統人工智能和信息處理技術不同的原理,模擬大腦神經網絡處理、記憶信息的方式進行目標檢測。神經網絡模型克服了傳統的基于算數邏輯符號的人工智能在處理直覺、非結構化信息方面的缺陷,具有自適應、自組織和實時學習的特點,應用在人臉檢測問題中性能表現突出。

2.4 基于隱馬爾可夫模型

隱馬爾可夫模型(HMM)是一種雙重隨機過程,一種是有限狀態的馬爾可夫鏈,另一種是序列的觀察值。由于只能通過觀察值得到馬爾可夫鏈的狀態,因此稱之為隱馬爾可夫模型。對于人臉而言,可以把它分為前額、眼睛、鼻子、嘴巴、下巴五個部分來檢測。根據這五個區域位置順序不變性,可以分別用相應的觀察向量序列檢測每一個部分,使用一個包含五個狀態的一維連續HMM來表示人臉。接著對各塊進行KL變換,提取每塊一些最大的特征向量作為觀察值對HMM進行訓練。此后,還提出了一種嵌入式隱馬爾可夫模型,該方法除了將人臉劃分為五塊外,還在每塊中從左至右嵌入了一個HMM。接著進行二維DCT變換,把變換后得到的系數作為訓練值。

3 結束語

人臉檢測是個發展很快的研究方向,人臉檢測技術的發展趨勢是利用多特征,多種分類方式進行啟發式知識與統計學習方法的結合,未來對人臉檢測的研究將會更注重其實時的應用,這就對檢測算法的效率提出了更高的要求。另外,可以消除光照對人臉成像影響的紅外人臉識別技術,加入相互對比機制的包含正臉、側臉三維信息的人臉三維模型重建檢測技術也正在研究當中。隨著技術的不斷進步和市場逐漸的規范化,人臉檢測識別技術會越來越多地應用于社會的各個領域,在促進社會發展的同時方便人們的生活。

參考文獻

[1]許燕,王維蘭.基于視覺運動人臉檢測技術的研究[J].計算機仿真, 2014(1):434-437.

[2]孫寧,鄒采榮,趙力.人臉檢測綜述[J].電路與系統學報,2006,11(6):101-108.

作者簡介

姚坤(1990-),男,現為聊城大學物理科學與信息工程學院碩士研究生,主要研究方向為機器視覺。

計算機視覺研究方向范文4

關鍵詞:圖像處理 教學改革 研究生教學

中圖分類號:G642.4 文獻標識碼:C DOI:10.3969/j.issn.1672-8181.2014.05.098

《數字圖像處理》課程是計算機應用技術專業研究生的重要基礎課程,對于研究生綜合能力的培養及學術思維的訓練具有關鍵性意義。作為一個經典研究方向,數字圖像處理已經有較為悠久的研究歷史[1,2],因此作為一門研究生課程,《數字圖像處理》有眾多關鍵性重要內容可以教授,是培養研究生科研能力的重要基石。

作為一個重要的科研方向乃至領域,數字圖像處理已經與模式識別、計算機視覺以及機器學習等學科建立起密不可分的聯系,因此該門課程可以極大地拓寬學生的學術視野,為學生將來的學習和科研鋪設道路。同時,數字圖像處理方向相關的人臉識別[3]、圖像拼接[4, 5]、輪廓提取[6]等課題,已成為計算機學科中最為熱門的科研課題之一,充分反映了該研究方向的關鍵性地位。

在本科階段相應課程的基礎上,除講授相關基礎知識之外,研究生階段的《數字圖像處理》課程應更加注重學生專業能力的培養和科研能力的積淀,以指導科研作為該門學科的靈魂。本文對如何在研究生階段的《數字圖像處理》課程中增加對科研內容的強調進行了初步研究和探索,并將相關具體實施措施總結如下。

1 對頂級期刊和會議進行介紹

在研究生的各項科研綜合能力中,具備一定科學文獻閱讀能力是不可或缺的一環,而進行文獻閱讀的前提是必須首先學會辨別文獻的質量。在各種文獻肆意泛濫的今天,缺乏這項能力,學生將很容易陷入垃圾文獻的陷阱,從而影響其對科學研究的理解,甚至徹底歪曲學生的科研精神。因此我們認為,在研究生階段的《數字圖像處理》課程中,必須對IEEE Transactions on Pattern Analysis and Machine Intelligence、IEEE Transactions on Image Processing、International Conference on Computer Vision等相關的頂級科研期刊和會議進行適當介紹和說明,使學生明白真正的科研巔峰在何處。

2 介紹經典算法

數字圖像處理學科中,擁有眾多以Adaboost[7]為代表的經典算法,它們是構成整個學科的關鍵性支柱,也是學科發展中每個階段的里程碑。僅僅注重表面基礎知識,而忽略經典算法的講解,是舍本逐末的短視行為。

3 強調與相關學科的關聯

數字圖像處理學科發展到今天,已經與模式識別、計算機視覺、機器學習、概率統計等學科建立起了密不可分的內在聯系。在解決某一個具體任務時,已經不再是單一學科知識可以應對的,而往往需要多學科知識的綜合發揮。因此,為切合實際應用,在講解《數字圖像處理》課程時,必須同時對相關學科進行介紹。使得學生明白在何時、可以從何種學科,獲得相應幫助。

4 相關專業工具的介紹

工欲善其事必先利器,數字圖像處理是計算機學科中的上層次內容,必須依托在相關專業工具基礎上才能開展研究。如若缺乏對相關工具的了解,往往會事倍功半。以讀取圖像為例,依托相關工具可能只需要編寫一行代碼,而如果自行編寫代碼,可能需要數百行之多。因此,我們認為,必須在《數字圖像處理》課程中,對Matlab、Opencv等專業工具進行專門介紹。從而節省學生在進行相關研究時,在摸索基礎工具方面所花費的時間。

5 突出最新技術進展

發展迅速是信息學科的突出特點,作為研究熱點的數字圖像處理學科的更新更是日新月異。為相關科學研究服務,必須時時關注最新的科研熱點,使學生隨時了解最新的科研動向,為他們在將來進行科研方向選擇時,提供更多的指引和選擇。

參考文獻:

[1]Gonzalez R.C., Richard E. W. Digital Image Processing [M]. Prentice Hall, 2007.

[2]Szeliski R. Computer Vision: Algorithms and Applications [M]. Springer, 2010.

[3]Li S.Z., Jain A.K. Handbook of Face Recognition [M]. Springer, 2011.

[4]李月龍,封舉富.基于最小扭曲變換的正面人臉圖像合成[J].計算機輔助設計與圖形學學報,2011,23(6):1085-1090.

[5]Li Y., Feng J. Frontal face synthesizing according to multiple non-frontal inputs and its application in face recognition [J]. Neurocomputing, 2012,(91):77-85.

[6]Li Y., Feng J. Sparse representation shape model. 17th IEEE International Conference on Image Processing (ICIP) [C]. 2010:2733-2736.

計算機視覺研究方向范文5

AlphaGo的出現加速了人們對人工智能(Artificial Intelligence以下簡稱AI)的理解,但AI極客們的野心遠非19行的棋盤可以局囿,他們擁有酷炫的技術和非凡自信,并想以此來改變世界。

美國暢銷書作者、發明家雷.庫茲韋爾(Ray.Kurzweil)在《奇點臨近》一書中為人工智能的出現設定了三個條件:強大的計算能力、海量的知識儲備,最后還需要教會計算機擁有認知能力,通過機器學習技術讓計算機不斷的自行進化。

前兩者已經實現。第三點,如何讓機器擁有認知能力是AI極客們關注的重點。

機器學習是人工智能的核心。機器學習將教會計算機認識現實世界,知道自然界的日升日落、陰晴圓缺,并能理解人類的行為和語言。機器學習的常用領域包括數據挖掘、視覺理解、語音識別和自然語言處理等方面。我們采訪了數位科技公司高層、新銳創業者,他們有一個共同的身份―國內從事機器學習的應用和研發的專家。他們講述了中國人工智能發展的現狀,而一旦科技出現新突破,也預示著新一輪的商業變革。 先知

坐在記者對面,臉龐消瘦的陳運文笑得有些靦腆,言語卻充滿自信,“很多事情都是可以預測的”。

陳運文是國內大數據方面的專家,曾任百度核心技術研發工程師和盛大文學首席數據官。現在他是個創業者,達觀數據創始人兼CEO。他為公司新入職的同事下發了一套題――如何預測泰坦尼克號上的幸存者。整套題通過獲取泰坦尼克號上所有乘客的真實信息,包括性別、年齡、職業、票價、艙位等,然后編寫程序來預測這2000余名乘員中哪些人最終得以生還。

在陳運文眼里,將所有信息加以綜合挖掘,就能夠推演出最終的答案―“705名生還者都可以準確預測?!?/p>

預測這樣的事件只是數據挖掘的一個案例,對于極客而言,只要給他們足夠的信息,這個世界就沒有意外和偶然。

現在,陳運文用自己的技術幫助企業進行商業決策。雖然只成立不到半年,但這個隱藏在張江天之驕子公寓里的創業公司已經獲得真格基金和盛大網絡創始人陳大年的投資。

陳運文將第一批客戶瞄準為自媒體人,通過數據分析,為自媒體提供可以引發熱議的話題,并告訴這些作者,什么人喜愛看他們的文章、會關注什么話題。

讓機器自己學會分析信息早就在商業行為中廣泛存在。在百度工作期間,陳運文負責搜索引擎的核心算法研究,主要“為用戶提供最有價值的信息”。 工作的難點不在于搜索信息,而在于讓機器認知用戶的搜索意圖。

用戶經常會在搜索框中輸入“口語詞匯或者模糊的語句”,服務器要從人們的搜索語句中判斷真正的需求。陳運文就需要設計算法讓搜索引擎理解用戶的語義,從數百億的網頁中迅速找到對用戶最有價值的結果。這種“算法”就屬于人工智能。百度每天的搜索有數十億次,每當陳運文改進了算法都能看到用戶點擊的滿意度在上升。

今天這種依靠數據挖掘技術來提高企業運作效率的方法變得更常見,業內將其稱為“商業智能”(Business Intelligence)技術。陳運文計劃將這種技術在云端運用,另一些同類公司則將這種技術直接運用在軟件上。2010年在美國納斯達克上市的Qlik公司就是商業智能軟件的代表企業。他們的QlikView軟件為用戶提供“可視化”的大數據服務。

“我們的軟件可以理解數據,挖掘數據并將其用更直觀的方式展現給客戶,以幫助管理層做出決策?!?Qlik亞太區制造業和高科技市場開發總監Jeremy Sim對《財經天下》周刊表述。

這些帶有“預測”功能的軟件已經在服務并改變人們的生活,比如根據顧客的購買信息QlikView會提示便利店店長,售貨架上的麥片不應該和面包擺在一起,雖然它們都是早餐食品,但如果將麥片和酸奶擺在一起,銷售數字會更好看。此類預測還進一步提醒物流部門,盡量地在頭天晚上補足麥片和酸奶貨源。這類商業智能的應用滲入所有人的生活,以這家公司為例,他們已經在全球100多個國家招徠了3.8萬企業客戶,間接服務人群上千萬。

未來這些帶有“智力”的系統將會更多的出現在電商、醫療、教育、金融等領域?!氨热珉S著智能手環的增加,會有更多的健康數據被采集,那么我們會提供健康預警、治療方案推薦等服務?!标愡\文說?,F在只是大數據挖掘的初級階段,人工智能時代也才剛剛開啟。 視覺理解,打造機器之目

2014年6月,比爾?蓋茨訪華,除了見政商要員外,他還專門造訪了一家剛成立一年的創業公司―格靈深瞳。對于這家初創公司,比爾蓋茨留下了兩句后來被廣泛引用的評語“This is very cool”和“IT界的下一個大事件是計算機視覺(computer vision)與深度學習(deep learning) 的結合”。

格靈深瞳就是這樣一個結合了計算機視覺和深度學習為一身的酷公司。創始人趙勇是致力于視覺理解的知名極客,雖然他本人并不喜歡這個稱謂。

“極客(Geek)在英文里形容書呆子,只會做技術不通世事,但我覺得我是一個懂技術的正常人?!彼麑Α敦斀浱煜隆分芸f。

趙勇專攻計算機視覺和運算影像學,2009年入職谷歌總部研究院任資深研究員,是谷歌眼鏡項目的骨干?!拔覀儓F隊負責谷歌眼鏡的場景識別技術,利用谷歌街景來判斷使用者所處的位置?!焙唵蔚卣f就是將谷歌眼鏡捕獲的圖像和谷歌街景做比對,然后快速地定位用戶所處位置和周邊信息。谷歌眼鏡可以在500毫米之內將用戶的位置精確到米級別。趙勇說谷歌眼鏡并不是“進化的產品,而是從無到有的突破”。

2013年初,趙勇回國創業成立格靈深瞳,并在三個月后拿到真格基金和聯創策源的聯合天使投資,同年6月格靈深瞳又拿到紅杉資本 A 輪高達數千萬美元的投資。

業內傳播著投資人爭論其未來估值的段子,據說某次飯局上真格基金的徐小平、紅杉資本的沈南鵬和聯創策源的馮波討論格靈深瞳的未來估值,徐小平認為起碼5000億美元,而沈南鵬認為1000億美元,最后馮波折中地認為3000億美元。而現在中國電商巨頭阿里巴巴的市值還不到1900億美元。

受到比爾?蓋茨和投資人如此追捧的原因在于趙勇的研究方向―計算機視覺,這是機器學習中極為復雜的領域。

將趙勇和陳運一個對比就可以看出他們研究方向的不同。趙勇認為數據挖掘是讓計算機理解“結構化信息”,結構化指那些人工制作的成型的信息數據,例如一句話一段文字或者一份表格。但計算機視覺需要讓機器理解飄過鏡頭的一片樹葉,或者悄悄走過的一只貓。

陳運文對此也做了比較,他認為數據挖掘更多的是處理文本信息,而文字是具象的表達,機器看到漢字“貓”或者英文“cat”就可以理解這是一種動物,但圖片是抽象信息,給計算機看一張貓的圖片,讓它去理解貓的概念非常困難。

所以當2012年6月谷歌X實驗室宣布他們研發的“谷歌大腦”通過百萬張圖片的學習后可以識別“貓”的時候,全世界都為之震驚。這意味著谷歌培養的這個“孩子”具備視覺理解的能力可以“看圖說話”了。而參與“谷歌大腦”研發的吳恩達博士(Andrew Ng)也因為這個項目被譽為“谷歌大腦之父”,成為機器學習領域最權威的學者。

為了建造“谷歌大腦”,吳恩達使用了神經網絡系統,他們連接了1.6萬片處理器創造了一個擁有10億多條連接的神經網絡,并逐步地培訓這個系統,直到它擁有識圖的能力。

現在,趙勇做的事情與此類似。

他通過影像設備捕捉實時畫面,讓計算機識別這個真實世界,更為直接的說法或許是―趙勇正在研制“機器人之眼”。

像谷歌一樣,想讓計算機能識別圖像,趙勇也需要制作一個“深度神經網絡”系統。

在人腦中有大約1000億個神經元,神經元通過神經突出連接在一起就變成了一個神經網絡,人們思考問題的時候這些神經網絡相互激發,最終產生決策?,F在極客們用計算機來模擬這個過程,用計算程序建立起龐大的計算元素,這些程序運算的結果通過網絡互為交換互相影響,最終產生結果,這就是初級的人工神經網絡。人工神經網絡層級越多規模越大,其“聰明程度”就越高,學習的能力就越強。

要培養這樣一個會“識圖的孩子”,趙勇除了要建立這樣一套龐大的神經網絡之外,還需要不停訓練這個網絡。

“可以將神經網絡當成一個黑盒子,我在里面設定了一些基本參數,隨后不停的往里面輸入數據、圖片來訓練它,通過這種大量的訓練,黑盒子里面參數的連接會越來越緊密,整個網絡也會越來越聰明,最終變成一個可以識別圖片的智能系統。”

嚴格地說,人工智能不是人類設計出來的,而是人類訓練出來的。即便是趙勇這樣的創建者也無法知道這些神經網絡到底如何相互作用相互影響,并最終形成自己的智能系統。他能做的只是“選擇輸入數據,控制訓練方向”。

依舊以老師教育孩子做比喻,雖然趙勇這個老師不知道孩子是怎么理解圖片,識別這個世界的,但他可以控制教學的內容,讓這個孩子朝某個方面學習。

趙勇花費了兩年時間才為格靈深瞳培養出自己的“孩子”,并將這些有“識圖能力”的人工智能設備應用到安防監控和汽車識別方面。

去年格靈深瞳推出了名為“目”的行為分析儀,這是一個包含軟硬件于一體的智能監控產品。“目”會實時監控場景內的情況,發覺異常就立刻報警或者提醒工作人員注意。而在另一個名為“威目”的產品中,格靈深瞳做到了車輛識別,他們訓練系統辨識超過5000種車輛,這幾乎涵蓋了地球上所有的汽車類型。這種能力為警方辦案提供了幫助,警方可以用“以圖搜圖”的方式讓“威目”提供他們需要的視頻資料?!熬教峁┮粡埰囌掌?,威目在識別照片之后可以從交通錄像中找出該車的行動軌跡?!背酥?,該系統還可以搜索“結構化信息”,例如在系統中輸入2004年生產車牌中含有5這個數字的紅色奧迪A4汽車,“威目”就會在資料中截取相關的圖像或者視頻,而此前這些工作都需要人工完成。

如果計算機視覺技術以這樣的速度繼續,或許用不了幾年,當我們站在攝像頭前時,計算機會在屏幕上敲出那句讓人激動的言語―“I see you .” 造物者

“谷歌大腦之父”吳恩達在完成了“認貓”創舉兩年后離開了谷歌,加盟了百度,任職百度首席科學家并負責“百度大腦”的研發。

說服吳恩達做此決定的是他的好友,現任地平線機器人技術CEO的余凱。

余凱是國際知名的機器學習專家,他牽頭成立的百度深度學習研究院是國內第一個研究深度神經網絡的研究機構,加盟百度時被李彥宏稱為“鎮院之寶”。

“深度網絡學概起始于2006年,當時主要有5個機構從事這方面的研究,分別是多倫多大學、紐約大學、美國的NEC實驗室、斯坦福大學和蒙特利爾大學,而我當時在NEC實驗室工作?!庇鄤P說。有段時間他還在斯坦福大學執教《人工智能概論》。他領導的團隊在深度學習、圖像識別、文本挖掘、多媒體檢索、視頻監控,人機交互等機器學習領域都有建樹。

去年余凱離開百度,在中關村的創富大廈租賃辦公室成立地平線機器人技術。成立僅4個月,這家公司就迎來了首輪投資,投資方包括晨興資本、高瓴資本、紅杉資本、金沙江創投等多家機構。

比起商業上的追求,余凱更想用技術改變世界―為萬物裝上人工智能的大腦,讓它們變成擁有智能思維的機器人。

在余凱看來,他在百度的工作主要是在“云端”搭建人工智能深度神經網絡,其服務主要體現在“為用戶提供更智能的互聯網服務”,他希望通過人工智能技術應用到物理世界中,讓人們的生活變得更方便和簡單?!艾F在很多電器都采用軟件結合互聯網操控,我希望未來都可以實現本地人工智能操控?!?/p>

他準備讓汽車、空調、冰箱、微波爐等上千種產品或設備都具有從感知到決策的能力。比如用戶進入房間時空調就可以感知人的位置和體溫自動開機送風,并追隨人的移動而改變送風方向;冰箱則會讀取存儲食物的信息,及時提醒用戶食用或補充。

余凱利用深度神經網絡算法來搭建他的人工智能框架。他將這種人工智能系統描述成“類似于安卓的智能硬件的大腦平臺”,這個系統可以安裝在不同的產品中。

他“改造萬物”的計劃先從家居產品和汽車兩個方面著手。地平線機器人技術研發了針對這兩個行業的人工智能操作系統。家居方面的基于深度神經網絡的操作系統名為“安徒生”,汽車的則稱為“雨果”。

現在 “安徒生”已經入駐家電產品,在剛剛過去的上海家博會展上,地平線機器人和某國內知名家電廠商合作的兩款智能產品面世參展?!艾F在業界最大的智能家居廠商都是我們的客戶,我們向他們提供算法操作系統,并告訴他們如何配置硬件設備,就像安卓向手機廠商提供參考設計一樣?!?/p>

下一步余凱準備讓“雨果”進入汽車自動駕駛領域,在安裝了傳感器、處理器和雨果大腦平臺后,汽車可以成為提供無人駕駛或智能駕駛的新型交通工具。

“定義萬物智能的大腦,這還要花很長時間,但是我覺得一步一步往那邊靠近?!?余凱知道地平線機器人的征程漫漫,但對于AlphaGo對戰李世石這樣的人機大戰新聞他卻無比篤定?!百惽皫缀跛袑<叶颊f這次機器贏不了,但我在接受網易采訪的時候就公開預測機器會贏,因為我了解AlphaGo的算法?!?/p>

陳運文也表達了相同的猜測。3月9日下午,陳運文就興奮地預測AlphaGo能夠獲勝,那時首爾的李世石剛在棋盤上落下自己的第一枚黑子。

3個小時后,對弈到186手時李世石投子推枰宣告認輸。

計算機視覺研究方向范文6

>> 基于機器視覺的瓷磚素坯表面缺陷無損檢測算法研究 基于機器視覺檢測的輪廓提取算法的研究 基于機器視覺的西瓜體積估測算法 SMD晶體器件檢測中機器視覺的應用分析 基于計算機視覺的實時車輛運動速度檢測算法研究 雙目視覺中的角點檢測算法研究 異常證據及其檢測算法研究 高效運動目標檢測算法研究 DDoS攻擊的檢測算法研究 圖像邊緣檢測算法研究 自動目標檢測算法研究 機器視覺在半導體器件塑封缺陷檢測中的應用 針對SMD晶體器件檢測的機器視覺系統的設計 機器人仿真系統中碰撞檢測算法的優化 一種基于立體視覺的運動目標檢測算法 感知無線電頻譜檢測算法的研究 自適應閾值Canny邊緣檢測算法研究 遙感圖像變化檢測算法研究 基于Vega的碰撞檢測算法研究 語音信號基音檢測算法研究 常見問題解答 當前所在位置:l~type=v5_one&label=rela_nextarticle

[3]Mark S.Nixon,Alberto S.Aguado.李實英,楊高波,譯.特征提取與圖像處理(第二版)[M].北京:電子工業出版社,2011.

[4]National Instruments.選擇視覺軟件需要考慮的10個方面[OL].,2008.

[5]黃文明,徐錦法.基于機器視覺的通孔元器件檢驗[J],中國科技博覽,中國包裝總公司,2013(13).

[6]NI,NI Vision Concept Manual,2005.

[7]NI,NI Vision Online Help,2000-2008.

亚洲精品一二三区-久久