計算機視覺與應用范例6篇

前言:中文期刊網精心挑選了計算機視覺與應用范文供你參考和學習,希望我們的參考范文能激發你的文章創作靈感,歡迎閱讀。

計算機視覺與應用

計算機視覺與應用范文1

關鍵詞:雙目計算機視覺 深度信息 自適應 光照變化 視頻監控

1 引 言

面對日益復雜的社會和政治環境,國家安全、社會安全、個人人生安全和財產安全等都面臨著不同程度的威脅,都需要各種安全保護措施,在眾多場所建立切實有效的安保措施,成為一個迫切的課題。本文提出了一種基于雙目計算機視覺的自適應識別算法,將該算法應用于現有的監控系統,并賦予監控終端智能性,不僅使其脫離人而具有獨立智能、自主判斷的能力,而且使得視頻監控系統在安防方面的作用大大提高。

在現有的背景建模方法中,大多對于背景象素點的亮度值,例如最小亮度值、最大亮度值和最大亮度差值[ 1 ] ,或是對顏色信息進行建模[ 2 ] 。對于背景的更新,一般使用自適應濾波器對像素的統計特性進行遞歸更新,為了考慮到噪聲的影響,文獻[ 3 ]提出了Kalman濾波器的方法,該文認為系統的最優信息可通過估計獲得??紤]到環境的動態緩慢改變,文獻[ 4 ]利用統計模型給背景建模,即由一個時域濾波器保留著一個序列均值和一個標準偏差,并通過濾波過程統計值隨時間改變來反映環境的動態特性。另外有一些方法解決了光照漸變等影響[ 5~7 ] ,但計算較復雜。

2雙目計算機視覺深度算法

基于實際應用考慮,攝像頭的數量關系著成本和計算量,所以選擇支持雙攝像頭(雙目視覺)的算法是最合適的。在支持雙目視覺的算法中,Princeton NEC research institute 基于最大流算法(maximum2flow)的計算機視覺算法( Stereo2MF)在深度效果平滑性上做得較好[ 8, 9 ] ,適用于監控區域深度計算的應用背景。但原有算法所需的計算量和計算過程中的暫存數據量是較大的,雖然支持計算量的削減,但只是機械地在一塊區域中選擇中心點來進行計算,這樣計算的結果會因選擇的機械性,而出現大量的“偽點”,這些偽點錯誤地表現了該區域的平均深度信息。本文采用統計平均值選取計算點,通過距離因子的Gauss分布將塊內其他點的值融合計算,從而使得計算出的值較準確的代表了這一塊內的大致深度分布。

m, n分別是圖像的長和寬所包含的像素點個數,M、N 表示像素點的橫縱坐標, .d 是塊內深度統計平均值, dM, N為計算點的深度值, q為距離因子, dB是計算所得的塊深度代表值。圖1為改進后雙目視覺深度算法與原算法識別效果比較。由圖1可以明顯看出,修改后的算法效果在細節表現、平滑性、偽點減少上均有明顯改善,而且深度計算精確度能夠完全滿足視頻

圖1 改進后雙目視覺深度算法與原算法識別效果比較Fig. 1Effect comparison after algorithm modification

度計算精確度能夠完全滿足視頻監控應用的需要。

3 自適應識別算法

對于一個固定的場景,場景各像素點的深度值是符合一個隨機概率分布。以某一均值為基線,在其附近做不超過某一偏差的隨機振蕩,這種情況下的場景稱之為背景。而場景環境往往是動態變化的,如環境自然光的緩變,燈光的突然熄滅或點亮,以及運動對象的出現、運動和消失等。如果能識別出場景中的動態變化,就能自適應的更新背景值,將光照的改變融合到背景值中。本文采取了用統計模型的方式給每個像素點建模,而以像素點變化的分布情況來確定光照突變引起的深度突變,并結合深度計算本身特性,解決光照緩變突變引起的誤判問題,以及判別場景中對象的主次性。

3. 1 背景象素點的深度值建模

由于雙目計算機視覺算法得到的深度值,已經是塊融合的,可以根據精度要求,來加大塊面積, 減少數據量。本文獲得的數據量只有原像素點的( k, l分別是塊的長和寬所包含的像素點個數) 。以統計的方法給每個像素點的深度值建模, 設為第u幀圖像的某個像素點的深度值, 其中u代表第u幀圖像, i, j分別代表像素點的橫坐標和縱坐標。由一個時間濾波器來保持該像素點深度值的序列均值和時間偏差

其中,α是一個可調增益參數, 其與采樣頻率有關。通過濾波過程,來得到每個像素點的深度值基于時間的統計特性,由于這些統計特性反映了環境的動態特性,據此可以了解到是環境的光照發生了突變,還是有運動對象的運動。

3. 2 背景更新與場景識別

通過上述濾波過程,就可以將光照緩變融入到背景中去,實現背景的自適應更新。而對于光照突變,此時幾乎所有的象素點的亮度值會同時增大或減小,但根據最大流算法的特性,同方向的變化對流量差不會引起太大變化, 而對深度計算結果只會引起較小的同方向變化。這種全局的等量變化, 可以認為是光照突變引起的。

其中, a、b和c是3個可調節系數,他們的取值可依據場景的情況及檢測光照突變的速度與誤差來進行選取。s, t分別是深度圖像的長和寬所包含的像素點個數。Q是符合式( 9)的像素點個數。一旦檢測到環境光照發生了突變, 就把背景點像素的深度序列均值,全部以當前幀像素點的深度值的測量

值代替,而j以0取代,從而實現背景的及時更新。

如果式(10)式(12)中任意一個不成立的話,則認為像素塊深度值的變化并非由光照突變引起, 而是場景中有運動對象出現。

4 算法分析與實驗

4. 1 算法復雜度

對于光照突變檢測,若有突變的話,則會立即檢測出來,當有運動對象出現時, 并且式( 10)式( 12)都接近滿足時,處理會較慢,因為需要處理突變檢測和運動對象兩個過程。當b取25% s ×t時的處理速度與變化點比例關系如圖2所示。

相對于一般的光強、灰度的識別檢測算法,本算法的優勢在于不僅可以利用深度特性更容易地檢測到光照的漸變與突變, 而且可以判斷出現的多個運動對象的主次性。

4. 2 算法誤檢率

由于光照直接對于像素點的光強、灰度等產生影響,所以深度算法的噪聲容限更大,這樣可降低了誤檢率,多組實驗后得到的誤檢率對比圖如圖3所示。但是由于深度算法本身對于反光或者陰暗面會產生偽點,所以,某些時候由于光照突變中光源的位置變化而會誤檢為運動對象,為此算法還需進一步改進能判別偽點的出現, 除去它在光照突變檢測中的影響。另外,公式中可調系數a, b, c的選取也會對不同場景產生影響。

筆者在實驗室環境下做了不同光照角度、不同環境光強度、不同運動物體的多組實驗,發現在反光面或是陰暗面較多的情況下,光照突變檢測不是很靈敏,而且會出錯,但是在增加系數a, c的值后, 誤檢率有所降低(如圖3所示) 。

5 基于算法的監控系統

我們利用該算法實現了視頻監控原型系統。計算機視覺算法對于攝像頭的同步曝光要求很高,所以本系統終端用一塊單獨的MCU (micro control unit)控制同步曝光。核心算法用DSP處理。系統結構如圖4所示。實際系統原型圖如圖5所示。

6 結 論

利用深度信息做智能場景識別,是一種新的嘗試,有其優勢。將這種方法應用到智能視頻監控中,能起到很好的效果,克服了其他方法較難處理的光照漸變和突變等問題。對比單攝像頭監控系統,該系統可應用于更多場合。后續研發準備在系統上加上更多功能,以適用于更多的環境,并與其他保安類監控系統互聯,以組成一整套功能強大、達到國內外一流水平的安防系統。

參考文獻( References)

1Ude A, Riley M. Prediction of body configurations and appearance for model-based estimation of articulated human motions [A ]. In: IEEE SMC’99 Conference Proceeding [ C ] , Tokyo, Japan, 1999: 687~691.

2Ricquebourg Y, Bouthemy P. Real-time tracking of moving persons by exp loiting spatio2tempp ral image slices[ J ]. IEEE Transactions on Pattern Analysis andMachine Intelligence, 2000, 22 (8) : 797~808.

3Tsap L V, Goldof D B, Sarkar S. Nonrigid motion analysis based on dynamic refinement of finite elementmodelsp [ J ]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2000, 22 ( 5 ) : 526~543.

4Haritaoglu I, Harwood D, Davis L. A real time system for detecting and tracking peop le [ A ]. In: Third International Conference on Automatic Face and Gesture[ C ] , Nara, Japan, Ap ril 1998.

5Wren C, AzarbayejaniA, Darrell T. Real-time tracking of the human body [ J ]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1997, 19 (7) : 780~785.

6Ridder C, Munkelt O, Kirchner H. Adap tive background estimation and foreground detection using Kalman filtering[A ]. In: Proceedings International Conference. Recent Advances in Mechatronics, ICRAM’95, Istanbul, Turkey, 1995: 193~199.

7Fujiyoshi H, Lip ton A J. Real-time human motion analysis by image skeletonization[A ]. In: Proceedings of theWorkshop on App lication of ComputerVision, Freiburg, Germany, October 1998.

計算機視覺與應用范文2

【關鍵詞】:“云計算”;會計信息化

【中圖分類號】G202 【文獻標識碼】A 【文章編號】1672-5158(2013)01―0187-01

隨著社會主義市場經濟的不斷發展,在企事業管理中,人們越來越意識到信息技術對于會計的影響。近年來,“云計算”這個概念火熱,已經滲透到普通人的生活,都因為“云計算”的到來和發展而產生著改變。如今,會計信息化正在取代會計電算化成為會計發展的方向?!霸朴嬎恪钡某霈F勢必會對會計信息化的過渡帶來深遠影響。

一、“云計算”對會計信息化帶來影響

1.成本優勢“云計算”出現,會計系統可以以軟件服務的方式提供,企事業使用者按照自己的需要購買,按照實際使用的賬號和實際使用的時間付費。

2.而“云計算”技術的應用之后,企事業采用租賃的方式,不再需要專業的維護人員,從而不需要為了這些專業人員支付額外的費用,最大程度地減少了企事業為了會計信息化所花費的開支。供應商提供的服務的專業化和規劃化,使得企事業能夠及時得到最新的技術應用,能夠更好時滿足企事業對會計信息化不斷發展的要求。從而,大大降低了企事業實現會計信息化的門檻和風險,企事業也能更加專注于會計工作本身,提高工作效率。

3.在“云計算”時代,企事業采用租賃的方式接受服務,只要會計工作者能夠連接到網絡,即使下班在家也可以進入系統,并及時處理會計工作,會計信鼠隨時可用,從而更好地保證了會計信息的實效性。并且由于網絡互聯和供應商的專業團隊的保證,企事業可以及時得到最新的技術應用,會計工作可以更加的便捷、有效。

4.安全優勢基于“云計算”的會計服務提供商所提與MSCS相關的信號通路的研究進展供的基礎實施包括互聯網連接使用的大量服務器、存放會計信息化軟件和數據的大型數據庫等等,他們集中于一處或分布多個地萬,并由專業的團隊來管理和保證數據中心的安全。

5.協同優勢。會計工作的協同包括內部協同和外部協同。云端不僅協同了企事業內部的資源,還需要建立一個統一的平臺,將客戶、供應商和其他合作伙伴也納入這個信息系統平臺中,使得網上報稅、銀行對賬、審計、交易、企事業與上下游企事業和用戶之間的會計信息系統集成成為可能,從而提升了會計信息的附加價值,實現信息的高效共享。

二、“云計算”在企事業財務會計應用中遇到的問題

1.云計算平臺自主建設和應用方面

由于云計算平臺建設的技術及資金起點較高,研發的風險較大,開發周期較長,國內自主研發財務會計信息化云計算平臺尚處于起步階段,不成熟且建設與應用推廣力度均不夠,知名的云計算平臺幾乎都來自美國,如谷歌、亞馬遜和Facebook等美國互聯網先行者,微軟、IBM、富士通和SAP等IT成熟公司都建有自己的云計算平臺。而國內企事業則仍處在努力進入云市場并樹立信譽的初級階段。對云計算平臺的建設和應用力度都不夠。

2.云計算軟件及服務方面

基于中國國情,目前國內云計算相關功能和服務主要集中于低端市場,以求以低成本創新切入市場,因此,國內的云計算服務運營商提供的基于云計算的企事業財務會計軟件服務主要停留在一些較為基本的、單一的財務功能層面上,如國內知名的在線B2B互聯網公司阿里巴巴集團旗下子公司阿里軟件目前正在面向型企事業推廣的“錢掌柜”會計和財務管理在線服務,就主要是圍繞企事業日?;矩攧諘嫻ぷ餍枨筇峁┰朴嬎惴盏?。

3.云計算安全性方面

安全問題是當前全球對云計算最大的質疑。這種擔憂在中國尤為突出,這是導致云計算在國內企事業財務會計信息化工作中應用緩隉的重要原因之一。由于云計算模式有可能會導致一個云服務器上存儲多家企事業數據的情況,相當多的企事業會擔心企事業最為機密的核心財務會計數據遭黑客盜竊,或是被意外泄露給同一云供應商的其他用戶或本企事業的非授權員工,而這對企事業無疑是致命的。因此實現企事業基于云計算的財務會計信息化必須解決其安全性問題。

4.云計算認同度方面

目前在我國眾多的企事業中僅有不足10%的企事業應用云計算在線開展相關業務,其中應用云計算處理企事業財務會計數據的更是少之又少。大部分的企事業由于政府對云計算政策不夠明朗,國內尚未明確制定云計算的相關標準,尚未規范云計算產業等各種原因,對云計算技術及服務持謹慎態度,導致云計算應用認同度較低。

三、云計算在企事業財務會計中應用

從如下幾個方面入手加以改進和完善:

1.加快國內云計算平臺的自主建設

由于國內的一些IT廠商在資金、技術力量等方面較為薄弱,可以考慮通過由政府牽頭,實現跨行業整合各相關企事業的資金資源、管理資源、技木資源、人力資源及上下游資源等,形成優勢互補,集眾家之所長聯合開發云計算平臺。以此間接降低云計算平臺開發難度及開發風險,節約開發時間。另外,政府有關職能部門還可以通過建立“云計算平臺示范工程”。設立國內自主建設云計算平臺的樣板,供各IT廠商研發時參考借鑒。

2.完善云計算的財務會計軟件功能與服務

豐富與完善,具體如下:①以企事業的財務會計工作需求為核心,打破現有的職能為企事業提供在線記賬、代賬、現金管理等功能的局限,將基于云計算的財務會計信息化軟件功能與服務向更為深入、更為廣泛的層次發展。②進一步增強云計算軟件快速開發的功能,積極發展企事業私有云服務,即允許企事業根據自己的需要通過向云計算服務運營商付費租賃平臺等方式,運用云計算服務運營商支持的編程語言和工具編寫好自己的應用程序,然后放到云計算平臺上運行。滿足企事業個性化業務需求。③提供在線定制服務。使企事業能根據自己的業務需求變化隨時調整基于云計算的財務會信息化軟件功能與服務,以滿足企事業的成長需求。

3.加強云計集應用的安全性建設

可從如下途徑加強云計算應用安全:①通過身份認證,區分使用者權限,加強訪問控制;②通過密鑰管理技術,對企事業存放于云中的數據進行加密處理,由企事業掌管密鑰,防止云計算服務運營商及其他不相關的人看到數據。③利用虛擬機進行防護,由網絡安全解決方案提供商對云計算服務運營商基于虛擬機的服務器提供黑客和惡意軟件入侵檢測和防御服務,構建虛擬化安全網關。

4.加快相關標準及法規的制定

政府態度的明朗化及云計算相關標準和法規的盡快出臺將有利于提高云計算在企事業中的認同度。不妨借鑒美國政府的做法,由政府參與或主持制定云計算應用標準、云計算產業規范及云計算相關法規。可先對國內的云計算市場進行摸底調查,在此基礎上盡快制定云計算相關標準。

5.加強對云計算服務運營商的監管力度

應用云計算處理企事業日常財務會計數據后,企事業的核心數據就都存放于云計算服務運營商的“云”中。因此必須進一步加強對云計算服務運營商的監管。首先,應嚴格審核云計算服務運營商的資質,如谷歌(Google)公司在與美國聯邦政府合作前就先通過了美國政府聯邦信息安全管理法的審核,獲得了相應的資質,才能有資格與政府合作云計算相關項目。

結束語

“云計算”對于會計電算化的發展具有深遠的影響?!霸朴嬎恪蹦軌驕p少企事業在會計信息化方面的投資和使用等成本,降低了企事業實現會計信息化的門檻,從而越來越多的企事業會選擇在”云”上實現會計信息化,使得會計電算化向會計信息化的過度更加頃利。

參考文獻

[1]葉曉勇.簡述云計算[J],黑龍江科技信息,2009(8)

計算機視覺與應用范文3

以下為報告詳細內容:

2017年計算機視覺技術在更多的領域有所落地應用,自動駕駛領域、高考、政務等領域更多的場景開始應用計算機視覺技術。艾媒咨詢分析師認為,計算機視覺行業技術是核心基礎,隨著技術成熟度提高,未來將有更多的場景能夠應用計算機視覺技術,計算機視覺企業應在強化技術打造的前提下,發掘更多新的應用領域,提高商業落地應用。

2017年人臉識別技術在智能手機終端應用開始普及。9月蘋果新品會上,iPhone X宣布引入Face ID高精度人臉識別技術,引來人們高度關注。而除了iPhone X,華為、小米、OPPO、vivo等手機廠商都推出了帶人臉識別功能的智能手機。艾媒咨詢分析師認為,計算機視覺領域內人臉識別功能可應用場景廣泛,商業化落地能力強,除了計算機視覺創業企業,互聯網巨頭和硬件巨頭企業也紛紛關注布局人臉識別領域。但目前人臉識別技術仍然存在一定缺陷,艾媒大數據輿情管控系統數據顯示,“手機人臉識別”熱詞言值數據為48.5,整體輿情偏負向?,F階段人臉識別技術在智能手機終端上的應用仍處于起步發展階段,技術和安全性仍有待提高,未來隨著各計算機視覺企業加強技術研發,人臉識別技術有望進一步改善,成為智能手機標配。

iiMedia Research(艾媒咨詢)數據顯示,2017年中國計算機視覺市場規模為68億元,預計2020年市場規模達到780億元,年均復合增長率達125.5%。艾媒咨詢分析師認為,人們安全和效率需求不斷提升,計算機視覺技術在各行業應用能有效滿足人們需求,市場發展空間巨大。國家政策對人工智能行業的支持也為計算機視覺的發展提供了有利的環境。隨著計算機視覺技術日漸成熟,企業商業化落地能力不斷提高,未來計算機視覺市場規模將迎來突破性發展。

iiMedia Research(艾媒咨詢)數據顯示,商湯科技以24.3%的企業知名度排名各計算機視覺企業首位,曠視科技與云從科技則分別以23.1%以及21.7%的知名度分列二三位。艾媒咨詢分析師認為,商湯科技計算機視覺技術及算法能力在行業內較為出色,同時在安防、金融、商業、手機端等多個領域均有商業落地應用,在企業認知和品牌推廣方面具有優勢。

iiMedia Research(艾媒咨詢)顯示,61.7%的受訪網民通過手機APP應用接觸計算機視覺應用,另外有50.9%的受訪網民接觸途徑為通過智能手機終端。艾媒咨詢分析師認為,計算機視覺企業主要服務B端用戶及政府機構,相比于其他途徑,移動端更適合應用計算機視覺技術的產品推廣。計算機視覺技術日趨成熟,在移動終端和APP上均有落地應用,也進一步為計算機視覺企業在大眾中奠定基礎。未來企業可通過線上渠道開發挖掘C端用戶市場。

iiMedia Research(艾媒咨詢)顯示,半數受訪網民認為智能手機及APP加入人臉識別技術功能方便了二者的使用,另有48.8%的受訪網民認為人臉識別技術在手機及APP上的應用是未來技術發展的趨勢。艾媒咨詢分析師認為,人臉識別技術在手機及APP端的應用滿足人們智能化和便捷化的需求,隨著越來越多的手機及APP產品加入人臉識別功能,未來其普及和認可程度將得到進一步提高。

iiMedia Research(艾媒咨詢)顯示,41.8%的受訪網民表示未來愿意使用人臉識別技術進行手機及APP解鎖,同時有41.4%的受訪網民雖持觀望態度,但愿意嘗試。此外,47.4%的受訪網民認為人臉識別將取代其他手機及APP解鎖技術成為未來主流。艾媒咨詢分析師認為,近期智能手機紛紛應用人臉識別技術解鎖推動該功能技術的普及,便捷性的優勢使該功能技術前景受看好。但目前人臉識別解鎖技術的準確性仍然受到質疑,隨著未來技術進一步成熟,該技術有望成為智能手機設備標配。

iiMedia Research(艾媒咨詢)顯示,33.9%的受訪網民曾使用過人證比對功能進行業務辦理。在使用過該功能的人群中,54.6%認為其方便了業務辦理,提供了效率,且有47.3%該部分人群認為其識別準確程度高。艾媒咨詢分析師認為,政府、銀行等機構業務辦理效率以往常遭詬病,人證識別技術的應用提高了辦事效率,在提高人們滿意度的同時,加強了計算機視覺技術的認可度。未來計算機視覺技術在政府、銀行等機構的落地應用將進一步擴展,但其中涉及到個人信息保護等問題需要企業及相關機構合力解決。

iiMedia Research(艾媒咨詢)顯示,34.1%的受訪網民認為公安辦案為最有必要應用人臉識別技術的安防情景。而關于網民對人臉識別技術在安防監控領域應用看法調查中,56.1%的受訪網民認為其能有力保護人們人身財產安全。艾媒咨詢分析師認為,計算機視覺技術,尤其是人臉識別技術在安防領域應用意義重大,在刑偵破案、身份認證、公共安全保護等情景具有重要應用價值。未來安防領域將成為計算機視覺技術重點應用領域,而安防的重要性也對相關企業技術實力有嚴格的要求,未來安防領域市場或由少數技術實力較強的企業占據。

商湯科技是專注計算機視覺與深度學習原創技術的人工智能創業企業,擁有強大的技術能力和人才資源儲備支撐發展。商湯科技在計算機視覺領域綜合實力較強,獲資本方青睞,B輪融資4.1億美元,同時與國內外知名企業展開合作。艾媒咨詢分析師認為,商湯科技在商業營收上同樣處于行業領先水平,但其本質專注于技術發展,強大的技術基礎能較好支撐商湯科技在上層應用場景的擴展。商湯科技在技術驅動商業應用的同時,積累商業應用經驗,提高企業知名度,拓展應用至更多領域。

艾媒咨詢分析師認為,商業化落地能力欠缺是目前計算機視覺行業大部分企業的痛點,商湯科技在商業落地應用方面處于行業領先位置。這一方面源于商湯科技技術能力往專業化發展,以專業技術和研發基礎實現場景差異化應用。另一方面,純計算機視覺技術或算法由于其專業性,需求方在使用時需要具備專業能力,而商湯科技技術產品往標準化方向打造,打包成行業解決方案,能適應更多企業使用需求,也有利于商湯科技技術進一步落地應用。未來堅持技術為基礎,繼續提高商業落地能力,商湯科技有望繼續保持良好發展態勢。

曠視科技成立于2011年,2017年10月完成巨額C輪融資,專注于人臉識別、圖像識別和深度學習技術自主研發和商業化落地,深耕于金融安全、城市安防、商業物聯、工業機器人等領域,同時打造人工智能開放云平臺。艾媒咨詢分析師認為,曠視科技利用云平臺為開發者提供技術支撐,有利于計算機視覺技術進一步結合產品運營,同時可以收集海量圖片數據,通過進行深度學習,曠視科技圖像識別技術又能進一步得到提升,有利于其強化自身核心技術能力。

艾媒咨詢分析師認為,人臉識別技術對于金融行業業務辦理及風控等流程具有重要應用價值,曠視科技在人臉識別技術上的優勢也助其有效開展金融領域的服務應用。未來隨著曠視科技利用云開放平臺相關圖片數據進行深度學習強化人臉識別技術,以及在金融領域積累的渠道資源,其有望在金融領域繼續強化技術服務,成為該領域市場有力的競爭者。

艾媒咨詢分析師認為,自動駕駛為人工智能和汽車行業未來發展方向,計算機視覺技術在自動駕駛汽車實現路況感知、高精度定位等方面發揮重要作用,自動駕駛為計算機視覺技術未來重要應用領域。圖森未來的計算機視覺技術和算法在自動駕駛領域實現專業化發展,未來有望在此細分領域成長為領先企業。

2017-2018中國計算機視覺行業發展趨勢

需求驅使計算機視覺行業發展潛力巨大應用場景拓展滲透各行業

艾媒咨詢分析師認為,人們對生活安全以及生產效率追求兩大需求的提升,決定計算機視覺行業具有巨大發展空間。而計算機視覺技術場景應用具有廣泛性,有望發展成為下一個智能時代的標配。目前計算機視覺技術主要應用在B端領域,短期內行業發展趨勢也是集中于B端領域。未來隨著技術成熟,計算機視覺有望拓展更多新的應用場景,實現場景落地,滲透至各行各業,形成AI+,開拓更多C端業務。此外,計算機視覺技術可以跟其他技術,如AR、VR、無人駕駛等結合發展,創造新的應用領域。

技術應用由點及面行業解決方案及軟硬件結合成商業產品出路

對于計算機視覺技術使用者來說,由于技術的學習應用需要花費較多時間和精力,硬件產品及行業解決方案往往更受青睞。未來計算機視覺企業需要將軟硬件結合,如打造嵌入式芯片等。此外,計算機視覺企業應將技術應用由點及面,將技術應用發展成針對各行業的解決方案。未來市場將出現更多基于計算機視覺技術應用的行業解決方案和軟硬一體化產品,只有打造方便用戶使用的商業產品,才能有效適應其需求,幫助計算機視覺企業迅速占領行業市場,在市場競爭中取得領先優勢。

計算機視覺行業發展對企業綜合實力要求高

艾媒咨詢分析師認為,計算機視覺行業巨大的發展前景決定其具有高成長性特點,未來將涌現更多人工智能領域優秀企業。但行業發展同時伴隨高風險性,行業競爭需要比拼企業技術算法能力、資金能力、以及人才資源,同時考驗企業能否實現技術迅速落地,對企業綜合實力要求高,綜合實力不具備優勢的企業在行業內將難以生存。

計算機視覺與應用范文4

1.1計算機在和藝術融合時

有效結合圖像、文本、聲音、動畫等因素,在豐富藝術語言表現形式時,也使作品更具有感染力。當計算機視覺藝術與數字媒體結合在一起時,使人們在觀看畫面時,不僅是欣賞畫面,也能夠感受到聲、色等。數字媒體通過計算機視覺藝術利用高度仿真的視覺、觸覺和聽覺,使大眾在觀看電影或玩游戲時,能夠真實感受到虛擬世界,同時還可以通過肢體語言、動作以及視線的轉移,與計算機進行有效交流。比如在2010年開展的上海世博會上,德國館所開展的動力之源”金屬球表演1.3噸重、裝有40萬根LED發光二極管的互動金屬球。在互動開始時,觀眾被分成兩批跟著解說員的指令呼喊,金屬球自動找到聲音最響亮的那個方向。然后,哪邊的呼喊聲大,互動球向那一邊的搖擺也更為劇烈,同時,球體表面上,亦不斷展現出一幅幅城市的美好愿景。使大眾不僅是單獨欣賞電影,而是可以參與到視覺藝術表演中。數字媒體通過計算機視覺藝術,在最大程度上滿足藝術創作對感受的表現。

1.2計算機視覺藝術在數字媒體中的應用

豐富了藝術的表達形式。交互技術的發展與成熟,使計算機視覺藝術的領域得到很好的拓展,并在各種數字媒體藝術中得到廣泛應用。比如在網頁、游戲等內容。交互技術的應用,使人們不再是被動的欣賞,而是參與到視覺藝術中,讓大眾去參與、選擇和判斷,而且可以通過不同的選擇將過程和結局進行不同的呈現,調動觀眾的興趣,提高大眾的參與度。

1.3計算機視覺藝術在電子游戲中的應用

首先是大型電子游戲應用的計算機視覺藝術。比如日本科樂美公司在推出警匪槍戰射擊《警察官2》游戲時,就受到許多玩家的歡迎。在游戲中,玩家不再只是使用鼠標和鍵盤來進行游戲,而是玩家可以通過身體行動,比如“蹲、閃及側身等行為以此進行移動。機器通過攝像機部捕捉到玩家的身體動作,玩家可以有效操作與機器相連的手槍,將屏幕中的對象進行射中。其次是手機上的小型電子游戲,比如在《神廟逃亡》,玩家只需要用手指向左、向右滑動屏幕,可以人物向左或向右轉向;而向上、向下滑動則可以讓人物跳躍或下滑過各種障礙。另外在需要游戲人物在左側或右側奔跑時,只需要側一下手機就可以,并且游戲畫面有著充足的聲光效果,可進行互動,有著極高的震撼力,對提高大眾的參與度有著積極的促進作用。

1.4計算機視覺藝術在數字媒體中的應用

使數字媒體技術將藝術進行有效表現,并在純藝術和實用藝術中應用到數字媒體,而數字媒體技術可以將單純的個人視覺進行有效的創造,并將藝術轉化為社會性視覺產品,并可以獲得經濟效益。而大眾可以利用拷貝、剪切等方式將數字媒體中的視覺藝術進行獲取,然后將藝術資源進行轉化,為個人視覺藝術的創作奠定了堅實的基礎。隨著大眾對獨特性以及個性化的藝術要求越來越高,在追求獨特的視覺藝術時,追求刺激的視覺藝術時,也提高了對視覺藝術作品的評價標準。計算機視覺藝術在數字媒體中的應用,給大眾帶來美的享受,使大眾在觀看視覺藝術時可以懷著愉悅、舒適的感覺進行欣賞,也可以獲得相應的審美評價,在潛移默化中改變著人的精神追求。計算機視覺藝術在數字媒體中應用時,沒有摻雜其他因素,使計算機視覺因素只是追求視覺形式和視覺美感,能夠在最大程度上體現藝術的本質。并且數字媒體本身就具有美的品格,與計算機視覺藝術相結合,使數字媒體藝術在具備了美時,也可以體現真。因此,計算機視覺藝術在數字媒體中的應用,提高了審美價值,大眾通過感受、體悟數字媒體所體現出的視覺藝術,領悟到視覺藝術中的美,能夠在很大程度上滿足大眾對美的追求。

2總結

計算機視覺與應用范文5

關鍵詞:數字攝影測量 計算機視覺 多目立體視覺 影像匹配

引言

攝影測量學是一門古老的學科,若從1839年攝影術的發明算起,攝影測量學已有170多年的歷史,而被普遍認為攝影測量學真正起點的是1851―1859年“交會攝影測量”的提出。在這漫長的發展過程中,攝影測量學經歷了模擬法、解析法和數字化三個階段。模擬攝影測量和解析攝影測量分別是以立體攝影測量的發明和計算機的發明為標志,因此很大程度上,計算機的發展決定了攝影測量學的發展。在解析攝影測量中,計算機用于大規模的空中三角測量、區域網平差、數字測圖,還用于計算共線方程,在解析測圖儀中起著控制相片盤的實時運動,交會空間點位的作用。而出現在數字攝影測量階段的數字攝影測量工作站(digital photogrammetry workstation,DPW)就是一臺計算機+各種功能的攝影測量軟件。如果說從模擬攝影測量到解析攝影測量的發展是一次技術的進步,那么從解析攝影測量到數字攝影測量的發展則是一場技術的革命。數字攝影測量與模擬、解析攝影測量的最大區別在于:它處理的是數字影像而不再是模擬相片,更為重要的是它開始并將不斷深入地利用計算機替代作業員的眼睛。[1-2]毫無疑問,攝影測量進入數字攝影測量時代已經與計算機視覺緊密聯系在一起了[2]。

計算機視覺是一個相對年輕而又發展迅速的領域。其目標是使計算機具有通過二維圖像認知三維環境信息的能力,這種能力將不僅使機器能感知三維環境中物體的幾何信息,包括它的形狀、位置、姿態、運動等,而且能對它們進行描述、存儲、識別與理解[3]。數字攝影測量具有類似的目標,也面臨著相同的基本問題。數字攝影測量學涉及多個學科,如圖像處理、模式識別以及計算機圖形學等。由于它與計算機視覺的聯系十分緊密,有些專家將其看做是計算機視覺的分支。

數字攝影測量的發展已經借鑒了許多計算機視覺的研究成果[4]。數字攝影測量發展導致了實時攝影測量的出現,所謂實時攝影測量是指利用多臺CCD數字攝影機對目標進行影像獲取,并直接輸入計算機系統中,在實時軟件的幫助下,立刻獲得和提取需要的信息,并用來控制對目標的操作[1]。在立體觀測的過程中,其主要利用計算機視覺方法實現計算機代替人眼。隨著數碼相機技術的發展和應用,數字近景攝影測量已經成為必然趨勢。近景攝影測量是利用近距離攝影取得的影像信息,研究物體大小形狀和時空位置的一門新技術,它是一種基于數字信息和數字影像技術的數據獲取手段。量測型的計算機視覺與數字近景攝影測量的學科交叉將會在計算機視覺中形成一個新的分支――攝影測量的計算機視覺,但是它不應僅僅局限于地學信息[2]。

1. 計算機視覺與數字攝影測量的差異

1.1 目的不同導致二者的坐標系和基本公式不同

攝影測量的基本任務是嚴格建立相片獲取瞬間所存在的像點與對應物點之間的幾何關系,最終實現利用攝影片上的影像信息測制各種比例尺地形圖,建立地形數據庫,為各種地理信息系統建立或更新提供基礎數據。因此,它是在測繪領域內發展起來的一門學科。

而計算機視覺領域的突出特點是其多樣性與不完善性。計算機視覺的主要任務是通過對采集的圖片或視頻進行處理以獲得相應場景的三維信息,因此直到計算機的性能提高到足以處理大規模數據時它才得到正式的關注和發展,而這些發展往往起源于其他不同領域的需要。比如在一些不適合于人工作業的危險工作環境或人工視覺難以滿足要求的場合,常用計算機來替代人工視覺。

由于攝影測量是測繪地形圖的重要手段之一,為了測繪某一地區而攝影的所有影像,必須建立統一的坐標系。而計算機視覺是研究怎樣用計算機模擬人的眼睛,因此它是以眼睛(攝影機中心)與光軸構成的坐標系為準。因此,攝影測量與計算機視覺目的不同,導致它們對物體與影像之間關系的描述也不同。

1.2 二者處理流程不同

2. 可用于數字攝影測量領域的計算機視覺理論――立體視覺

2.1 立體視覺

立體視覺是計算機視覺中的一個重要分支,一直是計算機視覺研究的重點和熱點之一,在20多年的發展過程中,逐漸形成了自己的方法和理論。立體視覺的基本原理是從兩個(或多個)視點觀察同一景物,以獲取在不同視角下的感知圖像,通過三角測量原理計算像像素間的位置偏差(即視差)來獲取景物的三維信息,這一過程與人類視覺的立體感知過程是類似的。一個完整的立體視覺系統通常可分為圖像獲取、攝像機定標、特征提取、影像匹配、深度確定及內插等6個大部分[5]。其中影像匹配是立體視覺中最重要也是最困難的問題,也是計算機視覺和數字攝影測量的核心問題。

2.2 影像匹配

立體視覺的最終目的是為了恢復景物可視表面的完整信息。當空間三維場景被投影為二維圖像時,同一景物在不同視點下的圖像會有很大不同,而且場景中的諸多因素,如光照條件,景物幾何形狀和物理特性、噪聲干擾和畸變以及攝像機特性等,都被綜合成單一的圖像中的灰度值。因此,要準確地對包含了如此之多不利因素的圖像進行無歧義的匹配,顯然是十分困難的。

在攝影測量中最基本的過程之一就是在兩幅或者更多幅的重疊影像中識別并定位同名點,以產生立體影像。在模擬攝影測量和解析攝影測量中,同名點的識別是通過人工操作方式完成的;而在數字攝影測量中則利用計算機代替人工解決同名點識別的問題,即采用影像匹配的方法。

2.3 多目立體視覺

根據單張相片只能確定地面某個點的方向,不能確定地面點的三維空間位置,而有了立體像對則可構成與地面相似的立體模型,解求地面點的空間位置。雙目立體視覺由不同位置的兩臺或者一臺攝像機(CCD)經過移動或旋轉拍攝同一幅場景,就像人有了兩只眼睛,才能看三維立體景觀一樣,然后通過計算空間點在兩幅圖像中的視差,獲得該點的三維坐標值。現在的數字攝影測量中的立體像對技術通常是在一條基線上進行的,但是由于采用計算機匹配替代人眼測定影像同名像對時存在大量的誤匹配,使自動匹配的結果很不可靠。其存在的問題主要是,對存在特殊結構的景物,如平坦、缺乏紋理細節、周期性的重復特征等易產生假匹配;在攝像機基線距離增大時,遮擋嚴重,能重建的空間點減少。為了解決這些問題,降低雙目匹配的難度,自1986年以來出現了三目立體視覺系統,即采用3個攝像機同時攝取空間景物,通過利用第三目圖像提供的信息來消除匹配的歧義性[5]。采用“多目立體視覺技術”可以利用攝影測量的空中三角測量原理,對多度重疊點進行“多方向的前方交會”,既能較有效地解決隨機的誤匹配問題,同時又能增加交會角,提高高程測量的精度[2]。這項技術的應用,將很大程度地解決自動匹配結果的不可靠性,提高數字攝影測量系統的準確性。

計算機視覺與應用范文6

關鍵詞:計算機視覺;教學應用;教學改革

計算機視覺是人工智能學科中的一門重要課程。隨著相關應用在多個領域中的出現,越來越多的學生開始對這門課產生了濃厚的興趣。如何讓學生能夠在整個課程中保持盎然的興趣,并為有志于深入研究計算機視覺的學生指明方向,成為我們教師首先應注重的問題。

在實際的教學工作中,通過不斷摸索總結,我們認為,以實際應用引導學生的學習興趣,既滿足了學生想了解計算機視覺實際應用的需求,又加深了學生對于算法的理解,把算法放在一個實際應用中,學生可以理解怎么用,為什么這么用。在這樣的目標導引下,我們從選擇教材開始,準備教學內容(包括合理的應用實例的選擇)、制作PPT、探索教學方法,形成了目前以實際應用為主導的創新教學體系,非常受學生歡迎。在此,我們對這期間遇到的問題,解決方法、心得體會做一個總結和思考,希望能對同行有些許參考作用。

1選擇教材

在我們這個專業,每年的上研率基本都保持在50%左右。在本專業的研究生階段,也開設了雙語教學的計算機視覺課程。另外,畢業后選擇參加工作的同學也基本都進入和本專業非常相關的一些單位,所從事的工作,都是和在學校學習的知識密切相關。

因此,如何讓這門課程的教學既兼顧本科畢業就參加工作的那部分同學,又兼顧繼續深造的學生的需求,也是在這門課程講授的過程中,需要特別注意的一個問題。對于本科畢業就要參加工作的同學而言,需要“廣度”,需要了解計算機視覺這門課在各個領域中的應用,在實際中接觸到相關的項目或工作時,能夠知道去哪里可以找到自己需要的參考資料;而對于要進一步深造的同學而言,則需要一定的“深度”,為研究生階段的研究打下基礎。

全盤考慮到這些學生畢業之后的去向,我們選擇了兩本教材。一本是賈云得教授編著,科學出版社于 2000年出版的《機器學習》[2],這是一部順應了時代與教學發展要求的教材,對計算機視覺中的基本概念、基本算法、基本算法的應用、經典應用進行了由淺入深的介紹。內容涵蓋了所有經典的數字圖像處理與機器視覺方法,也對一些已經得到非常好實際應用的方法,如光流法等作了簡要介紹。另外還選擇了一本英文原版的計算機視覺的經典著作,Ramesh Jain 教授等所著的《Machine Vision》[3],機械工業出版社于2003年出版。這是國內外非常推崇的一本計算機視覺著作,該教材條理清晰,深入淺出,對計算機視覺的基本原理、算法、應用的介紹非常詳盡。

在教學中,我們采用了英文的PPT,但主要用的教材是賈云得教授的《機器視覺》,這樣中英文對照講解,一方面加深學生對教學內容的理解,另一方面也為學生今后閱讀專業的英文論了相應準備。

2教學內容和工程實例的選取

2.1選取教學內容

本課程之前,大學二年級的本科生已開設數字圖像處理課程,但所講的基本原理和算法都非常淺顯,所以在教學內容的安排上,分為兩大部分:數字圖像處理部分和視覺部分。數字信號處理部分主要講解在視覺部分會用到的一些基本算法,為后面進入計算機視覺部分打基礎。這部分約占總課時的1/3。視覺部分的課時也分為兩部分:算法講解與實例講解。在算法講解部分,對計算機視覺的基本算法、經典算法都做了深入淺出的講解。實例部分則選擇了經典的工業應用,讓學生能夠對所學算法進一步加以理解。

2.2選取適當的工程實例

就計算機視覺的教學內容而言,各個孤立的算法和方法對本科生來講,有些抽象不好理解。如果在教學上僅僅通過老師在課堂上的講解,很難讓學生深入地理解相關的教學內容,而選擇一個觸手可及且簡單好理解的工程實例往往就會達到意想不到的教學結果,學生可以把課堂上所學的枯燥理論與現實中活生生的事物聯系起來,從而加深對教學內容的理解。

通過反復比對、反復論證,我們選擇了在講解基本原理和算法之后,在課程結束前,專門留出課時講解手機制造這個例子。手機現在是人手一部,是這些年青學子再熟悉不過的事物了,通過對手機主板、手機鍵盤的制造過程的講解,把所學的算法都融合進來,學生在覺得有趣的同時,不知不覺就加深了對所學算法的理解。

另外,在教學的過程中,我們還不斷穿插其他學生耳熟能詳的實例,如數碼相機原理中的一些算法的講解,我們和學生一起探討應該怎么選擇數碼相機。再有,濾波器算法、在課堂上對Photoshop功能的演示,與所學算法關聯起來,學生都很容易理解接受。

3教學點滴

3.1點睛之筆

在第一節課的講述中,我們的重點不在于Marr理論,而是告訴學生:

人工智能就是要讓計算機像人一樣,能夠會聽、會看……

我們這門課程就是要讓計算機“會看”,要像人一樣會看。進而展示給學生一些我們精心挑選的圖片,讓學生自己判斷,是不是自己的眼睛“騙了”自己,人眼和計算機看到的到底有什么不一樣。

每次講到這里,學生都會進行熱烈的討論,每個人都有不同的看法,每個人都有自己的堅持,不知不覺中,對這門課就產生了濃厚的興趣,有了繼續深入學習下去的愿望。在課堂討論的最后,比較人眼對圖片的判斷以及計算機的判斷后,讓學生自己總結歸納,我們這門課到底要研究些什么,都有可能應用在哪些方面,然后對爭議比較大的提議一一探討。每到這個時候,大家的積極性就都被激發出來,在不斷的爭論與思想碰撞中找出正確的結論。

3.2拿身邊的事物說“事”

計算機視覺課程的前半部分,多涉及到圖像處理的一些常見算法。在講授各種各樣的濾波器和算子時,并沒有針對各個濾波器和算子擺出一堆示例圖片,讓學生比較濾波前后的差異,從而很生硬地理解濾波器與算子的功能。取而代之的,我們首先以現在人手一臺的數碼相機為例提出問題,你為什么要選擇你手里的這臺數碼相機?當初選這個品牌和型號時,你的考慮是什么?歷年學生的回答幾乎都是看網上測評,或者在網上看別人怎么說。這時列出我們收集到的各個品牌相機的測評報告,列出它們的優缺點,然后引導學生去思考,例如這個品牌的相機的缺點是照片發灰,不是很鮮亮,而另一個品牌的相機則綠的特別綠,紅的特別紅,為什么?那么有可能是哪部分的算法不夠完善,為什么?

通過如此簡單的對比,學生的積極性被完全激發。原來,數碼相機這個幾乎人人都有,大家都熟悉的“玩具”竟然和自己在課堂上學到的知識這么密切相關。

再有,就是利用學生們都熟悉的PS(Photoshop),演示現在所謂的“完美證件照”是怎么來的。為什么可以把疙疙瘩瘩的臉部皮膚變得光滑?在PS中,你就是點了一下鼠標,其實在后臺,是加入了一個濾波器進行了濾波。各種這樣的演示,學生都非常喜聞樂見。因為他們突然發現,原來那些事物,和我自己接觸到這些看似枯燥的理論之間,還有這么深刻的聯系。

還有一個很受學生歡迎的例子就是對于“鼓形失真”的講解。我們的老師每次講到這里,都不會簡單告訴學生“鼓形失真”發生的原因是什么,應該怎么解決?老師都會問學生,明星為什么都一窩蜂去減肥?現在的女明星為什么都要去弄個“錐子臉”?課堂上就會出現一個小,男同學和女同學的看法各異,彼此之間開始爭論不休。此時再趁熱打鐵地問學生,如果拿著相機,離自己的鼻子一公分,會拍出什么樣的效果?有學生開始拿出手機對著自己和別人開拍,有的學生開始頭頭是道地分析。每到這種學生都開始熱烈討論的時候,就可以適時引導學生往正確的方向去,讓他們自己找到正確的分析解決方法,往往這個時候,學生都會頗有成就感,對于問題的理解也會特別的深刻。

3.3選擇合適的實際應用

在所有理論講解結束后,我們會留出2~4次課講述計算機視覺在工業上的應用。這些年來,對于手機制造這樣一個工業應用,非常受學生歡迎。正如“數碼相機”這個例子一樣,現在學生都是人手一部手機,是大家再熟悉不過的東西。這個例子涉及到了在前面理論講述中的大部分算法,如二值圖像的處理、模板匹配、高斯濾波器等。學生通過對這個工業應用的理解,更進一步加深了對算法的理解。

以講解手機鍵盤的制造過程為例,向學生提出和前面所講內容相關的問題,引導學生自發思考,如為什么選擇模板匹配法,而不是采用其他更復雜更精確的方法等等。每到這個時候,課堂氣氛總是分外熱烈,學生各抒己見,在不斷爭論中,更進一步加深對課本上枯燥理論的認識。

在這里需要注意的問題是一定要一步一步提出問題,循循善誘,引導學生一層一層地深入思考。如果問題的答案過于“深藏不露”,則有可能觸發學生的抵觸情緒,無法繼續深入地思考。

4結語

通過多年的教學摸索,我們認為,在計算機視覺課程的講述中,以實際應用引導學生這樣的教學方法非??扇?而且也收到了很好的效果。另外,除了制定好的教學大綱,并選擇合適的教材外,根據學?,F在的時間情況,我們選擇了多媒體手段輔助教學,充分利用Matlab和大屏幕投影等方方面面的優勢,結合多種方法進行教學,對講好計算機視覺這門課,非常有益。

參考文獻:

[1] 林堯瑞,馬少萍. 人工智能導論[M]. 北京:清華大學出版社,1989.

[2] 賈云得. 機器視覺[M]. 北京:科學出版社,2000.

[3] Ramesh Jain. Machine Vision[M]. 北京:機械工業出版社,2003.

[4] 蔡自興. 智能控制原理與應用[M]. 北京:清華大學出版社,2007.

Innovation in the Course of Computer Vision

HAN Hong, JIAO Li-cheng

(School of Electronic Engineering, Xidian University, Xi’an 710071, China)

亚洲精品一二三区-久久