計算機視覺的方向范例6篇

前言:中文期刊網精心挑選了計算機視覺的方向范文供你參考和學習,希望我們的參考范文能激發你的文章創作靈感,歡迎閱讀。

計算機視覺的方向范文1

關鍵詞:結算;工程量;取費

中圖分類號:F830.46 文獻標識碼:A

引言

房地產開發項目是指建設方向開發商提供已完工程,并按照規定向開發商收取工程價款的過程,傳統的工程結算分為中間結算和竣工結算相結合的方法,隨著市場經濟發展和建筑業改革的不斷深化,“標價支付、竣工清算”的結算方式應運而生,該種結算方式既體現了建設項目招投標的形成全過程管理連挑價值鏈的延伸,同時以行業管理為主體并實施統一管理的內容,由于竣工結算直接影響房產商開發項目所產生的經濟利益大小,直接體現了工程造價系統控制的最終結果,因此對結算過程中存在的問題進行合理分析并制定相應解決措施對合理控制房產項目結算價格具有重要意義。

1 房地產開發項目工程結算中存在的問題

1.1 高估冒算

當前國內對預結算編制中出現誤差的獎懲制度制定并不完善,房產商對施工單位編制結算表表中存在誤差沒有相關約束機制,同時施工隊伍素質參差不齊,追求經濟效益最大化的思想指使其在編制結算中出現對工程量高估冒算的現象,具體可表現為技術人員對造價人員交底不詳細導致的多報,施工方存在僥幸心理或為了逃避審計單位而無原則虛報等,同時由于當前國內定額變動頻繁、計算程序較為復雜以及各個區域內計算基礎不同等因素也導致工程量高估冒算現象[1]。

1.2 虛增工程量

因造價人員對定額理解不透徹,或新舊定額間存在差距,編制人員按照利于其工程量的定額進行計算;在工程量計算時按照施工中材料進場量進行計算,而未按照定額規定計算規則進行計算,或將定額中規定的材料損耗計入導致材料用量增加;虛列工程項目,將未施工的項目列入結算內,或在計算工程量時采取重復計算或多計算等手段導致工程量增多。

1.3 錯套定額

施工方在申報結算時套用定額時往往是就高不就低,施工中的低工程套用高價定額子目,該類現象在土石方開挖、混凝土標號及石子粒徑等環節中易出現;在套用定額時在鋼筋混凝土樓梯面層內跨步同連接板結構面層內應采用地面部分而采用樓面面層等現象,該類現象均會導致造價增加[2]。

1.4 材料價格混亂

現代建筑中材料費用約占總費用的60-70%,因此材料價格在工程造價中占有核心地位,但近年來材料市場化在一定程度上導致了管理混亂和材料價格漲跌失控的局面;在材料使用時以次充好,而在結算中材料價格按照質優價高的上報,施工中偷工減料或采用同設計型號不同的材料代替,在結算中材料價格調整時調漲不調跌,或只調整高于定額價格的材料而不調整低于定額的材料價格導致工程造價虛增。

1.5 未按標準取費

現代建筑中工民建應符合建筑面積、高度和跨度三個指標中的兩個指標方可,而構筑物中符合一個指標則可,因工程類別不同其相應的費率也會發生變化而引起工程造價發生變化,同時按照市場價計入的項目以補充估價的形式存在而不能計取任何費用,只能計取定額測定費和稅金;在實際施工中未使用大型機械或特種機械而在結算時卻列入該類費用,或工程施工中未因趕進度而夜間加班但在結算時卻列入夜間施工所增加的費用等[3]。

2 結算中存在問題的解決措施

2.1 工程量審核。工程量是工程資源投入的量化指標,也是結算審查工作中的關鍵,其是根據施工圖紙按照規定的計算規則進行審查,若計算工程量增加則會導致工程直接費用和間接費用都相應增加,因此在對施工方上報的結算審查中應將工程量審查作為重中之重。

按計算規則審查。房產商在進行結算審核時應根據招投標文件、施工合同以及施工圖紙等按照既定計價模式應采用的計算規則進行審核,應注意工程量計算并非構件實際體量計算,而是在編制定額時已做相應簡化,應主要審核工程量計算規則是否同清單設置吻合、所報單項工程內容是否與清單內單項工程所包含的內容一致,計價是否按照計價規范中的規則相符等,應注意應該扣除的部分是否已經扣除等。

審查是否存在重算部分。隨著工程計價軟件的更新,施工方往往巧立名目對工程量進行重復計算,或故意擴大工程量或虛報工程量,所以在審核時應認真體會定額內的說明和計算規則以防止施工方重套工程量。

嚴審變更和簽證工程量。對施工過程中所發生的變更及簽證所設計的工程量應結合實際情況進行審查,確保實事求是,應認真審查變更及簽證手續是否齊全,確認所涉及的項目是否已完成并通過驗收,尤其是涉及的工程量較大且未能做合理解釋的不可單單以簽證為準,并且應注意核減變更前所涉及的工程量;應合理區分變更及簽證所涉及的責任方,對因施工方內部原因導致的變更不能予以確認,甚至應防范施工方模仿責任人筆體簽字或私刻公章現象增加工程量現象。

2.2 套用定額單價的審查。若工程計價采用定額計費則單價應按照定額單價進行計算,房產商在審查時應重點審查定額套用是否合理,是否存在低價高套現象;對因選用材料不同、做法不同或材料斷面厚度不同而進行定額換算現象,應主要審查其換算是否按照規定執行;對補充定額則應審查其是否依據編制原則進行;對執行工程量清單的項目則因一般情況下采用綜合單價一次性包死而不做調整,若由于變更等出現新的子項則其單價應按照以下依據實施,原報價中已有適用于該工程量則應按照已有價格確定,有類似工程時則可參照類似價格確定,無類似工程則應由施工方提出相應的變更價格后同開發商機型協調決定;應嚴格審查施工方是否存在將原定額內已經包括在單價內的施工內容單獨列項申報或將費率中包含部分單獨列項重復申報,或通過對定額單價的換算、混算等措施來抬高結算單價等現象。

2.3 費用審查。對費用審查應結合當地部門規定及合同和招標文件等確定費率的時效性,所采用的取費表是否與工程性質相符,費率計算是否正確以及價格調整是否符合相關規定等,對于施工過程中新增加的項目則應重點審查施工方是否依據施工方投標文件中費率口徑等;對施工方報價時承諾的下浮率應在結算時嚴格執行,對合同外的部分則應按照另行約定的下浮率進行結算;若施工方未進行下浮率承諾則應執行投標報價與公示價相比的下浮率,并選擇承諾下浮率與公示價下浮率中較大的進行結算;若項目存在預備費則應結合施工中該項費用是否實際發生來進行核減,但工程技術措施費則不應以工程量增減而進行調整。

2.4 材料審查。在材料價格審查時應重點審查用量大價格高或材料不透明的部分材料,房產商平時應注意收集材料價格信息以及通過各種途徑了解相關材料價格,對于定額內沒有相關價格的新型材料應深入了解市場價格以及廠家產品質量等信息便于在審查時有理有據;應重點審查相關材料定額價及市場價調整量或調整系數等,以防施工方報價中的水分;對施工中宜發生問題的材料應重點審查并現場核實,對施工方報價中價格不明確的材料應進行必要的市場調查或各種途徑了解材料真實價格。

2.5 變更、簽證審查。對施工中發生的變更和簽證應重點審查其合法性和合理性,堅決杜絕在簽證費用中已包含在合同價款匯總的費用施工方再次巧立名目重新計費的現象;應重點審查簽證中是否存在工程量交叉而計費重復的現象,若由于發生較大變更而導致清單發生較大變化則應重新對清單類別和數量進行審核,并依據合同規定來確定計價模式和取費費率。

參考文獻

[1]羅紹.論房地產開發施工和結算階段的造價控制[C].有科技與生活,2009(12).

計算機視覺的方向范文2

一、計算機視覺檢測技術含義

計算機的視覺又叫做機器視覺,通過利用計算機或者是其他的一些機械設備來幫助人們視線事物到圖片的過程,從而進行三維世界的感知活動。計算機的快速發展,離不開神經心理學,心理學和認知科學方面的研究和發展,計算機視覺檢測技術的發展方向就是對周圍的三維空間進行感知和分析。一旦能夠擁有這種能力,計算機不僅能感知到周圍的總體環境,而且,還能夠具有對物體進行描述,識別理解和儲存的能力。

二、計算機視覺檢測的基本原理

要實現人工智能對視覺的計算機處理是很重要的方面在計算機視覺應用領域中如果要讓我們的計算機明白圖像的信息就必須經過一系列的處理過程―――數字圖像處理.數字圖像的處理包括5個步驟:圖像預處理(去除噪聲)、分割處理分割后區域、測量、圖像判讀、圖像技術.根據抽象程度和處理方法的不同圖像技術可分為三個層次:圖像處理、圖像分析和圖像理解.這三個層次的有機結合也稱為圖像工程.而計算機視覺(Computer vision)則是用計算機實現人的視覺功能對客觀世界三維場景的感知、識別和理解.視覺檢測按其所處理的數據類型又大致可分為二值圖像、灰度圖像、彩色圖像和深度圖像的視覺檢測.另外還有X射線檢測、超聲波檢測和紅外線檢測。

作為新興檢測技術計算機視覺檢測充分利用了計算機視覺研究成果采用像傳感器來實現對被測物體的尺寸及空間位置的三維測量能較好地滿足現代制造業的發展需求.與一般意義上的圖像處理相比計算機視覺檢測更強調精度、速度和無損性以及工業現場環境下的可靠性.例如基于三角法的主動視覺測量理具有抗干擾能力強、效率高、精度合適等優點非常適合制造業生產現場的在線、非接觸產品檢測及生產監控.對人類視覺感知能力的計算機模擬促進了計算機視覺技術的產生和發展制造業上獲取這些信息的目的有:(1)計算出觀察點到目標物體的距離;(2)得出觀察點到目標物體的運動參數;(3)甚至可以判斷出目標物體的內部特性;(4)推斷出目標物體的表面特征有時要求形成立體視覺。

三、亞像素檢測技術

隨著工業檢測等應用對精度要求的不斷提高,像素級精度已經不能滿足實際檢測的要求,因此需要更高精度的邊緣提取算法,即亞像素算法。亞像素級精度的算法是在經典算法的基礎上發展起來的,這些算法一般需要先用經典算法找出邊緣像素的位置,然后使用周圍像素的灰度值作為判斷的補充信息,利用插值、擬合等方法,使邊緣定位于更加精確的位置?,F在的亞像素提取算法很多,如重心法、概率論法、解調測量法、多項式插值法、濾波重建法、矩法等。由于這些算法的精度、抗噪聲能力和運算量各不相同,他們的應用場合也是各不相同的。

邊緣是圖像的基本特征,所謂邊緣是指圖像中灰度存在階躍或尖頂狀變化的像素的集合,邊緣廣泛存在于物體與物體、物體與背景之間。圖像測量是通過處理被測物體圖像中的邊緣而獲得物體的幾何參數的過程,邊緣的定位精度直接影響最終的測量結果。因此,圖像邊緣提取方法是檢測的基礎和關鍵之一。在視覺測量領域中,早期使用的都是像素級邊緣檢測方法,例如常用的梯度算子、Lapacian算子和門式算子等。以上的邊緣檢測方法的精度可以達到像素級精度,即可以判斷出邊緣位于某個像素內,但不能確定邊緣在該像素內的更精確的位置。如果一個像素對應的實際長度較大,就會產生較大的誤差,傳統的整像素邊緣檢測方法就不再適用。

四、計算機視覺檢測技術在機加工零件檢測中的應用要素與過程

(一)曲陣CCD相機

面陣CCD是本項目圖像采集系統中的主要設備之一,其主要功能是采集實驗圖像。該CCD相機主要由CCD感光芯片、驅動電路、信號處理路、電子接口電路和光學機械接口等構成。

(二)工業定焦鏡頭

在圖像測量系統中,鏡頭的主要作用是將目標聚焦在圖像傳感器的光敏面上。鏡頭的質量直接影響到圖像測量系統的整體性能,合理選擇并安裝光學鏡頭是圖像測量系統設計的重要環節。

(三)數字圖像采集卡

隨著數字信號處理技術和嵌入式處理器技術在圖像采集卡中的應用,使得圖像采集卡向高速度、多功能和模塊化方向不斷發展。這類圖像采集卡不僅具有高速圖像采集功能,同時還具備部分圖像處理功能,因此又可以稱之為圖像處理卡。

(四)標定板

為提高測量精度,需要進行攝像機標定。標定過程中,采用NANO公司的CBC75mm}.0型高精度標定板,外形尺寸為75mmx75mmx3.0mm,圖形為棋盤格,其尺寸為2.0mmx2.0mm,精度為1級,即圖形尺寸精度與圖形位置精度為。

(五)背光源

背光方式只顯示不透明物體的輪廓,所以這種方式用于被測物需要的信息可以從其輪廓得到的場合。因此,為精確提取軸的圖像中的邊緣特征,需采用背光源。為使圖像邊緣更銳利,光源顏色選擇紅色。

五、結語

隨著計算機技術和光電技術的發展,已經出現了一種新的檢測技術―基于計算機視覺的檢測技術,利用CCD攝像機作為圖像傳感器,綜合運用圖像處理等技術進行非接觸測量的方法,被廣泛地應用于零件尺寸的精密測量中。本文以面陣CCD為傳感器,研究了零件在線測量的方法,實現了零件尺寸的圖像邊緣亞像素定位測量,對面陣CCD在高精度測量方面的應用作了進一步的探索和研究,為面陣CCD在復雜零件尺寸高精度測量的實現打下了基礎。

【參考文獻】

計算機視覺的方向范文3

關鍵詞: 計算機 視覺注意機制 計算機視覺注意模型

1.引言

隨著信息技術的不斷發展,數據處理量劇增,以及用戶不斷擴大的個性化需求,對計算機信息處理能力提出了越來越高的要求。如何在場景中快速準確地找到與任務相關的局部信息,即物體選擇與識別,已經成為計算機信息處理領域的一個研究熱點。隨著在心理學領域注意機制研究的不斷發展,將注意機制引入信息處理領域來解決物體識別問題,已經不再是紙上談兵。

人類視覺系統進行視覺信息處理時,總是迅速選擇少數幾個顯著對象進行優先處理,忽略或舍棄其他的非顯著對象。進入人類視野的海量信息,通過注意選擇機制進行篩選,就能使我們有選擇地分配有限的視覺處理資源,保證視覺信息處理的效率,這就是視覺選擇注意機制的原理。依據人類視覺選擇注意的基本原理,開發能夠進行智能圖像信息處理的計算機系統,就成為一大任務。我們研究的主要方向是使計算機處理對象時,能夠具備與人類相似的視覺選擇注意能力。

2.視覺注意機制

研究視覺注意機制是個多學科交叉的問題,目前多個領域的研究人員都取得了研究成果,并且對視覺注意的理論都形成了一些共識。目前普遍認為注意既可以是按自底向上(自下而上)的圖像數據驅動的,也可以是安自頂向下(自上而下)的任務驅動的。其中,自下而上的研究主要來自圖像中物體數據本身的顯著性。例如,在視覺搜索實驗中,顯著的物體會自動跳出,如圖1中的圓點通過特征對比,以形狀跳出的形式獲得注意。自上而下的引導主要來自當前的視覺任務,以及場景的快速認證結果,即我們可以“故意”去注意任何一個“不起眼”的物體,如我們可以在圖書館浩如煙海的藏書中,找到自己感興趣的那本書。

研究視覺注意機制的重要方法是研究眼睛在搜索目標時的表現。顯著圖中的各目標在競爭中吸引注意點,注意點在各個注意目標間轉移。根據注意點轉移時是否伴隨眼動,視覺注意也分為隱式注意和顯式注意。隱式注意的中央凹不會隨著注意點的轉移而移動,而顯式注意的中央凹隨每次注意點的轉移而運動。

對視覺注意機制的研究為計算機視覺的發展提供了可能。計算機視覺借鑒人類視覺的注意機制,建立視覺注意的計算模型。通過“注意點”的選擇與轉移,實現對復雜場景中任務的搜索與定位,最終來實現實時信息的響應處理。在計算機視覺的研究中,顯式注意應用較多。

3.計算機視覺注意模型

從人的角度來看,人類視覺系統通過視覺,選擇注意在復雜的場景中迅速將注意力集中在少數幾個顯著的視覺對象上。從場景的角度來看,場景中的某些內容比其他內容更能引起觀察者的注意,我們稱之為視覺顯著性,兩者其實是從不同的角度對視覺選擇注意過程的描述。

我們把引起注意的場景內容定義為注意焦點FOA(Focus of Attention)。Treisman的特征整合理論中將視覺信息處理過程劃分為前注意和注意兩個階段,各種視覺特征在前注意階段被以并行的方式提取出來,并在注意階段以串行方式整合為視覺客體,即注意的特征和客體是通過不同方式進行的。在注意焦點的選擇和轉移上,Koch[2]進行了深入的研究,他提出注意焦點FOA的變化具有四個特征,即單焦點性:同一時刻只能存在一個FOA;縮放性:FOA的空間范圍可以擴大或者縮小;焦點轉移性:FOA能夠由一個位置向另一個位置轉移;鄰近優先性:FOA轉移時傾向于選擇與當前注視內容接近的位置。同時注意焦點具有抑制返回的特點,即FOA轉移時抑制返回最近被選擇過的注視區域。在此基礎上,視覺注意的研究人員提出了多種視覺注意模型。

4.視覺注意模型的研究現狀

人類的視覺注意過程包括兩個方面:一方面是對自下而上的初級視覺特征的加工,另一方面是由自上而下的任務的指導,兩方面結合,共同完成了視覺的選擇性注意。與此對應,當前的計算機視覺注意研究也分為這兩個方面。

4.1自下向上的數據驅動注意模型研究及分析

在沒有先驗任務指導的情況下,視覺注意的目標選擇主要是由場景中自下而上的數據驅動的,目標是否被關注,由它的顯著性決定?,F在,自下而上的注意研究主要基于Treisman的特征整合理論和Koch&Ullman的顯著性模型,Itti、satoh等人均在此基礎上提出了自己的研究模型,并做了一些模型的改進研究。自下而上的研究方法通過對輸入圖像提取顏色、朝向、亮度等方面的基本視覺特征的研究,形成各個特征對應的顯著圖。另外,一些研究者采用基于局部或全局對比度的方法,來得到圖中每個像素的顯著性,進而得到顯著圖。

現有的自下而上的視覺注意計算模型中,Itti的顯著圖模型(簡稱Itti模型)最具代表性。該模型主要包含3個模塊:特征提取、顯著圖生成和注意焦點轉移。模型通過初級特征的提取,將多種特征、多種尺度的視覺空間通過中央―周邊算子得到的各個特征的顯著性圖合成一幅顯著圖。顯著圖中的各個目標通過勝者為王的競爭機制,選出唯一的注意目標,其中注意焦點的轉移用的是禁止返回機制。但該模型也有一些缺點,如顯著區與目標區域有偏差、計算量較大、運行時間較長、動態場景中實時處理不平等。

在動態場景之中,由于Itti模型很難滿足實時性的要求,科研工作者們正在努力研究動態場景的特性,并建立相應的動態模型。如Wolfe[1]指出,影響前注意的特征包括顏色、方向、曲率、尺寸、運動、深度特征、微調支距、光澤、形狀,等等,其中又以運動特征最為敏感。而You等采用了一種空間域特征和時間域特征相結合的視覺注意模型,該模型假設當場景中存在全局運動時,視覺注意對象將極少做運動。然而,許多真實的場景并不能滿足這個假設,限制了模型的適用范圍。Hang等人提出了一種運動圖的計算方法,并把運動圖作為特征之一,與顏色、亮度、方向等特征結合。這些研究關注了運動特征對視覺的影響,但是均存在一定的局限性,對于復雜的運動場景的注意焦點計算很難取得良好的效果。

我國研究者也在Itti注意模型的基礎上研究了適合動態場景中的注意模型,形成了一些理論成果。如曾志宏[2]等人提出注意焦點計算模型,鄭雅羽[3]等提出基于時空特征融合的視覺注意計算模型。這些模型都能較好地提取動態場景下的視覺目標。

4.2自上而下的任務驅動的注意模型研究及分析

自上而下的注意即任務驅動的注意,通過目標和任務的抽象知識,在一定程度上指導注意焦點的選擇。在自上而下注意模型的研究方面,Laar(1997)提出了一個用于隱式視覺注意的模型,該模型通過任務學習,將注意集中于重要的特征。Rabak[4]提出了基于注意機制的視覺感知識別模型,該模型在定義目標顯著性時,通過語義分析對其他三個自下向上的視覺控制參數項進行線性組合。Salah將可觀測馬爾科夫模型引入到模擬任務驅動的注意模型研究中,并在數字識別和人臉識別的實驗中取得了很好的效果。Itti提出以調節心理閾值函數的形式來控制視覺感知。

目前對自下而上的數據驅動方面的研究較多,而對自下而上的任務驅動方面研究較少。因為任務驅動的注意與人的主觀意識有關,同時受到場景的全局特征影響。自上而下的注意涉及記憶、控制等多個模塊的分工協作,其過程非常復雜。

5.計算機視覺注意模型研究的趨勢

自底向上和自頂向下的加工是兩種方向不同的信息處理機制,兩者的結合形成了統一的視知覺系統。人類的視覺信息處理系統只有遵循這樣的方法,才能有效地實現視覺選擇注意的目的。

實踐證明,把自底向上和自頂向下的研究相分離的研究方法并不能很好地解決計算機的視覺注意過程。要想使計算機能夠準確模擬人類的視覺注意過程,實現主動的視覺選擇注意的目的,采用兩種研究方法相結合的形式勢在必行。自底向上的視覺注意計算往往離不開與自頂向下的有機結合,實現二者的優勢互補是以后計算機視覺注意研究的一個趨勢。

參考文獻:

[1]Wolf J M,Cave K R.Deploying visual attention:the guided search model.In:Troscianko T,Blake A,eds.AI and the Eye.Chichester,UK:Wiley press,1990.

[2]曾志宏,周昌樂,林坤輝,曲延云,陳嘉威.目標跟蹤的視覺注意計算模型[J].計算機工程,2008,(23).

[3]鄭雅羽,田翔,陳耀武.基于時空特征融合的視覺注意模型[J].吉林大學學報,2009,(11).

[4]Rabak I A,Gusakova V I,Golovan A V,et al.A model of attention-guided vision perception and recognition.Vision Research,1998,38.

計算機視覺的方向范文4

【關鍵詞】Opencv;計算機視覺技術;系統;研究

隨著計算機技術的快速發展,計算機設備逐漸被應用到社會生活的各個方面,尤其是在當前計算機視覺技術和圖像處理技術快速發展的時期,各個科技領域中的計算機視覺技術已經逐漸成熟。計算機視覺技術主要是利用計算機智能化來替代人眼,即對于客觀存在的三維立體化世界的理解和識別,整個實現過程均是以計算機技術作為基礎。隨著計算機視覺技術的不斷發展,現今其已逐漸成為了一門神經生理學、計算機工程、信號學、物理學、應用數學等綜合性學科。計算機視覺技術系統其在高性能計算機基礎之上來實現對大量數據的獲取,并且通過智能算法來對獲取數據進行處理,從而完成對數據集成。

一、視頻中運動物體檢測原理

對于視頻中的運動物體檢測主要分為兩中方法,其一為宏觀檢測法;其二為微觀檢測法。宏觀檢測法是對獲得的整幅圖像進行檢測,而微觀檢測法則是對所需要的區域進行圖像檢測。視覺技術在檢測運動物體的時候,首先對圖像進行采集,并對采集的信息數據進行預處理,將圖像進行分割,然后分別提取運動物體的影象,從而實現參數的更新。圖像采集過程中采用背景差分法,實現對背景圖像的提取,其通過一定算法采用人為手段獲取沒有背景的圖像。另外在進行運動物體檢測的時候還可以采用幀間差分法,其主要是實時獲取幀圖,然后實現一幀一幀圖像比值的比較,從而獲取具有差值的圖像。運動物體進行檢測的時候需連續獲取幀圖,將這些幀圖組合起來,其實就是物體的運動軌跡,然后同分割技術就能勾勒出物體的輪廓。隨著計算機視覺技術的不斷深入研究,發現此兩種方法單獨使用仍然存在的一些缺點,于是研究人員將二種檢測方法進行融合,形成一種綜合檢測方法。綜合檢測法將兩者檢測方法的優勢進行了融合,并將其靈活的應用到了生產和生活之中,取得了十分不錯的效用。

二、基于Opencv的計算機視覺技術探究

(一)基于Opencv的運動物體檢測

運動物體在進行檢測的時候,基于Opencv的檢測原理主要為:根據物體某項特定信息,例如,顏色、輪廓、性狀等,在復雜背景中利用這些特定的信息將物體分離出來。整個圖像的分離過程首先是進行視頻流捕捉,然后是進行視頻的格式轉換,再將圖像進行預處理,從而提取前景物體,減少環境因素對圖像處理的誤差,最后根據物體特征提取,并完成對運動物體的跟蹤。從圖像中提取所需的目標物體,其實質就是對整個屋里輪廓進行檢測和分割,根據每個圖像的幀差異來進行提取。

(二)基于Opencv圖像預處理

視覺技術應用于復雜的環境之中,由于存在著光照的變化,其場景中所出現的環境因素對視頻采集設備性能影響很大。環境因素會使得獲取的圖像信息的質量降低,并且在圖像中無法避免的存在著噪點,這對于運動物體的檢測和圖像采集會造成很大的影響。當獲取視頻幀圖像之后需對其數據進行預處理,通常有平滑度濾波處理、圖像填充、圖像背景更新等。

1.平滑度濾波處理

由于在進行視頻圖像采集的時候存在著噪點,那么我們就需要對其進行噪點處理,以求減小噪聲。濾波平滑度濾波處理,其具有線性和非線性兩種方式,其中線性方式進行處理器運算簡單、運算速度快,但是在進行處理之后的圖像都會呈現不清晰的情況。而非線性方式盡心給處理之后,雖然能夠很好的減小噪點,確保信號的局部特點,但是其運算的速度會較慢。

2.圖像填充

對于幀圖像進行處理,通常采用檢測邊緣填充法或者是腐蝕膨脹法來完成,其中填充法是指當檢測出目標物體之后,利用邊緣檢測方法來對物體進行辨識,然后利用形態學的漫水填充法進行填充。圖像的腐蝕膨脹則主要是由于攝像機的性能等問題造成的。

3.實時背景更新

在進行圖像差分之前,需要對背景圖樣進行確定,并且需要對其進行初始化處理。以方便以后在進行檢測時候能夠對實時背景圖進行差分計算,只有這樣,才能夠獲得極佳的前景效果。在進行圖像差分時,首先需要根據指定法來確定第一幀背景的圖像,并將其指定為第一張背景圖片,然后在檢測過程中根據算法對背景實施更新。整個圖像在進行更新時,其主要的流程為:判斷并讀取圖像是否為第一幀;將Opencv處理的圖像轉化為單通道灰度值;將實時采集的圖像進行高斯平滑度處理,去除噪點;最后使用形態學濾波處理噪點。

(三)提取前景運動物體圖像

檢測運動物體的時候,只有在檢測流程中確保精確度,才能夠獲取滿意的前景跟蹤效果。此過程中主要分為兩個步驟,第一步為二值化圖像之后進行分割;第二步,圖像分析前處理,進行充分填充,確保前景圖的完整性。其中,前景圖的提取主要分為下面幾個步驟:首先對前景圖像和背景圖像進行差分,然后對差分的圖像進行二值化,再對背景中的前景圖像邊緣進行檢測,根據輪廓進行填充圖像。由于攝像頭存在于不同的場景和環境之中,不論是室外或者是室內隨著場景的變化都會對圖像的采集產生影響。那么在前景圖中提取目標就需要在檢測系統中采用有效手段來完成背景實時更新。

閥值二值化分割法可以對檢測的物體進行前景和背景差圖分割,從而使目標物體能夠分離出圖像,且閥值分割先要確定每個像素的點是否處于灰度范圍值之內。將圖像中的像素灰度與確定的閥值進行比較,其結果解釋所有像素點分為2類,一類像素的灰度小于閥值,另外一類就是大于閥值。閥值二值化分割時,確定分割的閥值T,然后分割圖像。選取合適的閥值進行分割,可以有效的減少光照因素影響,常用的動態閥值主要有直方圖來法與最大類方差法這另種分割方法。

三、計算機視覺三維技術

計算機視覺技術的核心為分割問題、運動分析、3D立體場景重構等,立體視覺主要是從多幅圖像的參照中獲取目標物體的三維幾何信息。計算機視覺所模擬出的3D立體畫面只需要攝像機從不同的角度同一時間針進行圖像捕獲,將2D信息進行3D重構,進而將計算機程序重建于真實的三維場景之中,以恢復物體的真實空間信息。

(一)視覺系統

視覺系統捕獲圖像的過程,實則可以看成為對大量信息進行處理過程,整個系統處理可以分為三個層次,其一,理論層次;其二,描述層次;其三,實現層次。在攝像機視覺系統之中,輸入的是2D圖像,但是輸出為3D信息,而這就可以實現對圖像的位置、距離等信息的如實描述。視覺系統分為三個進階層次,第一階段為基礎框架;第二階段為2.5D表達;第三階段為三維階段。在第二階段中實現的2.5D表達,其原理是將不完整的3D圖像信息進行表達,即以一個點為坐標,從此點看去某一些物體的部分被遮擋。第三階段的三維階段,則是人眼觀察之后可以從不同的角度來觀察物體的整體框架,從而實現了將2.5D圖像信息的疊加重合運算,進一步處理之后得到了3D圖像。

(二)雙目視覺

人們從不同角度觀看同一時間內的同一物體的時候,可以利用算法測量物體間的距離。此法被稱為雙目立體感覺,其依據的原理是視覺差原理,利用兩臺攝像機或者一臺攝像機,對兩幅不同的圖像進行不同角度觀察,并且對其觀察的數據進行對比分析。實現雙目立體視覺與平面視覺圖像獲取,其主要的步驟為:

(1)圖像獲取

從兩臺不同的攝像機,捕獲幀圖像,由于環境因素會造成圖像差異困難。為了更好的跟蹤目標、檢測,當捕獲圖像之后,需要對圖像進行預處理。

(2)攝像標定方式

獲得真實坐標系中的場景點中的與平面成像點占比見的對應關系,借用三維立體空間中的三維坐標,標定之后確定攝像機的位置以及屬性參數,并建立起成像的模型。

(3)特征提取方式

所謂的特征提取方式主要是為了提升檢測、跟蹤目標的準確性,需要對目標物體進行特征提取,從而實現對圖像分割提取。

(4)深度計算

深度信息主要是根據幾何光學原理,從三維世界進行客觀分析,因為距離會產生不同的位置,會使得成像位置與兩眼視網膜上有所不同。簡單來說,客觀景物的深度可以反映出雙目的視覺差,而利用視覺差的信息結合三角原理進行計算,可呈現出深度的圖像信息。

(三)攝像機模型

攝像機在標定過程中確定了其建立的基礎為攝像機的模型,攝像機模型在標定過程中關系到三個不同坐標系的轉換,分別為2D圖像平面坐標系、攝像機自身坐標系以及真實的世界坐標系。攝像機在攝像的時候起本質是2D圖像坐標轉換,首先要定義攝像機的自身坐標系,將坐標系的原點設置為光心,X、Y、Z成立三維坐標系。其次則是建立平面的圖像坐標系,用以透視模型表示,其原點也在廣心的位置,稱之為主點。實際應用中,物理的距離光心的位置d≠f焦距,而且會遠遠大于焦距,為了解決如此問題就提出了平面概念。在光軸z上設置一個虛擬的圖像平面,然后在此位置于平面關于光心對稱。接著,在設置的虛擬2D坐標系中,光軸和原點重合,并且攝像機與垂直平面的垂直方向相同,真實圖像上的點影射到攝像機坐標系。

(四)3D重構算法

視頻流的采集,主要是采用Kinect設備、彩色攝像頭、紅外發射攝像頭、紅外接收攝像頭。使用微軟提供API控制Kinect設備,在操作之前需調用NUI初始化函數,將函數的參數設置為用戶信息深度圖數據、彩色圖數據、骨骼追蹤圖數據、深度圖數據。上述的視頻流的打開方式不同,既可以是一種打開方式,也可以是多種打開方式,尤其在進行Kinect傳輸數據處理的時候,需遵循三條步驟的運行管線。此三條管線分別為:第一條為處理彩色和深度數據,第二條為根據用索引添加顏色信息,并將其放入到深度圖之中,第三條為骨骼追蹤數據。

四、總結

隨著計算技術的快速發展,視覺技術逐漸被廣泛的應用于我們日常的研究之中。本文通過對視覺技術的相關問題進行分析,探究了圖像處理、分割、前景提取、運動物體觀測以及重構3D圖等問題,為實現視覺技術更加深入研究做出了相應的貢獻;為廣大參與計算機視覺技術研究同仁提供一個研究的思路,為實現視覺技術的騰飛貢獻薄力。

參考文獻

[1]張???基于Opencv的人手識別與跟蹤定位技術研究與實現[D].云南大學,2013.

計算機視覺的方向范文5

關鍵詞:三目攝像機;標定;立體視覺;外部參數

一、緒論

1.1研究的背景及意義

計算機視覺是當今極為重要的學科之一,它在具有很強的挑戰性的同時又擁有廣泛的應用前景和實用價值。計算機視覺以視覺理論為中心,以圖像處理、模式識別、計算機技術和生理學、心理學為基礎,研究內容主要有兩個方面:一是開發從輸入圖像數據自動構造場景描述的圖像處理系統;二是理解人類視覺機理,用機器代替人去做人類難以達到或根本無法達到的工作[1]。

計算機視覺應用的廣泛性體現在其不僅用于文字、指紋、面部、商標以及圖像數據庫、檢測集成電路芯片、多媒體技術這些圖像方面,還應用到機器人導航、工業檢測和產品的自動裝配、CT圖像器官重建和遙感照片解釋等空間物體的定位、識別以及重建上?,F如今,計算機視覺已經應用到機器人、地理、醫學、物理、化學、天文等各大的研究領域。

作為多個學科交叉與融合中心的計算機視覺,攝像機是其研究的重要工具,而攝像機標定又是計算機視覺研究的一個關鍵問題,故攝像機的標定越來越受到廣泛的重視。攝像機標定是通過物體空間上的點與圖像中的對應點的幾何關系,來確定攝像機的內外參數的過程。標定結果是否準確影響著三維測量的精度和三維重建的結果,而且實時的標定更能滿足自動導航機器視覺的需要[2]。

伴隨著應用的發展,攝像機廣泛地被應用于三維立體的測量、視覺檢測、運動檢測等領域。由此,對攝像機標定的精度要求也日益增加。攝像機標定結果的優劣影響了計算機視覺在各領域的應用。攝像機標定的準確與否,對能否提高計算機視覺在各領域測量的準確度有重要影響[3]。因此,研究攝像機標定方法具有重要的理論研究意義和實際應用價值。

1.2攝像機標定技術研究的發展及現狀

攝像機有一個圖像平面和提供三維空間到圖像平面轉換的鏡頭。由于鏡頭會產生畸變,不能把這個轉化過程簡單描述為投射變換。所以它表示的是畸變的模型,這些模型近似于真實數據,而其精確性則依靠于建立的模型及模型參數的準確性。

首先進行攝像機標定工作的是加拿大的Deville,他于1910年建立實驗室,使用多個瞄準儀對他的“測量攝像機”(surveying camera)進行標定[4]。上個世紀三十年代后期,美國標準局發明了一種精確鏡頭,用來檢測攝像機,同時將它用在攝像機標定上。四十年代后期,該項工作得到進一步加深,有了更多對高精度的需求和對易操作設備的需求。1955年,Carman出版了 《棋盤平面度的干涉測量和控制》,該書引起了社會各界對攝像機標定的關注。二戰時期,隨著飛機的大規模使用,航空攝影與制圖興起,為得到更加精確的測量結果,對攝像機鏡頭的校正要求也變得更高。五十到七十年代也是鏡頭校正技術發展最為迅速的時間段。在這期間,各種鏡頭像差的表達式逐步被提出并且得到普遍認同與采用,建立了很多的鏡頭像差的模型,D.C.Brown等人作出了比較大的貢獻,他們導出了近焦距情況下給定位置處徑向畸變表達式并證明了近焦距情況下測量出鏡頭兩個位置的徑向畸變就可以求出任何位置的徑向畸變[5]。這些徑向與切向像差表達式成為后來各攝像機的標定非線性模型的基礎。這段時間里,研究的重點是如何校正鏡頭與用何種方法補償鏡頭像差,這些研究對促進各性能鏡頭組的研制起到了重要作用。在1999年,張正友提出了一種簡便的攝像機標定方法,該方法介于傳統標定和自標定之間,操作方便靈活,能夠得到不錯的精度,滿足了眾多擁有桌面視覺系統的用戶在攝像機標定方面的需求。

1.3本文的主要研究內容

本文的主要研究多個攝像機的標定問題。標定主要是對攝像機內外參的測量計算,利用這些參數對多個攝像機識別的物體尺寸進行衡量并建立起多攝像機系統的數字環境。

論文的內容包括:

第一章為緒論,介紹攝像機標定相關的研究背景、國內外研究現狀。

第二章為攝像機標定理論基礎:主要介紹標定的坐標系與待標定的參數。

第三章提出本文的多攝像機標定方法與實驗過程。

第四章進行全文的總結。

二、攝像機標定方法研究

2.1攝像機標定原理

攝像機通過透鏡將三維物體投影到--維圖像平面上,這個成像變換的過程稱為攝像機成像模型。攝像機成像模型有多種,最常用的為小孔成像模型。由于實際的攝像機鏡頭會發生一定的畸變,使得空間點所成的像不在線性模型描述的位置而會發生一定的偏移,為了能準確的標定攝像機參數,標定的過程中要考慮非線性畸變因子。

一般來說,得到標定結果后要對其精度進行評估,然而很難得到準確的攝像機標定參數真值作為參考,其中基于圖像坐標和世界坐標的絕對和相對誤差的評價方法應用廣泛,本文將對這些方法的原理進行探討。

2.2攝像機標定坐標系建立

首先定義了四個坐標系,如圖1所示,圖像坐標系的坐標原點為O0,列與行由坐標軸u和v表示;成像平面坐標系的原點是攝像機光軸與圖像坐標系的交點0l,x、y 軸分別與u、v 軸平行;在攝像機坐標系中,坐標原點0c即為在攝像機的光心,Xc、Yc軸與x、y 軸平行,與圖像平面垂直是攝像機光軸作為Zc軸,0c0l為攝像機焦距f;世界坐標系是假想的參考坐標系,可固定于場景中某物體上,用于描述攝像機的位置,由Xw,Yw,Zw軸組成。

圖(1)

2.3攝像機外部參數構成

主動視覺傳感器從在笛卡爾直角坐標系中的運動表現為相應的旋轉矩陣和平移矩陣,故攝像機外部參數表現為旋轉矩陣R和平移矩陣T,則攝像機坐標系與世界坐標系的轉化關系可以表示成:

上式中(Xc,Yc,Zc)表示空間點在攝像機坐標系下的坐標,(Xw,Yw,Zw)表示空間點在世界坐標系下的坐標。根據靶標點在像空間坐標系和物方空間坐標系中的坐標,通過分解旋轉矩陣線性計算像空間坐標系與物方空間坐標之間的轉換參數,即外方位元素(攝站參數)[6]。

2.4各攝像機相對位置確定

三目攝像機擁有三個視覺傳感器,而三個傳感器之間的相對位置可通過已獲得的外部參數進行確定。將三個攝像機坐標系設置為,Oci xci yci zci(i=1,2,3),由2.3中所介紹的內容可知,這三個攝像機坐標系與世界坐標系的關系為:

i=(1,2,3)

由此我們可以得到任意兩個攝像機i,j的坐標系轉換關系:

其中: = = i,j=1,2,3

三、攝像機標定實驗過程及結果

3.1實驗系統介紹

實驗中被用來標定的是一個多攝像機系統,攝像機標定有關的基本參數、系統組成和開發環境如下:

(1)硬件環境

標定板、三目攝像機和圖像采集卡等。

(2)軟件環境

OpenCV開源視覺庫,它僅由一系列C函數和少量C++類構成,為Python、MATLAB等語言提供了接口,在圖像處理和計算機視覺方面實現了很多通用算法。

3.2實驗過程

本系統以棋盤格模板作為標定模板。采用激光打印機打印棋盤格黑白方塊間隔紙,方塊邊長為3cm,共6行9列,將打印紙固定在一塊平板上,作為標定模板,如圖(2)。安裝三目攝像機系統,調節固定好個攝像機位置,如圖(3)。手持標定板在三目攝像機前方各個位置拍攝5組共15張各姿態的照片,利用Canny算子進行像點灰度中心提取、同名像點匹配并解算出三個攝像機在標定板坐標系中的外部參數值。

3.3標定結果

攝像機1:

R= T=

攝像機2:

R= T=

攝像機3:

R= T=

四、總結

隨著計算機技術的高速發展,計算機視覺成為當今熱門的研究課題,受到了廣泛關注。本文就如何在機器視覺的理論基礎上對三目視覺系統進行標定進行了研究,討論了計算機視覺理論知識,分析攝像機標定原理以及標定坐標系的建立。同時通過計算機視覺知識的分析討論了基于三目視覺系統的攝像機標定技術,完成了三目視覺系統的外部參數標定實驗。三目攝像機測量系統外部參數的標定能夠解決測量作業現場、測量控制場建立難的問題,為快速地建立簡單實用的控制場提供了方案,有一定的實用價值。

參考文獻

[1] 荊麗秋.雙目視覺系統標定與匹配的研究與實現[D].哈爾濱工程大學,2009.DOI:10.7666/d.y1489086.

[2] 馬頌德.計算機視覺―計算理論與算法基礎[M].北京:科學出版社,1998.

[3] 王榮一.攝像機標定及關鍵技術研究[D].哈爾濱理工大學,2011.DOI:10.7666/d.y2012483.

[4] Clarke T A,Fryer J G.The development of camera calibration methods andmodels.Photogrammetric Record,1998,16(91):51-66

[5] Brown D C.Decentering distortion of lenses.Photogrammetric Engineering,1 966,32(3):444-462.

[6] 范亞兵,黃桂平,高寶華等.三目立體工業攝影測量系統外部參數的快速標定[J].測繪工程,2012,21(5):48-52.DOI:10.3969/j.issn.1006-7949 .2012.05.013

計算機視覺的方向范文6

國內人工智能產業鏈解構

基礎技術、人工智能技術和人工智能應用構成了人工智能產業鏈的三個核心環節,我們將主要從這三個方面對國內人工智能產業進行梳理,并對其中的人工智能應用進行重點解構。

人工智能的基礎技術主要依賴于大數據管理和云計算技術,經過近幾年的發展,國內大數據管理和云計算技術已從一個嶄新的領域逐步轉變為大眾化服務的基礎平臺。而依據服務性質的不同,這些平臺主要集中于三個服務層面,即基礎設施即服務(IaaS)、平臺即服務(PaaS)和軟件即服務(SaaS)?;A技術提供平臺為人工智能技術的實現和人工智能應用的落地提供基礎的后臺保障,也是一切人工智能技術和應用實現的前提。

對于許多中小型企業來說,SaaS 是采用先進技術的最好途徑,它消除了企業購買、構建和維護基礎設施和應用程序的需要;而 IaaS通過三種不同形態服務的提供(公有云、私有云和混合云)可以更快地開發應用程序和服務,縮短開發和測試周期;作為 SaaS 和 IaaS 中間服務的 PaaS 則為二者的實現提供了云環境中的應用基礎設施服務。

人工智能技術平臺

與基礎技術提供平臺不同,人工智能技術平臺主要專注于機器學習、模式識別和人機交互三項與人工智能應用密切相關的技術,所涉及的領域包括機器視覺、指紋識別、人臉識別、視網膜識別、虹膜識別、掌紋識別、專家系統、自動規劃、智能搜索、定理證明、博弈、自動程序設計、智能控制、機器人學習、語言和圖像理解和遺傳編程等。

機器學習:通俗的說就是讓機器自己去學習,然后通過學習到的知識來指導進一步的判斷。我們用大量的標簽樣本數據來讓計算機進行運算并設計懲罰函數,通過不斷的迭代,機器就學會了怎樣進行分類,使得懲罰最小。這些學到的分類規則可以進行預測等活動,具體應用覆蓋了從通用人工智能應用到專用人工智能應用的大多數領域,如:計算機視覺、自然語言處理、生物特征識別、證券市場分析和DNA 測序等。

模式識別:模式識別就是通過計算機用數學技術方法來研究模式的自動處理和判讀,它偏重于對信號、圖像、語音、文字、指紋等非直觀數據方面的處理,如語音識別,人臉識別等,通過提取出相關的特征來實現一定的目標。文字識別、語音識別、指紋識別和圖像識別等都屬于模式識別的場景應用。

人機交互:人機交互是一門研究系統與用戶之間交互關系的學問。系統可以是各種各樣的機器,也可以是計算機化的系統和軟件。在應用層面,它既包括人與系統的語音交互,也包含了人與機器人實體的物理交互。

而在國內,人工智能技術平臺在應用層面主要聚焦于計算機視覺、語音識別和語言技術處理領域,其中的代表企業包括科大訊飛、格靈深瞳、捷通華聲(靈云)、地平線、SenseTime、永洪科技、曠視科技、云知聲等。

人工智能應用

人工智能應用涉及到專用應用和通用應用兩個方面,這也是機器學習、模式識別和人機交互這三項人工智能技術的落地實現形式。其中,專用領域的應用涵蓋了目前國內人工智能應用的大多數應用,包括各領域的人臉和語音識別以及服務型機器人等方面;而通用型則側重于金融、醫療、智能家居等領域的通用解決方案,目前國內人工智能應用正處于由專業應用向通用應用過度的發展階段。

(1)計算機視覺在國內計算機視覺領域,動靜態圖像識別和人臉識別是主要研究方向

圖像識別:是計算機對圖像進行處理、分析和理解,以識別各種不同模式的目標和對像的技術。識別過程包括圖像預處理、圖像分割、特征提取和判斷匹配。

人臉識別:是基于人的臉部特征信息進行身份識別的一種生物識別技術。用攝像機或攝像頭采集含有人臉的圖像或視頻流,并自動在圖像中檢測和跟蹤人臉,進而對檢測到的人臉進行臉部的一系列相關技術,通常也叫做人像識別、面部識別。

目前,由于動態檢測與識別的技術門檻限制,靜態圖像識別與人臉識別的研究暫時處于領先位置,其中既有騰訊、螞蟻金服、百度和搜狗這樣基于社交、搜索大數據整合的互聯網公司,也有三星中國技術研究院、微軟亞洲研究院、Intel中國研究院這類的傳統硬件與技術服務商;同時,類似于 Face++ 和FaceID 這類的新興技術公司也在各自專業技術和識別準確率上取得了不錯的突破。

而在難度最大的動態視覺檢測領域,格靈深瞳、東方網力和 Video++ 等企業的著力點主要在企業和家庭安防,在一些常見的應用場景也與人臉識別技術聯動使用。

(2)語音/語義識別

語音識別的關鍵基于大量樣本數據的識別處理,因此,國內大多數語音識別技術商都在平臺化的方向上發力,希望通過不同平臺以及軟硬件方面的數據和技術積累不斷提高識別準確率。

在通用識別率上,各企業的成績基本維持在 95% 左右,真正的差異化在于對垂直領域的定制化開發。類似百度、科大訊飛這樣的上市公司憑借著深厚的技術、數據積累占據在市場前列的位置,并且通過軟硬件服務的開發不斷進化著自身的服務能力;此外,在科大訊飛之后國內第二家語音識別公有云的云知聲在各項通用語音服務技術的提供上也占據著不小的市場空間。值得注意的是,不少機器人和通用硬件制造商在語音、語義的識別上也取得了不錯的進展,例如智臻智能推出的小 i 機器人的語義識別、圖靈機器人的個性化語音助手機器人和服務、被 Google 投資的出門問問的軟硬件服務。

(3)智能機器人

由于工業發展和智能化生活的需要,目前國內智能機器人行業的研發主要集中于家庭機器人、工業企業服務和智能助手三個方面其中,工業及企業服務類的機器人研發企業依托政策背景和市場需要處于較為發達的發展階段,代表性企業包括依托中科院沈陽自動化研究所的新松機器人、聚焦智能醫療領域的博實股份,以及大疆、優愛寶機器人、Slamtec 這類專注工業生產和企業服務的智能機器人公司。在以上三個分類中,從事家庭機器人和智能助手的企業占據著絕大多數比例,涉及到的國內企業近 300 家。

(4)智能家居

與家庭機器人不同,智能家居和物聯企業的主要著力點在于智能設備和智能中控兩個方面。在這其中,以海爾和美的為代表的傳統家電企業依托自身渠道、技術和配套產品優勢建立起了實體化智能家居產品生態. 而以阿里、騰訊、京東、小米和樂視等互聯網企業為代表的公司則通過各自平臺內的數據和終端資源提供不同的軟硬件服務。

值得關注的是,科沃斯、broadlink、感居物聯、風向標科技、歐瑞博、物聯傳感和華為等技術解決方案商在通用硬件和技術、系統級解決方案上已成為諸多智能家居和物聯企業的合作伙伴。綜合來看,智能家居和物聯企業由于市場分類、技術種類和數據積累的不同各自提供著差異化的解決方案。在既定市場中,沒有絕對意義上的排斥競爭,各企業之間的合作融合度較強。

(5)智能醫療

目前國內智能醫療領域的研究主要集中于醫療機器人、醫療解決方案和生命科學領域。由于起步較晚和技術門檻的限制,目前國內醫用機器人的研發水平和普及率相較于國際一線水平仍存在一定的差距,從事企業主要集中與手術機器人和康復機器人兩大領域,以新松機器人、博實股份、妙手機器人、和技創等企業為代表。

在醫療解決方案方面,以騰訊、阿里巴巴、百度和科大訊飛為代表的公司通過和政府、醫療機構的合作,為腦科學、疾病防治與醫療信息數據等領域提供智能解決方案。而在生命科學領域,研究的著眼點在以基因和細胞檢測為代表的前沿研究領域。

綜合來看,國內人工智能產業鏈的基礎技術鏈條已經構建成熟,人工智能技術和應用則集中在人臉和圖像識別、語音助手、智能生活等專用領域的場景化解決方案上。就趨勢來看,未來國內人工智能領域的差異化競爭和突破將主要集中在人工智能相關技術的突破和應用場景升級兩個層面。

未來國內人工智能行業發展的五大趨勢

(1)機器學習與場景應用將迎來下一輪爆發

根據 Venture Scanner 的統計,截至 2015 年 9 月,全球人工智能領域獲得投資的公司中,按照平均融資額度排名的五大業務依次是:機器學習(應用類)、智能機器人、計算機視覺(研發類)、機器學習(研發類)和視頻內容識別等。

自 2009 年以來,人工智能已經吸引了超過 170 億美元的投資。過去四年間,人工智能領域的民間投資以平均每年 62% 的增長速率增加,這一速率預計還會持續下去。而在 2015 年,全球人工智能領域的投資占到了年度總投資的 5%,盡管高于 2013 年的2% ,但相比其他競爭領域仍處于落后位置。

目前中國地區人工智能領域獲得投資最多的五大細分領域是計算機視覺(研發類)、自然語言處理、私人虛擬助理、智能機器人和語音識別。從投資領域和趨勢來看,未來國內人工智能行業的資本將主要涌向機器學習與場景應用兩大方向。

(2)專用領域的智能化仍是發展核心

基于 GPU(圖形處理器)計算速度(每半年性能增加一倍)和基礎技術平臺的飛速發展,企業對于人工智能神經網絡的構建取得了前所未有的突破。但是,由于人工智能各領域技術和算法的復雜性,未來 20 年內人工智能的應用仍將集中于人臉和圖像識別、語音助手和智能家居等專用領域。

通過上述產業鏈環節構成和投資分類可以看出,優勢企業的核心競爭力主要集中于特定領域的專用技術研發;其中,計算機視覺和語音識別領域的研發和應用已處于國際一流水平,專業應用機器人的研發也有望近 10 年內迎來突破性發展??梢灶A見的是,在由專業領域向通用領域過渡的過程中,自然語言處理與計算機視覺兩個方向將會成為人工智能通用應用最大的兩個突破口。

(3)產業分工日漸明晰,企業合作大于競爭

隨著專用領域應用開發的成熟和差異化技術門檻的存在,國內人工智能產業將逐漸分化為底層基礎構建、通用場景應用和專用應用研發三個方向。

在底層基礎構建方面,騰訊、阿里巴巴、百度、華為等企業依托自身數據、算法、技術和服務器優勢為行業鏈條的各公司提供基礎資源支持的同時,也會將自身優勢轉化為通用和專業應用領域的研究,從而形成自身生態內的人工智能產業鏈閉環。

在通用場景應用方面,以科大訊飛、格靈深瞳和曠視科技為代表的企業將主要以計算機視覺和語音識別為方向,為安防、教育和金融等領域提供通用解決方案。而在專用應用研發方面則集中了大部分硬件和創業企業,這其中既包括以小米和 broadlink 為代表的智能家居解決方案商,也包含了出門問問、linkface 和優必選這類的差異化應用提供商。

總的來說,由通用領域向專業領域的進化離不開產業鏈條各核心環節企業的相互配合,專用領域的競爭盡管存在,但各分工層級間的協作互通已成為多數企業的共識。

(4)系統級開源將成為常態

任何一個人工智能研究分支都涉及到異常龐大的代碼計算,加上漏洞排查與跨領域交叉,任何一家企業都無法做到在封閉環境內取得階段性突破的可能??梢钥吹降内厔菔?,Google、微軟、Facebook 和雅虎等視人工智能為未來核心競爭力的頂級企業都先后開放了自身的人工智能系統。

需要明確的一點是,開源并不代表核心技術和算法的完全出讓,底層系統的開源將會讓更多企業從不同維度參與到人工智能相關領域的研發,這為行業層面新產品的快速迭代和共同試錯提供了一個良性且規范化的共生平臺。于開放企業而言,這也確保了它們與行業最新前沿技術的同步。

(5)算法突破將拉開競爭差距

作為人工智能實現的核心,算法將成為未來國內人工智能行業最大的競爭門檻。以 Google 為例,Google 旗下的搜索算法實驗室每天都要進行超過 200 次的改進,以完成由關鍵字匹配到知識圖譜、語義搜索的算法創新。

在未來競爭的重點機器學習領域,監督學習、非監督學習和增強學習三個方面算法的競爭將進入白熱化階段。而正是算法層面的突破造就了騰訊優圖、科大訊飛和格靈深瞳等企業在圖像識別和計算機視覺領域取得了突破性進展和國際一線的技術水平。

但就目前國內人工智能算法的總體發展而言,工程學算法雖已取得階段性突破,但基于認知層面的算法水平還亟待提高,這也是未來競爭的核心領域。

總的來看,雖然基礎技術的成熟帶來了存儲容量和機器學習等人工智能技術的提升,但由于現階段運算能力以及大規模 CPU 和GPU 并行解決方案的局限,目前國內人工智能的發展主要集中于計算機視覺、語音識別、智能生活等方向上。

雖然專用化領域的場景應用仍是目前研發和投資的核心,但隨著技術、數據的積累演化以及超算平臺的應用,由專用化領域的場景應用向語音、視覺等領域的通用化解決方案應該在未來 20 年內成為發展的主流。

亚洲精品一二三区-久久