計算機視覺的概念范例6篇

前言:中文期刊網精心挑選了計算機視覺的概念范文供你參考和學習,希望我們的參考范文能激發你的文章創作靈感,歡迎閱讀。

計算機視覺的概念

計算機視覺的概念范文1

關鍵詞:計算機視覺;研討式教學;小組探討;課前回顧

作者簡介:陳芳林(1983-),男,湖南株洲人,國防科學技術大學機電工程與自動化學院,講師;周宗潭(1969-),男,河南洛陽人,國防科學技術大學機電工程與自動化學院,教授。(湖南 長沙 410073)

中圖分類號:G643.2 文獻標識碼:A 文章編號:1007-0079(2013)26-0065-02

進入21世紀,創新型人才的培養成為各國政府和高等教育界關注的一個焦點。世界各國研究型大學的共同特點是在研究生教育階段致力于培養富有創新意識和創新能力的高級人才。[1]研討式教學是培養研究生創新精神、科研能力的有效途徑,教師講解與學生探討兩部分相結合是研討式教學采用的主要模式。[2]將課程分成兩部分之后,教師講解的時間就必須壓縮,教師一方面需要思考如何在較短的時間內完成課程的講解,同時還需要考慮課程講解要與學生探討部分緊密結合。因此,如何上好研討式教學教師講解這部分課,越來越受高等院校的重視。本文針對筆者教授工科研究生課程“計算機視覺”的實踐與經驗,闡述了筆者對于如何上好研討式教學教師講解這部分課的個人體會??偨Y為兩點:第一,首先要充分做好課程準備;第二,上課環節采取回顧—案例—小結的講解方式。下面從課程準備、課前回顧、課程講解、課后小結四個方面分別闡述(如圖1所示)。

一、“計算機視覺”課程準備

要上好一門研討式教學的課程,一定要結合該門課程的特點,量身定制課程內容,進行精心準備。本節先介紹“計算機視覺”課程的特點,然后結合該門課程的特點,介紹筆者對于“計算機視覺”的課程準備。

1.“計算機視覺”課程特點

“計算機視覺”是“數字圖像處理”和“模式識別”等課程的后續課程。該課程重點在于圖像或者圖像序列的分析理解。課程知識在機器人導航、偵查、測繪、測量、精密加工和目標跟蹤等多個領域都有廣泛的應用。[3]近年來基于視覺信息的控制反饋也開始受到廣泛關注。國內高校一般都為研究生開設了此門課程。

計算機視覺技術應用廣泛、算法原理涉及面廣:涉及到概率與數理統計、信號與系統、圖像等基礎知識?!坝嬎銠C視覺”是一門重要的控制類、電子類及計算機類專業研究生的選修課程,它內容廣泛、綜合性強,研討能力的培養顯得非常關鍵。

2.課程準備

首先,結合“計算機視覺”課程內容廣泛、技術日益更新和豐富的特點,將課程36學時分為12次課,每次課為3小時,每堂課教師講解一個專題。這種設計,一方面可以更廣地涉及計算機視覺的各個領域;另一方面以專題的形式來講解,可以將學生帶入到該專題,介紹基本背景、理論、知識和方法,讓學生有一個初步的了解,方便課后學生對感興趣的專題進一步深入挖掘與研究。

其次,在課程開始之前,教師仔細統籌,安排好每次課的專題,這樣既方便學生一開始對整個課程有一個整體的了解,也方便學生選擇課堂研討的題目與內容。根據12個專題,將各個專題講解的內容與課件在開課之前準備好,這樣有利于把握各個專題之間的前后承接關系。例如,“區域”與“分割”是既有區分又有聯系的兩個專題,在課程開始之前,將課件準備好,就有利于宏觀把握,在“區域”專題提到的分割算法,就不需要在“分割”專題再次重復,而在“分割”專題可以結合前面“區域”專題進行互相補充,以幫助學生融會貫通。

最后,在每個專題上課之前,再對課件進行精雕細琢,主要是對內容分好層次,對方法進行分類,力圖在較短的時間內,讓學生對該專題有較全面的認識。例如,在講解圖像分割時,由于圖像分割方法非常多,可以將分割方法分為若干個大類,每個大類只講1~2個方法。這樣既可以盡可能涉及更廣的領域,又可以提高講解的效率。

二、“計算機視覺”課前回顧

課前回顧是指每堂課的前面一小段時間用來回顧上一堂課的內容。雖然課前回顧時間非常短,一般為3~8分鐘,但是課前回顧是課堂教學中的一個重要環節。課前回顧可以幫助學生加強將要學習的內容與已學過內容之間的聯系。通過課前回顧,學生可以回憶前續課程所講解的概念、理論、算法的步驟等內容,有助于解決新問題或者理解新知識。

課前回顧最重要的是既要復習前續課程的內容,又要注意將前續內容與當前內容聯系起來。由于講解時間有限,要使研討式教學的教師講解部分效率高,教師幫助學生回憶上堂課的概念、模型、算法等內容,就變得非常重要。如果不做課前回顧,那么當講到某處新知識時,往往需要停下來,將前續課程再講一遍,否則學生無法理解新的知識,這樣就降低了教學的效率。

課前回顧的時間,一般以3~8分鐘為宜。課前回顧的形式可以多樣化,如講解課后作業、回顧概念、提問等。筆者認為應根據當天課程與前續課程的關系,采取合適的方式。各種方式結合使用,提高課前回顧的效率。

三、“計算機視覺”課程講解——案例教學

案例教學已經成功地應用于數學、計算機科學等領域的教學。通過案例,學生可以很快地掌握相應的概念、算法的步驟等,從而提高教師講解部分的效率。[4]例如,在講解馬爾科夫隨機場時,筆者通過案例式教學,將馬爾科夫隨機場用一個生活中的例子來向學生解釋。首先,將馬爾科夫隨機場分解成兩個重要的概念,分別是隨機場與馬爾科夫性,然后將它們對應到例子中,幫助學生理解。

隨機場包含兩個要素:位置(site)和相空間(phase space)。當給每一個“位置”中按照某種分布隨機賦予“相空間”的一個值之后,其全體就叫做隨機場(如圖2(a))。[5]這個概念非常抽象,難以理解。筆者應用案例式教學,拿莊稼地來打比方。“位置”好比是一畝畝農田,“相空間”好比是種的各種莊稼。給不同的地種上不同的莊稼,就好比給隨機場的每個“位置”,賦予“相空間”里不同的值。所以,可以形象地理解隨機場就是在哪塊地里種什么莊稼的布局(如圖2(b))。

馬爾科夫性指的是一個隨機變量序列按時間先后順序依次排開時,第N+1時刻的分布特性,與N時刻以前的隨機變量的取值無關。為了更直觀地理解馬爾科夫性,筆者仍然拿莊稼地打比方,如果任何一塊地里種的莊稼的種類僅僅與它鄰近的地里種的莊稼的種類有關,與其他地方的莊稼的種類無關,這種性質就是馬爾科夫性。

符合上述兩個特征,那么這些地里種的莊稼的集合,就是一個馬爾科夫隨機場。通過案例式教學,筆者發現可以加深加快學生對課程內容的理解,提高教師講解環節的效率。

四、課后小結

課后小結指的是一堂課將要結束時,教師對本堂課進行一個簡短的總結。許多成功的教師都會在其教學中堅持課后小結這個環節,給學生一個總體的印象,以幫助學生消化本次課程的內容。

研討式教學教師講解部分的課后小結與普通教學方式應有所區別。筆者認為這主要是因為通過課后小結可以將本次課程所講內容與學生的研討環節結合起來,而不僅僅是對內容進行簡單的總結。

為了達到課后小結使本次課程內容與學生探討環節建立聯系的目的,筆者在教學中常采用如下方式:首先,像普通教學方式一樣,總結本次課程內容;然后,在此基礎上,拋出若干問題,這些問題,不需要學生馬上解答,而是留給學生課后思考,提供他們選擇研討主題的素材;最后,介紹其他在本次課程中沒有涉及到的前沿知識、方法與理論,拓寬學生的視野,從而增加學生選擇探討主題的覆蓋面。

通過應用這種方式,筆者發現學生的思維更開闊,在探討環節,學生往往可以選擇一些比較新穎的主題(例如視頻中不動點的檢測等),而不僅僅局限于教師所講內容,從而提高了研討式教學的效果。

五、結論

在“計算機視覺”課程中引入研討式教學,通過總體設計規劃好整門課程內容,課堂講解注意采用回顧—案例—小結的方式,筆者對如何上好研討式教學教師講解這部分課進行了個人經驗的總結。通過本次教學改革,筆者體會到如果要提高教學效果,一定要注意教師講解與學生探討兩個環節的緊密結合。

參考文獻:

[1]侯婉瑩.我國研究型大學本科生科研研究[D].濟南:山東大學,

2009.

[2]張晴,李騰,韋艷,等.研討式教學模式的理論研究[J].中國科技縱橫,2011,(10).

[3]D.H .巴拉德.計算機視覺[M].北京:科學出版社,1987.

計算機視覺的概念范文2

關鍵詞:計算機;交通監管系統;視覺

中圖分類號:TP277

近年來,道路交通安全問題因公路交通事業的快速發展而受到越來多關注。據2002年世界銀行統計,全球平均每年死于道路交通事故高達117萬人。而在中國,據2008年公安部交通管理局公布的數據顯示,全國道路交通事故多達265204起,死亡人數為73484人。

全國道路交通事故防御工作隨公路里程、機動車保有量、道路交通流量、駕駛人數的增加成遞增趨勢。而通過必要的技術手段構建交通安全保障機制,降低交通事故是重中之重。若要好的為基礎的交通違規行為檢測技術的不斷更新,市場上已出現了自動檢測與記錄的商業化產品,能實時記錄出闖紅燈、違規超車、違規停車、超速、逆行等違規行為。然而,我國高速交通監控體系仍比較落后,大多在交叉路口設置電子警察系統以此檢測車輛闖紅燈的違規行為。交通管理部門并不能對出現違規行為的車輛進行及時的交通管制和處理,概括來說管理與檢測仍處于管理誤區與盲目狀態。針對該現象,文本研究了基于計算機的交通監管系統設計與實現。

1 智能交通管理系統簡介

ITS系統,該系統綜合先進的現代計算機網絡技術、信息電子通訊技術、現代信息技術以及自動控制技術等,并將其在整個交通運輸管理體系進行有效的運用,為此建立起一種實時、有效、準確、范圍廣的全方位發揮作用的交通運輸控制體系和綜合管理系統。近幾年人流、車流隨著城市發展而猛增,交通職能部門對更加智能的交通管理系統的需求越來越急迫。所以,ITS成為21世紀地面交通管理、運輸科技、運營的主要研究方向,帶領著交通運輸一場偉大的變革。北美、西歐、日本自上世紀80年代末就開始競相發展智能運輸系統,并制定相應的開發計劃加以實施,而發展中國家也開始對ITS系統的全面研究與開發。

2 認識基于計算機視覺的智能交通監控系統

2.1 計算機視覺技術

所謂計算機視覺,理解為使用可替代人眼的高清攝影機設備或其他現代高清電子影像攝錄裝備進行觀察,實現對目標的追蹤定位、圖像識別、模擬數據測量等,并對采集的視覺數據信息送達遠端計算機服務器,通過計算機服務器的信號圖形圖像處理技術對視頻數據信息進行進一步加工,實現三維重現現實情景的計算機觀察呈現技術。

2.2 智能交通監測系統

通過使用現有的、先進的計算機智能化、視覺化、信息化科技對國內各大路況交通運輸實施監測,為工作于交通運輸人員呈現數據信息的自動化采集、分析、處理等的智能化服務,且該交通管理系統存在一定自作能力和指揮能力,即為智能交通系統。隨著道路、車輛的飛速發展,人民生活水平及國民生產總值的不斷提高,智能交通系統,在國內外受到越來越多的青睞。近幾年,各道路關鍵路段、路口隨著道路監控機制的普遍建立,也都基本完成了視頻監控。

2.3 基于計算機視覺的智能交通監控機制

根據前面2.1對計算機視覺技術和2.2對智能化交通監控系統概念的解析與理解,可總結出以計算機視覺為基礎的智能化交通監控機制,其是通過現代高端計算機對視覺信息收集、提取、處理、分析等技術,實現對城市道路交通信息的實時監控、視頻數據的收集、信息分析處理,并對城市交通狀況使用智能交通機制狀況,并通過視頻影像引導車輛行駛,以此降低或避免各種各樣交通事故發生的智能化交通監控機制。

3 構建以計算機視覺為基礎的智能交通監控機制及配套措施

3.1 基于計算機視覺的智能交通監控機制的構建

監控指揮系統、實時交通信息收集系統、高質量信息傳輸系統是基于計算機視覺的智能交通監控的三大系統。實時交通信息收集系統由多套信息收集裝置組成,通過這些信息采集裝置實時監控不同位置交通現狀。實時交通信息收集系統不僅能進行路段監控與實時交通信息采集的工作,還能將收集數據信息,經由高質量信息傳輸系統實施輸送,或在服務器中存儲已處理的信息;一個中央數據庫與一個中央服務器是高質量信息存儲傳輸系統核心部分,其中中央數據庫對獲取到的實時交通路況信息進行存儲。而為了便于工作者能通過界面對中央數據庫實施提取、查詢、查看等操作,因此該界面就由中央服務器來提供,此外該服務器還能將已處理的實時路況數據通過高質量的傳輸系統輸送到監控指揮機制,達到對各路段的交通進行管制、部署及指揮的目的。

3.2 專業技術人員的儲備

以計算機視覺技術為基礎的智能交通監控機制是一個龐大的系統,具有突出點的優點,該系統集自動化、信息化、智能化為一體,只有專業的技術人才才能使該系統高效工作,因此開展培訓儲備相關技術人員至關重要。實時交通信息借助于先進的高清裝置的正常采集工作,所以儲備一批針對高清裝置安裝、檢測、調試及故障修復的技術人員極為重要?,F代基于計算機視覺的智能交通監控機制雖然本身具有一定的圖形圖像分析及處理能力,然而有些工作人是永遠被替代的,所以培養儲備一批專業的圖形圖像處理技術人員也是重要的。儲備服務器維護技術工,每天以計算機視覺技術為基礎的智能交通監控機制都會獲取大量的監控信息數據,然而只有大型的服務器才能存儲這些數據,可想而知一旦服務器癱瘓就會引發整個機制的崩潰,造成嚴重的后果,因此專業服務器維護工作者的儲備與培養也尤為重要?;谟嬎銠C視覺技術的智能交通監控機制并不能取代交通指揮員,其僅是用來采集實時交通信息的系統,僅為了協助交通指揮員監管及疏導城市交通,因此要求儲備一批高素質、高質量的交通指揮員也極為必要。

3.3 交通知識的宣傳

大城市的交通問題,并不是依靠單純的開發先進的計算機視覺智能交通監控系統就能處理解決,也不是單單要求市政建設增加公交數量、增鋪幾條公路或增開通幾條地鐵就能解決的,以上這些僅是輔助方法。關鍵在于開展交通知識的宣傳與教育工作,強化駕駛員的素質,倡導不酒駕、不逆行、不超速、限號行駛等,自覺遵守道路交通規則,提倡公交地鐵出行,減少私家車輛行駛,齊心協力共同打造和諧的交通環境。

3.4 獲取政府支持

市政建設的主要問題之一即是交通問題,政府的支持是萬萬不可缺失的。由于構建以計算機視覺技術為基礎的智能交通管制機制,涉及面廣,包括道路勘測、先進裝置的引進、專業技術人員的儲備、裝備組織安裝與調試、后期維護等等多方面,這些都需要投入大量的人力、財力、物力,而對于任何一個單位、部門或幾個市政部門來說都無法獨自承擔,由此可知政府的大力支持是必不可少的,以政府的力量為媒介,將各部門進行協調、協作,只有這樣才能構建成較健全的交通監控體系。

4 結束語

道路交通雜、亂是國內城市交通最突出的特點之一,對于我國的交通事業來說進行行人識別勢在必行。而我國對于行人識別的研究仍處于起步階段,還較落后。且基于計算機的交通監管系統設計較為復雜,涵蓋點較多,因此本文僅對設計進行簡要介紹,希望達到拋磚引玉的效果。

參考文獻:

[1]康曉麗.無線網絡技術在交通管理中的應用[J].科技情報開發與經濟,2011(21).

[2]鐘振,賴順橋,肖熠琳,張沛強.RFID車輛智能管理系統[J].機電工程技術,2011(02).

[3]文軍.視頻監控系統軟件現狀與技術分析[J].金卡工程,2007(08).

[4]張玉風.簡述視頻監控系統的發展歷程[J].鐵道通信信號工程技術,2006(06).

[5]馬伏花,朱青.基于射頻識別技術的車輛自動識別系統的實現[J].中國儀器儀表,2006(11).

計算機視覺的概念范文3

關鍵詞:數據融合傳感器無損檢測精確林業應用

多傳感器融合系統由于具有較高的可靠性和魯棒性,較寬的時間和空間的觀測范圍,較強的數據可信度和分辨能力,已廣泛應用于軍事、工業、農業、航天、交通管制、機器人、海洋監視和管理、目標跟蹤和慣性導航等領域[1,2]。筆者在分析數據融合技術概念和內容的基礎上,對該技術在林業工程中的應用及前景進行了綜述。

1數據融合

1.1概念的提出

1973年,數據融合技術在美國國防部資助開發的聲納信號理解系統中得到了最早的體現。70年代末,在公開的技術文獻中開始出現基于多系統的信息整合意義的融合技術。1984年美國國防部數據融合小組(DFS)定義數據融合為:“對多源的數據和信息進行多方的關聯、相關和綜合處理,以更好地進行定位與估計,并完全能對態勢及帶來的威脅進行實時評估”。

1998年1月,Buchroithner和Wald重新定義了數據融合:“數據融合是一種規范框架,這個框架里人們闡明如何使用特定的手段和工具來整合來自不同渠道的數據,以獲得實際需要的信息”。

Wald定義的數據融合的概念原理中,強調以質量作為數據融合的明確目標,這正是很多關于數據融合的文獻中忽略但又是非常重要的方面。這里的“質量”指經過數據融合后獲得的信息對用戶而言較融合前具有更高的滿意度,如可改善分類精度,獲得更有效、更相關的信息,甚至可更好地用于開發項目的資金、人力資源等[3]。

1.2基本內容

信息融合是生物系統所具備的一個基本功能,人類本能地將各感官獲得的信息與先驗知識進行綜合,對周圍環境和發生的事件做出估計和判斷。當運用各種現代信息處理方法,通過計算機實現這一功能時,就形成了數據融合技術。

數據融合就是充分利用多傳感器資源,通過對這些多傳感器及觀測信息的合理支配和使用,把多傳感器在空間或時間上的冗余或互補信息依據某些準則進行組合,以獲得被測對象的一致性解釋或描述。數據融合的內容主要包括:

(1)數據關聯。確定來自多傳感器的數據反映的是否是同源目標。

(2)多傳感器ID/軌跡估計。假設多傳感器的報告反映的是同源目標,對這些數據進行綜合,改進對該目標的估計,或對整個當前或未來情況的估計。

(3)采集管理。給定傳感器環境的一種認識狀態,通過分配多個信息捕獲和處理源,最大限度地發揮其性能,從而使其操作成本降到最低。傳感器的數據融合功能主要包括多傳感器的目標探測、數據關聯、跟蹤與識別、情況評估和預測[4]。

根據融合系統所處理的信息層次,目前常將信息融合系統劃分為3個層次:

(l)數據層融合。直接將各傳感器的原始數據進行關聯后,送入融合中心,完成對被測對象的綜合評價。其優點是保持了盡可能多的原始信號信息,但是該種融合處理的信息量大、速度慢、實時性差,通常只用于數據之間配準精度較高的圖像處理。

(2)特征層融合。從原始數據中提取特征,進行數據關聯和歸一化等處理后,送入融合中心進行分析與綜合,完成對被測對象的綜合評價。這種融合既保留了足夠數量的原始信息,又實現了一定的數據壓縮,有利于實時處理,而且由于在特征提取方面有許多成果可以借鑒,所以特征層融合是目前應用較多的一種技術。但是該技術在復雜環境中的穩健性和系統的容錯性與可靠性有待進一步改善。

(3)決策層融合。首先每一傳感器分別獨立地完成特征提取和決策等任務,然后進行關聯,再送入融合中心處理。這種方法的實質是根據一定的準則和每個決策的可信度做出最優的決策。其優點是數據通訊量小、實時性好,可以處理非同步信息,能有效地融合不同類型的信息。而且在一個或幾個傳感器失效時,系統仍能繼續工作,具有良好的容錯性,系統可靠性高,因此是目前信息融合研究的一個熱點。但是這種技術也有不足,如原始信息的損失、被測對象的時變特征、先驗知識的獲取困難,以及知識庫的巨量特性等[5,6]。

1.3處理模型

美國數據融合工作小組提出的數據融合處理模型[7],當時僅應用于軍事方面,但該模型對人們理解數據融合的基本概念有重要意義。模型每個模塊的基本功能如下:

數據源。包括傳感器及其相關數據(數據庫和人的先驗知識等)。

源數據預處理。進行數據的預篩選和數據分配,以減輕融合中心的計算負擔,有時需要為融合中心提供最重要的數據。目標評估。融合目標的位置、速度、身份等參數,以達到對這些參數的精確表達。主要包括數據配準、跟蹤和數據關聯、辨識。

態勢評估。根據當前的環境推斷出檢測目標與事件之間的關系,以判斷檢測目標的意圖。威脅評估。結合當前的態勢判斷對方的威脅程度和敵我雙方的攻擊能力等,這一過程應同時考慮當前的政治環境和對敵策略等因素,所以較為困難。

處理過程評估。監視系統的性能,辨識改善性能所需的數據,進行傳感器資源的合理配置。人機接口。提供人與計算機間的交互功能,如人工操作員的指導和評價、多媒體功能等。

2多傳感器在林業中的應用

2.1在森林防火中的應用

在用MODIS(ModerateResolutionImagingSpectroradiometer)數據測定森林火點時的20、22、23波段的傳感器輻射值已達飽和狀態,用一般圖像增強處理方法探測燃燒區火點的結果不理想。余啟剛運用數據融合技術,在空間分辨率為1000m的熱輻射通道的數據外加入空間分辨率為250m的可見光通道的數據,較好地進行了不同空間分辨率信息的數據融合,大大提高了對火點位置的判斷準確度[8]。為進一步提高衛星光譜圖像數據分析的準確性與可靠性,利用原有森林防火用的林區紅外探測器網,將其與衛星光譜圖像數據融合,可以使計算機獲得GPS接收機輸出的有關信息通過與RS實現高效互補性融合,從而彌補衛星圖譜不理想的缺失區數據信息,大大提高燃燒區火點信息準確度和敏感性。

2.2森林蓄積特征的估計

HampusHolmstrom等在瑞典南部的試驗區將SPOT-4×S衛星數據和CARABAS-IIVHFSAR傳感器的雷達數據進行了融合,采用KNN(knearestneighbor)方法對森林的蓄積特征(林分蓄積、樹種組成與年齡)進行了估計[9]。

KNN方法就是采用目標樣地鄰近k個(k=10)最近樣地的加權來估計目標樣地的森林特征。研究者應用衛星光譜數據、雷達數據融合技術對試驗區的不同林分的蓄積特征進行估計,并對三種不同的數據方法進行誤差分析。試驗表明,融合后的數據作出的估計比單一的衛星數據或雷達數據的精度高且穩定性好。

2.3用非垂直航空攝像數據融合GIS信息更新調查數據

森林資源調查是掌握森林資源現狀與變化的調查方法,一般以地面調查的方法為主,我國5年復查一次。由于森林資源調查的工作量巨大,且要花費大量的人力、物力和資金。國內外許多學者都在探索航空、航天的遙感調查與估計方法。

TrevorJDavis等2002年提出采用非垂直的航空攝影數據融合對應的GIS數據信息實現森林調查數據的快速更新,認為對森林資源整體而言,僅某些特殊地區的資源數據需要更新。在直升飛機側面裝上可視的數字攝像裝置,利用GPS對測點進行定位,對特殊地區的攝像進行拍攝,同時與對應的GIS數據進行融合,做出資源變化的估計或影像的修正[10]。

試驗表明,融合后的數據可以同高分辨率矯正圖像相比,該方法花費少,精度高,能充分利用影像的可視性,應用于偏遠、地形復雜、不易操作、成本高的區域,同時可避免遙感圖像受云層遮蓋。

3數據融合在林業中的應用展望

3.1在木材檢測中的應用

3.1.1木材缺陷及其影響

木材是天然生長的有機體,生長過程中不可避免地有尖削度、彎曲度、節子等生長缺陷,這些缺陷極大地影響了木材及其制品的優良特性,以及木材的使用率、強度、外觀質量,并限制了其應用領域。在傳統木制品生產過程中,主要依靠人的肉眼來識別木材缺陷,而木材板材表面缺陷在大小、形狀和色澤上都有較大的差異,且受木材紋理的影響,識別起來非常困難,勞動強度大,效率低,同時由于熟練程度、標準掌握等人為因素,可能造成較大的誤差。另外在集成材加工中,板材缺陷的非雙面識別嚴重影響了生產線的生產節拍。因此必須開發一種能夠對板材雙面缺陷進行在線識別和自動剔除技術,以解決集成材加工中節子人工識別誤差大、難以實現雙面識別、剔除機械調整時間長等問題。

3.1.2單一傳感器在木材檢測中的應用

對木材及人造板進行無損檢測的方法很多,如超聲波、微波、射線、機械應力、震動、沖擊應力波、快速傅立葉變換分析等檢測方法[11,12]。超聲技術在木材工業中的應用研究主要集中在研究聲波與木材種類、木材結構和性能之間的關系、木材結構及缺陷分析、膠的固化過程分析等[13]。

隨著計算機視覺技術的發展,人們也將視覺傳感器應用于木材檢測中。新西蘭科學家用視頻傳感器研究和測量了紙漿中的纖維橫切面的寬度、厚度、壁面積、壁厚度、腔比率、壁比率等,同時準確地測量單個纖維和全部纖維的幾何尺寸及其變化趨勢,能夠區分不同紙漿類型,測定木材纖維材料加固結合力,并動態地觀察木材纖維在材料中的結合機理。

新西蘭的基于視覺傳感器的板材缺陷識別的軟件已經產業化,該軟件利用數碼相機或激光掃描儀采集板材的圖像,自動識別板材節子和缺陷的位置,控制板材的加工。該軟件還具有進行原木三維模型真實再現的計算機視覺識別功能,利用激光掃描儀自動采集原木的三維幾何數據。

美國林產品實驗室利用計算機視覺技術對木材刨花的尺寸大小進行分級,確定各種刨花在板中的比例和刨花的排列方向;日本京都大學基于視覺傳感器進行了定向刨花板內刨花定向程度的檢測,從而可以通過調整定向鋪裝設備優化刨花的排列方向來提高定向刨花板的強度。

在制材加工過程中,利用計算機視覺技術在線實時檢測原木的形狀及尺寸,選擇最佳下鋸方法,提高原木的出材率。同時可對鋸材的質量進行分級,實現木材的優化使用;在膠合板的生產過程中,利用計算機視覺技術在線實時檢測單板上的各種缺陷,實現單板的智能和自動剪切,并可測量在剪切過程中的單板破損率,對單板進行分等分級,實現自動化生產過程。Wengert等在綜合了大量的板材分類經驗的基礎上,建立了板材分級分類的計算機視覺專家系統。在國內這方面的研究較少,王金滿等用計算機視覺技術對刨花板施膠效果進行了定量分析[14]。

X射線對木材及木質復合材料的性能檢測已得到了廣泛的應用,目前該技術主要應用于對木材密度、含水率、纖維素相對結晶度和結晶區大小、纖維的化學結構和性質等進行檢測,并對木材內部的各種缺陷進行檢測。

3.1.3數據融合在木材檢測中的應用展望

單一傳感器在木材工業中已得到了一定程度的應用,但各種單項技術在應用上存在一定的局限性。如視覺傳感器不能檢測到有些與木材具有相同顏色的節子,有時會把木板上的臟物或油脂當成節子,造成誤判,有時也會受到木材的種類或粗糙度和濕度的影響,此外,這種技術只能檢測部分表面缺陷,而無法檢測到內部缺陷;超聲、微波、核磁共振和X射線技術均能測量密度及內部特征,但是它們不能測定木材的顏色和瑕疵,因為這些缺陷的密度往往同木板相同。因此,一個理想的檢測系統應該集成各種傳感技術,才能準確、可靠地檢測到木材的缺陷[15,16]。

基于多傳感器(機器視覺及X射線等)數據融合技術的木材及木制品表面缺陷檢測,可以集成多個傳統單項技術,更可靠、準確地實時檢測出木材表面的各種缺陷,為實現木材分級自動化、智能化奠定基礎,同時為集裁除鋸、自動調整、自動裁除節子等為一身的新型視頻識別集成材雙面節子數控自動剔除成套設備提供技術支持。

3.2在精確林業中的應用

美國華盛頓大學研究人員開展了樹形自動分析、林業作業規劃等研究工作;Auburn大學的生物系統工程系和USDA南方林業實驗站與有關公司合作開展用GPS和其他傳感器研究林業機器系統的性能和生產效率。

目前單項的GPS、RS、GIS正從“自動化孤島”形式應用于林業生產向集成技術轉變。林業生產系統作為一個多組分的復雜系統,是由能量流動、物質循環、信息流動所推動的具有一定的結構和功能的復合體,各組分間的關系和結合方式影響系統整體的結構和功能。因此應該在計算機集成系統框架下,有效地融合GPS、GIS、RS等數據,解決這些信息在空間和時間上的質的差異及空間數據類型的多樣性,如地理統計數據、柵格數據、點數據等。利用智能DSS(決策支持系統)以及VRT(可變量技術)等,使林業生產成為一個高效、柔性和開放的體系,從而實現林業生產的標準化、規范化、開放性,建立基于信息流融合的精確林業系統。

南京林業大學提出了“精確林業工程系統”[17]。研究包括精確林業工程系統的領域體系結構、隨時空變化的數據采集處理與融合技術、精確控制林業生產的智能決策支持系統、可變量控制技術等,實現基于自然界生物及其所賴以生存的環境資源的時空變異性的客觀現實,以最小資源投入、最小環境危害和最大產出效益為目標,建立關于林業管理系統戰略思想的精確林業微觀管理系統。

[參考文獻]

[1]高翔,王勇.數據融合技術綜述[J].計算機控制與測量,2002,10(11):706-709.

[2]龔元明,蕭德云,王俊杰.多傳感器數據融合技術(上)[J].冶金自動化,2002(4):4-7.

[3]錢永蘭,楊邦杰,雷廷武.數據融合及其在農情遙感監測中的應用與展望[J].農業工程學報,2004,20(4):286-290.

[4]高德平,黃雪梅.多傳感器和數據融合(一)[J].紅外與激光工程,1999,28(1):1-4.

[5]王耀南,李樹濤.多傳感器信息融合及其應用綜述[J].控制與決策,2001,16(5):518-52.

[6]許軍,羅飛路,張耀輝.多傳感器信息融合技術在無損檢測中的應用研究[J].無損檢測,2000,22(8):342-344.

[7]WhiteFE.Datafusionlexicon:DatafusionsubpanelofthejointdirectorsoflaboratoriestechnicalpanelforC3[R].SanDiego,1991.

[8]余啟剛.數據融合技術在“3S”森林防火中的應用[J].森林工程,2003,19(4):5-6.

[9]HampusHolmstrom,biningremotelysensedopticalandradardatainKNN-estimationofforest[J].ForestScience,2003,49(3):409-418.

[10]TrevorJDavis,BrianKlinkenberg,PeterKellerC.Updatinginventory:Usingobliquevideogrammetry&datafusion[J].JournalofForestry,2002,100(2):45-50.

[11]楊春梅,胡萬義,白帆,等.木材缺陷檢測理論及方法的發展[J].林業機械與木工設備,2004,32(3):8-10.

[12]胡英成,顧繼友,王逢瑚.木材及人造板物理力學性能無損檢測技術研究的發展與展望[J].世界林業研究,2002,15(4):39-46.

[13]肖忠平,盧曉寧,陸繼圣.木質材料X射線與超聲檢測技術研究的發展與展望[J].木材加工機械,2004,15(1):25-27.

[14]王金滿,周秀榮.刨花板施膠效果計算機視覺分析方法[J].東北林業大學學報,1994,22(3):25-26.

[15]KlinkhachornP.Prototypinganautomatedlumberprocessingsystem[J].ForestProductsJournal,1993(2):11-18.

計算機視覺的概念范文4

提起數字媒體,人們通常會想到傳媒行業,其實數字媒體的應用絕不局限于傳媒。隨著寬帶網絡的普及,人們在日常業務處理過程中,正面對越來越豐富的網上媒體和內容,包括各種視頻、音頻、文本、圖像等。下面,就讓我們跟著諸位數字媒體方面的專家一起來分享這個繽紛的世界。

三維幾何建模與形狀表示

北京大學視覺與聽覺信息處理國家重點實驗室主任教育部長江學者獎勵計劃特聘教授 查紅彬

精彩問答

在背景比較復雜、有干擾的情況下模型檢索的效果怎么樣?

在模型檢索的時候并沒有考慮背景,因為這是做模型檢索比較容易的部分。模型檢索一般是沒有背景的,但也可以做,但是要推廣到背景比較復雜的物體上識別可能有很大的問題,因為這時候匹配不僅僅是局部匹配,而是兩個子集和子集的匹配問題,到目前為止,我們只是做沒有背景的模型檢索。

為什么要重新談論三維形狀表示問題?在多媒體信息處理領域里面,有兩個比較重要的方向,這也是計算機科學技術領域里兩個重要的方向,一個是計算機視覺,一個是計算機圖形學。計算機視覺是從圖像中通過識別或重建處理,得到一個對對象物的描述。反過來說圖形學,是對一個對象和場景的描述,通過繪制和動畫生成圖像和視頻。它們從處理過程來說是逆過程,這兩個領域之間有密切的關聯。

我們現在考慮計算機三維建?;蚰P偷拿枋?,考慮的不僅僅是計算機視覺或計算機圖形學所包含的內容。這里面簡單列舉一下,比如基于模型的三維物體識別和場景識別,這兩個應該是典型的計算機視覺里面考慮的應用。除了這以外還可以用模型干別的事情,比如繪制,還包括基于這樣模型的設計、變形、動畫等等。除了兩個單獨研究的應用之外,還要想怎么把兩者結合起來,把虛擬和真實的東西無縫連接到一起,這些都牽涉到三維模型。

我們考慮的三維模型跟以前相比,應用領域大了很多,要達到這個要求,對模型的表達、形狀的表達也都有了更高的要求。

怎樣找到一些更新更有效地表達形式來符合這些要求呢?這里有四個方面,現在能不能建立一個形狀空間,把考慮的對象完整地在形狀空間里面表達出來。第二點就是針對形狀的特性,表達要具有柔性,對象物的表面不都是連續的,也有一些非連續性和不規律性,這些特性怎樣能夠進行柔性處理。第三個是需要一些描述是局部性的,另外一些要求描述是整體性的,這兩者之間如何有一個很好的結合方法。第四是在大量的計算當中,包括變形和動畫中有很多編輯的工具,所以我們要求對現在的形狀表達有一些比較高的要求。

在計算機視覺里面有一個老大難就是識別,已有模型,但是眼前看到的是一部分三維數據,怎么用這部分數據和模型數據匹配來識別它呢?這就牽涉到局部匹配,我們要解決局部匹配需要什么描述?我們要有一個模型,從大量的數據中建立一個模型庫,并從中抽取很多特征,把這些特征進行組織。這里面牽涉三個比較大的問題,第一個是形狀空間怎么構造,沒有很好的特征表達或整理的形式,后面的匹配以及其他的工作就很難做。第二個是怎么定義基于這種特征的相似度。第三個是怎樣在形狀空間當中搜索到最優的匹配。

針對這些問題我們最近一兩年做了一些工作,最近提出一個廣義形狀分布(Generalized Shape Distributions)描述方式,主要目的有兩點,能不能在三維形狀表示過程當中,找到一些最關鍵的描述指令,并從中找到相互關系,把整體和局部結合起來。如果把之間的關系描述出來,就能把局部結構性的信息用整體觀點加進去,這兩件工作就是我們做這件事情的主要目的。

在形狀描述問題上,我們還有很多工作要做,除了局部、整體描述之外,我們要想辦法把他們結合到一起。今后幾年要用更多的模式識別的辦法,來解決面臨的圖形學或虛擬現實和計算機視覺當中的很多問題。

生活中的計算機視覺

香港中文大學信息工程系終身教授

微軟亞洲研究院視覺計算組負責人 湯曉歐

精彩問答

微軟亞洲研究院視覺計算組在原創思想這一塊,引領下一個方向有沒有什么考慮,您談到很多對人們日常生活影響很大的應用,但是在背后的更深層的考慮,更新的創意在哪里呢?

我們的研究者都很年輕,我本人也才工作七年的時間,很多的算法已經發展這么多年了,所以在開始的時候比較容易想出來的方法,現在已經很難有那么多的原創內容。我們的工作是去找一些非常原創的內容,有的是理論上的,有的是新的發明,這可以有很大的影響。

圖像通過閃光燈的分割,前景和背景深度差會不會影響分割效果,距離會不會影響分割效果呢?

我們這個通過閃光燈對圖像進行分割的技術,會一定程度上受到光的強度和距離的影響。

我們主要的研究領域包括計算機視覺、模式識別、圖像處理和視頻處理。下面就為大家介紹幾個比較典型的應用。

如何將圖片的前景和后景分離?我們現在照兩張圖片,一張打閃光燈,一張沒有打閃光燈,這樣拍出來的照片背景沒有變化,但前景變化很厲害。在開閃光燈的情況下拍的照片,前景和后景可以利用一些技術很容易地分開來。

把一個圖片的前景切割出來放入另一張圖后,那剩下的圖片缺一塊的怎么辦呢?如何修復剩下的圖片呢?在例舉的圖片上,大家可以看到不同的區域,我們可以由一個算法,從其他的地方借過來,再貼上去,經過這樣的處理后,圖像基本上和原來沒有太大的區別。

如此的修修補補又有什么用呢?比如說,你對這張圖像不是很滿意,你可以把圖片上不喜歡的部分劃出來,然后利用一些技術將劃出來的空白部分填上。更有用的地方在于,你照了不想被別人看到的照片后,除了刪除,你多了一個選擇。你可以把不想讓別人看到的照片部分去掉,并利用一些算法把空白的地方填補上,而且讓別人看不出來。

現在大家的電腦上都會有很多照片,怎么快速地瀏覽這些照片呢?我們可以把這些圖像都放在一個屏幕上,可屏幕畢竟有限,怎么才能把照片放得更多一些呢?我們現在做的是可以隨機把照片放到桌面上,但是電腦會對每張照片上的重要信息進行篩選,在放盡可能多的照片的同時,讓每張照片上最重要的信息不被遮掩,而且均勻地分布在桌面上。這樣大家看起來就更清楚了。這個算法就是怎么讓所有圖像均勻分布,同時把所有背景都要蓋上。我們可以對圖像進行各種處理,同時我們也可以利用一些技術知道別人有沒有處理圖像,對圖像有沒有做過手腳。

現在我們來說說視頻方面。比如說抖動很厲害的圖像,怎么把物體移到中間?一個辦法是把除移動圖像外的公共部分切出來,但是移動越大,公共部分就會越來越小,更好的辦法是用一些技術把空處填上。

現在MSN的功能已經越來越豐富。比如說一段電影,你看到一件比較中意的衣服,只要你把鼠標移動衣服的覆蓋范圍,你就能很清楚地知道這件衣服的品牌及價格。如果你把鼠標在那件衣服上輕點,電腦就會直接跳轉到這個衣服的相關網站。

你在視頻聊天的時候如果不想讓對方看到你所處的環境,你就可以很輕松地把背景模糊掉。如果大家對自己的長相不是那么有信心,我們可以幫你改變一下你的長相。為自己添一幅酷酷的墨鏡,換上一個性感的大嘴巴,這些都能輕而易舉地完成。

多媒體傳感器網絡

北京郵電大學教授、博士生導師

智能通信軟件與多媒體北京市重點實驗室主任 馬華東

傳感器研究是IT非常熱門的話題, 首先我為大家介紹一下多媒體傳感器網絡的基本概念。從早期的巨型機到今天的小型機,生物芯片尺寸越來越小,但是效率越來越高;網絡設備聯網和數據交換的需求越來越大,設備之間的傳輸量也越來越大;從信息處理的角度來看,內容逐漸占據了主導地位,由數據為中心轉到以內容處理為中心。這三方面的演化是今天討論多媒體傳感器的背景。

傳感器網絡是一組傳感器節點,由組織方式協作地感知采集和處理感知對象的信息,它的基本特點是造價低、能量敏感、通信能力有限、計算能力弱、動態變化?,F在的需求是要求通信能力越來越強,計算能力應付節點的處理的要求。

右圖是目前主流的傳感器節點的配置,從配置來講還是比較低的,現在信息處理側重壓力、溫度、光、震動等簡單的數據或者是標量數據。人類獲取信息80%是視覺信息,10%左右是聽覺信息,也就是說90%左右的信息是多媒體信息。傳感器網絡就是對音頻、視頻信息獲取后提供給使用者,使其對環境信息有一個全方位的了解,對傳感器網絡的應用是非常廣泛的。

從網絡的結構來講,基本結構和原來傳感器網絡差別不是很大,這里面強調增加音頻、視頻獲取處理,網絡傳輸整個過程的各個環節,同時這里面最好可以交互。有了這個概念以后,深入分析一下主要特點,首先是網絡能力的增強,這樣一個傳感器網絡應該集信息的采集、處理傳輸、轉發、能量供應等方面,除了傳統的標量數據,音頻、視頻的圖像數據,都可以進行采集處理。

現在多媒體傳感器網絡目前有哪些問題呢?從需求來看,現在網絡是異構的信息,媒體信息的格式,種類很多,并且差異非常大,數據量比較大,特別是音頻、視頻信息,格式比較復雜。這些信息傳輸過程中需要高速實時地傳輸,對網絡傳輸速率也提出了比較高的要求。媒體信息的安全問題,也是網絡需要考慮的,還有服務質量的問題。針對這些需求,我們可以看到,通信資源和計算資源這兩者之間存在非常大的矛盾,或者非常大的鴻溝,如何解決這兩者之間的差距就是我們研究的問題所在。

最后談一下多媒體傳感器網絡研究的挑戰,首先是節點的芯片設計,這是基礎,這里面需要采用多種技術,包括軟硬件協同設計的技術,各種技術結合,降低成本、能耗、體積、提高運算速度和可靠性。第二是三維場景的覆蓋問題,方向性傳感模型是一個簡單的二維圖形,實際上是三維圖形監測,這是一個三維場景方向的問題,研究這個就復雜多了。還有一個問題是服務質量保證問題,在新的網絡當中服務質量體系是什么樣,也是研究的方向。再一個是信息處理,為了使網絡傳輸數據量比較快,能不能在節點做信息處理的計算。當然信息的安全也比較重要,用這些節點獲取多媒體信息怎么保證安全的質量,使應該看到的人看到這些信息,不應該看到的人看不到這些信息。

在多媒體傳感器網絡中,我們還是做了一些工作,和一些同行學者也有一些交流,這里面也有一些質疑,說多媒體傳感網絡和原來傳感器網絡設計初衷是不是吻合的,原來沒有想讓它處理這么多信息,原來體積比較小,加上這些信息以后,無疑使它的體積增大,這里面和初衷之間是不是有矛盾,傳感器網絡研究有沒有必要性,如果有必要性可行不可行,這都是我們目前研究的問題。

計算機視覺的概念范文5

清潔工、中餐館收銀員幫人遛狗,開干洗店……這些職業能和斯坦福人工智能實驗室和計算機視覺實驗室負責人聯系到一起嗎?

“人工智能”這個概念因為 AlphaGo的橫空出世而快速走進了大眾的視野。李飛飛最大的貢獻便是她主導的圖像識別項目,每年吸引著包括Google、Facebook、Amazon等科技巨頭在內的上百家頂尖機構,共同向前推進機器智能的邊界。

1976年出生的李飛飛,年僅33歲時便獲得了斯坦福的終身教授職位,不僅是斯坦福AI實驗室唯一的女性,也是計算機系最年輕的教授。在巨大的科研成就背后,這樣一位美女學霸還隱藏著一段頗為傳奇勵志的人生。

“我們不富有,但我的學習成績還不錯――特別是數學和科學?!?/p>

生于北京的李飛飛在四川長大。父母都是當時的高級知識分子,上世紀90年代他們懷抱著一顆追求學術夢想的心,帶著16歲的李飛飛來到新澤西洲 Parsippany 小鎮。

雖然父母都是知識分子,但是都不會說英文。有著工程師和科學家情結的父親到了美國,無奈只能做相機修理工作,母親則做一名收銀員。微薄的收入遠不足以支撐全家的生活和學費。李飛飛不得不分出大量精力,在唐人街中國餐館打零工。

李飛飛剛到美國時英語幾乎也是零基礎,如果想要進入一所好大學,李飛飛不僅要迅速掌握英語,還要拿出一份極其優秀的成績單,只有這樣,才能拿到頂尖大學的獎學金。否則,以他們的家境,是付不起美國私立名校高昂的學費。最辛苦的時候,她一天只睡4小時。聰明和韌性并存的中國性格讓她在高中畢業時,收到了普林斯頓大學計算機系的全獎 offer。她的成功在小鎮上名噪一時,有報紙專門刊載了她的故事,標題是《“美國夢”成真了!》

普林斯頓的學術生活對李飛飛而言是幸福的。在這里,她接觸到了大量的優秀人才,完全不同于打工所經歷的。但是,她的父母卻仍在過著窘迫的生活。為了改善他們的生活狀況,李飛飛敏銳地注意到了市場上的機會,借錢買下一家洗衣店,交給父母經營。她從此過上了雙重生活,周一到周五,她是普林斯頓的高材生,拼命努力吸收知識;周六到周日,她則走出實驗室,穿上白圍裙,給洗衣店幫忙。

“真正的挑戰是需要充分發揮自己的潛力,同時兼顧自己所身負的責任,然后又必須忠于自己的內心?!?/p>

1999年,李飛飛以最高榮譽從普林斯頓本科畢業。眾多投行和咨詢公司都向她發來了邀請,數十萬的年薪唾手可得。但這個自從來到美國以后,就飽受經濟壓力的乖乖女,卻少見地叛逆了一回。“作為中國人的女兒,我心中有強烈地要照顧好我的父母的責任感。如果高盛給我一個報酬豐厚的工作,我就會分心。雖然只要我接受了這個工作,就能緩解我父母經濟上的困難?!?/p>

那個時候,她希望能去,在那兒做一年的藏藥研究。在科學界,藏醫與中醫一樣存在很多爭議,但這并不妨礙李飛飛對它的興趣。于她而言,藏醫可以在哲學和方法論層面上給她更多的理解。她非常看重具體科研項目在更大領域范圍內的意義,每一項研究開始之前都要經過深思熟慮。

歸來之后,李飛飛去了加州理工學院,攻讀人工智能和計算神經科學方向的博士學位。博士期間經歷了一段痛苦的日子,母親接連患上了癌癥與中風,他們全家仿佛天塌了一般?!白瞵F實的生存挑戰是如何全力以赴、如何身兼重任并誠實地面對心中的夢想。我們經歷了很多困難,然后一起挺過來了?!?/p>

“探尋知識和真理是流淌在我的血液里的基因,我希望可以了解全宇宙,可以成為一個富有理性思維的人?!?/p>

博士畢業后,她又選擇了當時比較冷門的圖像識別作為研究方向。圖像識別技術,是人工智能發展道路上的一座高峰。簡單來說,它就是要教會計算機看圖說話。要知道,“看到”和“懂得”是不一樣的。3歲兒童能從圖片中識別出“貓”,可是計算機卻做不到。李飛飛研究了很長時間,始終沒有突破。同行的教授都勸她換個方向,以便趁早取得tenured professor(終身教授),她當然沒有同意。

有一天,李飛飛突然意識到,由于人眼每200毫秒就能獲取一幅圖像,一個孩子可能已經獲得了上億次的圖像識別訓練,是計算機的幾何級倍數。也就是,關鍵在于自主訓練量。

李飛飛馬上開始著手,從 twitter 上抓取海量照片,將它們統統打上標簽后,訓練計算機進行機器學習。機器學習就是給出一定算法,讓計算機自己學習。這個過程是艱苦的。如今,機器學習已經是熱門概念,可在2007年,李飛飛的實驗室缺少人手,又申請不到經費,最困難的時候,她一度想重開洗衣店,籌集實驗資金。

她從亞馬遜的眾包平臺中找到了解決辦法,讓來自 167 個國家的 5 萬人幫助為其中的數百萬張圖像打標簽。最終,他們建立了 ImageNet 數據集。今天,這個數據集包含了使用日常英語標記的超過 1400 萬張圖像,跨越 21,800 個類別。

李飛飛覺得自己十分幸運?!拔覐?2000 年開始從事計算機視覺博士研究的時候,很幸運的成為第一批趕上這股新思想的人,剛好開始用機器學習的思路來重新思考計算機視覺里重要的感知和認知的問題?!?/p>

李飛飛還組織了一年一度的 ImageNet 挑戰賽,邀請谷歌等科技巨頭參賽,促進圖像識別和人工智能領域的交流。李飛飛說,目前的圖像識別與人工智能,還只相當于一個牙牙學語的3歲兒童。而從3歲到10歲的過程,才是AI技術的難點和關鍵。

現在的她,在人工智能界無人不曉。她的智慧篤定和不忘初心成就了她,各種榮譽也如雪花般紛沓而至:2006 年,微軟學者新星獎以及谷歌研究獎;2009 年, NSF 杰出青年獎;2011年3月,榮獲斯隆研究獎計算機科學獎;2012 年,雅虎實驗室學者獎;2014年,IBM 學者獎;入選2015年“全球百大思想者”……

李飛飛在圖像識別領域可謂是一個家喻戶曉的人物??梢院敛豢鋸埖卣f,她已經是一個站在了人類智能巔峰的華裔女性,她的研究可能改變未來的人類世界!

而這個改變了CV領域的女性,最讓她開心的竟然是:“和我的孩子們在一起。我的研究領域是智能。我從他們身上學到了太多什么叫做智能,什么叫做‘做人’。沒有什么比看著孩子長大成人更幸福的了。”

計算機視覺的概念范文6

AlphaGo的出現加速了人們對人工智能(Artificial Intelligence以下簡稱AI)的理解,但AI極客們的野心遠非19行的棋盤可以局囿,他們擁有酷炫的技術和非凡自信,并想以此來改變世界。

美國暢銷書作者、發明家雷.庫茲韋爾(Ray.Kurzweil)在《奇點臨近》一書中為人工智能的出現設定了三個條件:強大的計算能力、海量的知識儲備,最后還需要教會計算機擁有認知能力,通過機器學習技術讓計算機不斷的自行進化。

前兩者已經實現。第三點,如何讓機器擁有認知能力是AI極客們關注的重點。

機器學習是人工智能的核心。機器學習將教會計算機認識現實世界,知道自然界的日升日落、陰晴圓缺,并能理解人類的行為和語言。機器學習的常用領域包括數據挖掘、視覺理解、語音識別和自然語言處理等方面。我們采訪了數位科技公司高層、新銳創業者,他們有一個共同的身份―國內從事機器學習的應用和研發的專家。他們講述了中國人工智能發展的現狀,而一旦科技出現新突破,也預示著新一輪的商業變革。 先知

坐在記者對面,臉龐消瘦的陳運文笑得有些靦腆,言語卻充滿自信,“很多事情都是可以預測的”。

陳運文是國內大數據方面的專家,曾任百度核心技術研發工程師和盛大文學首席數據官?,F在他是個創業者,達觀數據創始人兼CEO。他為公司新入職的同事下發了一套題――如何預測泰坦尼克號上的幸存者。整套題通過獲取泰坦尼克號上所有乘客的真實信息,包括性別、年齡、職業、票價、艙位等,然后編寫程序來預測這2000余名乘員中哪些人最終得以生還。

在陳運文眼里,將所有信息加以綜合挖掘,就能夠推演出最終的答案―“705名生還者都可以準確預測?!?/p>

預測這樣的事件只是數據挖掘的一個案例,對于極客而言,只要給他們足夠的信息,這個世界就沒有意外和偶然。

現在,陳運文用自己的技術幫助企業進行商業決策。雖然只成立不到半年,但這個隱藏在張江天之驕子公寓里的創業公司已經獲得真格基金和盛大網絡創始人陳大年的投資。

陳運文將第一批客戶瞄準為自媒體人,通過數據分析,為自媒體提供可以引發熱議的話題,并告訴這些作者,什么人喜愛看他們的文章、會關注什么話題。

讓機器自己學會分析信息早就在商業行為中廣泛存在。在百度工作期間,陳運文負責搜索引擎的核心算法研究,主要“為用戶提供最有價值的信息”。 工作的難點不在于搜索信息,而在于讓機器認知用戶的搜索意圖。

用戶經常會在搜索框中輸入“口語詞匯或者模糊的語句”,服務器要從人們的搜索語句中判斷真正的需求。陳運文就需要設計算法讓搜索引擎理解用戶的語義,從數百億的網頁中迅速找到對用戶最有價值的結果。這種“算法”就屬于人工智能。百度每天的搜索有數十億次,每當陳運文改進了算法都能看到用戶點擊的滿意度在上升。

今天這種依靠數據挖掘技術來提高企業運作效率的方法變得更常見,業內將其稱為“商業智能”(Business Intelligence)技術。陳運文計劃將這種技術在云端運用,另一些同類公司則將這種技術直接運用在軟件上。2010年在美國納斯達克上市的Qlik公司就是商業智能軟件的代表企業。他們的QlikView軟件為用戶提供“可視化”的大數據服務。

“我們的軟件可以理解數據,挖掘數據并將其用更直觀的方式展現給客戶,以幫助管理層做出決策?!?Qlik亞太區制造業和高科技市場開發總監Jeremy Sim對《財經天下》周刊表述。

這些帶有“預測”功能的軟件已經在服務并改變人們的生活,比如根據顧客的購買信息QlikView會提示便利店店長,售貨架上的麥片不應該和面包擺在一起,雖然它們都是早餐食品,但如果將麥片和酸奶擺在一起,銷售數字會更好看。此類預測還進一步提醒物流部門,盡量地在頭天晚上補足麥片和酸奶貨源。這類商業智能的應用滲入所有人的生活,以這家公司為例,他們已經在全球100多個國家招徠了3.8萬企業客戶,間接服務人群上千萬。

未來這些帶有“智力”的系統將會更多的出現在電商、醫療、教育、金融等領域?!氨热珉S著智能手環的增加,會有更多的健康數據被采集,那么我們會提供健康預警、治療方案推薦等服務?!标愡\文說?,F在只是大數據挖掘的初級階段,人工智能時代也才剛剛開啟。 視覺理解,打造機器之目

2014年6月,比爾?蓋茨訪華,除了見政商要員外,他還專門造訪了一家剛成立一年的創業公司―格靈深瞳。對于這家初創公司,比爾蓋茨留下了兩句后來被廣泛引用的評語“This is very cool”和“IT界的下一個大事件是計算機視覺(computer vision)與深度學習(deep learning) 的結合”。

格靈深瞳就是這樣一個結合了計算機視覺和深度學習為一身的酷公司。創始人趙勇是致力于視覺理解的知名極客,雖然他本人并不喜歡這個稱謂。

“極客(Geek)在英文里形容書呆子,只會做技術不通世事,但我覺得我是一個懂技術的正常人?!彼麑Α敦斀浱煜隆分芸f。

趙勇專攻計算機視覺和運算影像學,2009年入職谷歌總部研究院任資深研究員,是谷歌眼鏡項目的骨干?!拔覀儓F隊負責谷歌眼鏡的場景識別技術,利用谷歌街景來判斷使用者所處的位置?!焙唵蔚卣f就是將谷歌眼鏡捕獲的圖像和谷歌街景做比對,然后快速地定位用戶所處位置和周邊信息。谷歌眼鏡可以在500毫米之內將用戶的位置精確到米級別。趙勇說谷歌眼鏡并不是“進化的產品,而是從無到有的突破”。

2013年初,趙勇回國創業成立格靈深瞳,并在三個月后拿到真格基金和聯創策源的聯合天使投資,同年6月格靈深瞳又拿到紅杉資本 A 輪高達數千萬美元的投資。

業內傳播著投資人爭論其未來估值的段子,據說某次飯局上真格基金的徐小平、紅杉資本的沈南鵬和聯創策源的馮波討論格靈深瞳的未來估值,徐小平認為起碼5000億美元,而沈南鵬認為1000億美元,最后馮波折中地認為3000億美元。而現在中國電商巨頭阿里巴巴的市值還不到1900億美元。

受到比爾?蓋茨和投資人如此追捧的原因在于趙勇的研究方向―計算機視覺,這是機器學習中極為復雜的領域。

將趙勇和陳運一個對比就可以看出他們研究方向的不同。趙勇認為數據挖掘是讓計算機理解“結構化信息”,結構化指那些人工制作的成型的信息數據,例如一句話一段文字或者一份表格。但計算機視覺需要讓機器理解飄過鏡頭的一片樹葉,或者悄悄走過的一只貓。

陳運文對此也做了比較,他認為數據挖掘更多的是處理文本信息,而文字是具象的表達,機器看到漢字“貓”或者英文“cat”就可以理解這是一種動物,但圖片是抽象信息,給計算機看一張貓的圖片,讓它去理解貓的概念非常困難。

所以當2012年6月谷歌X實驗室宣布他們研發的“谷歌大腦”通過百萬張圖片的學習后可以識別“貓”的時候,全世界都為之震驚。這意味著谷歌培養的這個“孩子”具備視覺理解的能力可以“看圖說話”了。而參與“谷歌大腦”研發的吳恩達博士(Andrew Ng)也因為這個項目被譽為“谷歌大腦之父”,成為機器學習領域最權威的學者。

為了建造“谷歌大腦”,吳恩達使用了神經網絡系統,他們連接了1.6萬片處理器創造了一個擁有10億多條連接的神經網絡,并逐步地培訓這個系統,直到它擁有識圖的能力。

現在,趙勇做的事情與此類似。

他通過影像設備捕捉實時畫面,讓計算機識別這個真實世界,更為直接的說法或許是―趙勇正在研制“機器人之眼”。

像谷歌一樣,想讓計算機能識別圖像,趙勇也需要制作一個“深度神經網絡”系統。

在人腦中有大約1000億個神經元,神經元通過神經突出連接在一起就變成了一個神經網絡,人們思考問題的時候這些神經網絡相互激發,最終產生決策。現在極客們用計算機來模擬這個過程,用計算程序建立起龐大的計算元素,這些程序運算的結果通過網絡互為交換互相影響,最終產生結果,這就是初級的人工神經網絡。人工神經網絡層級越多規模越大,其“聰明程度”就越高,學習的能力就越強。

要培養這樣一個會“識圖的孩子”,趙勇除了要建立這樣一套龐大的神經網絡之外,還需要不停訓練這個網絡。

“可以將神經網絡當成一個黑盒子,我在里面設定了一些基本參數,隨后不停的往里面輸入數據、圖片來訓練它,通過這種大量的訓練,黑盒子里面參數的連接會越來越緊密,整個網絡也會越來越聰明,最終變成一個可以識別圖片的智能系統。”

嚴格地說,人工智能不是人類設計出來的,而是人類訓練出來的。即便是趙勇這樣的創建者也無法知道這些神經網絡到底如何相互作用相互影響,并最終形成自己的智能系統。他能做的只是“選擇輸入數據,控制訓練方向”。

依舊以老師教育孩子做比喻,雖然趙勇這個老師不知道孩子是怎么理解圖片,識別這個世界的,但他可以控制教學的內容,讓這個孩子朝某個方面學習。

趙勇花費了兩年時間才為格靈深瞳培養出自己的“孩子”,并將這些有“識圖能力”的人工智能設備應用到安防監控和汽車識別方面。

去年格靈深瞳推出了名為“目”的行為分析儀,這是一個包含軟硬件于一體的智能監控產品。“目”會實時監控場景內的情況,發覺異常就立刻報警或者提醒工作人員注意。而在另一個名為“威目”的產品中,格靈深瞳做到了車輛識別,他們訓練系統辨識超過5000種車輛,這幾乎涵蓋了地球上所有的汽車類型。這種能力為警方辦案提供了幫助,警方可以用“以圖搜圖”的方式讓“威目”提供他們需要的視頻資料?!熬教峁┮粡埰囌掌?,威目在識別照片之后可以從交通錄像中找出該車的行動軌跡?!背酥?,該系統還可以搜索“結構化信息”,例如在系統中輸入2004年生產車牌中含有5這個數字的紅色奧迪A4汽車,“威目”就會在資料中截取相關的圖像或者視頻,而此前這些工作都需要人工完成。

如果計算機視覺技術以這樣的速度繼續,或許用不了幾年,當我們站在攝像頭前時,計算機會在屏幕上敲出那句讓人激動的言語―“I see you .” 造物者

“谷歌大腦之父”吳恩達在完成了“認貓”創舉兩年后離開了谷歌,加盟了百度,任職百度首席科學家并負責“百度大腦”的研發。

說服吳恩達做此決定的是他的好友,現任地平線機器人技術CEO的余凱。

余凱是國際知名的機器學習專家,他牽頭成立的百度深度學習研究院是國內第一個研究深度神經網絡的研究機構,加盟百度時被李彥宏稱為“鎮院之寶”。

“深度網絡學概起始于2006年,當時主要有5個機構從事這方面的研究,分別是多倫多大學、紐約大學、美國的NEC實驗室、斯坦福大學和蒙特利爾大學,而我當時在NEC實驗室工作。”余凱說。有段時間他還在斯坦福大學執教《人工智能概論》。他領導的團隊在深度學習、圖像識別、文本挖掘、多媒體檢索、視頻監控,人機交互等機器學習領域都有建樹。

去年余凱離開百度,在中關村的創富大廈租賃辦公室成立地平線機器人技術。成立僅4個月,這家公司就迎來了首輪投資,投資方包括晨興資本、高瓴資本、紅杉資本、金沙江創投等多家機構。

比起商業上的追求,余凱更想用技術改變世界―為萬物裝上人工智能的大腦,讓它們變成擁有智能思維的機器人。

在余凱看來,他在百度的工作主要是在“云端”搭建人工智能深度神經網絡,其服務主要體現在“為用戶提供更智能的互聯網服務”,他希望通過人工智能技術應用到物理世界中,讓人們的生活變得更方便和簡單?!艾F在很多電器都采用軟件結合互聯網操控,我希望未來都可以實現本地人工智能操控?!?/p>

他準備讓汽車、空調、冰箱、微波爐等上千種產品或設備都具有從感知到決策的能力。比如用戶進入房間時空調就可以感知人的位置和體溫自動開機送風,并追隨人的移動而改變送風方向;冰箱則會讀取存儲食物的信息,及時提醒用戶食用或補充。

余凱利用深度神經網絡算法來搭建他的人工智能框架。他將這種人工智能系統描述成“類似于安卓的智能硬件的大腦平臺”,這個系統可以安裝在不同的產品中。

他“改造萬物”的計劃先從家居產品和汽車兩個方面著手。地平線機器人技術研發了針對這兩個行業的人工智能操作系統。家居方面的基于深度神經網絡的操作系統名為“安徒生”,汽車的則稱為“雨果”。

現在 “安徒生”已經入駐家電產品,在剛剛過去的上海家博會展上,地平線機器人和某國內知名家電廠商合作的兩款智能產品面世參展?!艾F在業界最大的智能家居廠商都是我們的客戶,我們向他們提供算法操作系統,并告訴他們如何配置硬件設備,就像安卓向手機廠商提供參考設計一樣?!?/p>

下一步余凱準備讓“雨果”進入汽車自動駕駛領域,在安裝了傳感器、處理器和雨果大腦平臺后,汽車可以成為提供無人駕駛或智能駕駛的新型交通工具。

“定義萬物智能的大腦,這還要花很長時間,但是我覺得一步一步往那邊靠近。” 余凱知道地平線機器人的征程漫漫,但對于AlphaGo對戰李世石這樣的人機大戰新聞他卻無比篤定?!百惽皫缀跛袑<叶颊f這次機器贏不了,但我在接受網易采訪的時候就公開預測機器會贏,因為我了解AlphaGo的算法?!?/p>

陳運文也表達了相同的猜測。3月9日下午,陳運文就興奮地預測AlphaGo能夠獲勝,那時首爾的李世石剛在棋盤上落下自己的第一枚黑子。

3個小時后,對弈到186手時李世石投子推枰宣告認輸。

亚洲精品一二三区-久久