神經網絡文本分類范例6篇

前言:中文期刊網精心挑選了神經網絡文本分類范文供你參考和學習,希望我們的參考范文能激發你的文章創作靈感,歡迎閱讀。

神經網絡文本分類

神經網絡文本分類范文1

關鍵詞:極限學習機;稀疏自動編碼器;集成學習;文本分類

1 概述

隨著現代社會的發展,互聯網成為了人們獲取文本信息的重要手段。然而網上的信息雜亂無章,使得人們很難快速而準確的獲得所需要的文本信息。因此如何有效的對文本進行分類,幫助用戶找到所需的信息成為當代信息技術領域的一個重要課題[1]。

本文提出利用深度學習中的稀疏自動編碼器自動選取文本的特征,然后利用極限學習機作為基分類器進行文本的分類,最后結合Adaboost集成學習方法將極限學習機作為基分類器組合成一個效果更好的分類器。實驗結果表明,該算法在文本分類方面,可以有效地提高文本分類的準確性。

2 相關理論基礎

2.1 稀疏自動編碼器

稀疏自動編碼器(sparse auto encoder,SAE)是利用人工神經網絡的特點構造而成的網絡。稀疏自動編碼器的訓練過程分為兩個步:第一步是預訓練,即先利用無監督的方法將SAE的輸入層和隱含層全部初始化,然后再利用逐層貪心訓練算法確定網絡的參數。第二步是微調,其思想是整個網絡視為一個整體,用有監督學習的方法優化整個網絡的參數,由于SAE訓練過程的復雜性,具體過程可參考文獻[2]。

2.2 極限學習機

針對傳統神經網絡訓練過程時間漫長,優化困難等缺點,新加坡南洋理工大學的黃廣斌教授提出了一種全新的單隱層前饋神經網絡-極限學習機(Extreme Learning Machine,ELM)[3],該網絡能夠以極快的學習速度達到較好的泛化性能,從而解決了傳統神經網絡學習速度緩慢的限制。該網絡主要由輸入層,隱藏層和輸出層組成,其中隱藏層的神經元通過激活函數把輸入的數據進行變換,然后把變換后的數據輸出到輸出層,在網絡中輸入層和隱藏層的權值是隨機設置的,只有隱藏層到輸出層的權值需要求解,因此加快了網絡的學習速度。

2.3 Adaboost分類器

由于單個分類器通常無法滿足分類任務的要求,因此需要通過集成學習來構建并結合多個分類器來完成分類任務,這其中最著名的是在1995年由Freund等提出的Adaboost[4]算法。該算法的核心思想是先從初始訓練集訓練出一個基學習器,再根據基學習器的變現對訓練樣本分布進行調整,使得先前基學習器做錯的訓練樣本在后續收到更多關注,然后基于調整后的樣本分布來訓練下一個基學習器;如此重復進行,直到基學習器數目達到指定的值,最終將這幾個基學習器進行加權結合。Adaboost是一種迭代算法,具體訓練過程可參考南京大學周志華教授編寫的機器學習課本中關于Adaboost算法的章節。

3 SEA文本分類算法

在本文中,結合稀疏編碼器,極限學習機與Adaboost這三種機器學習方法提出SEA文本分類算法,該算法的工作流程如圖1所示。

該分類算法的第一步為輸入,輸入的是經過了向量化表示的文本,但沒有經過任何的手工特征提取。第二步是利用SAE算法對數據的重建能力自動選擇文本的特征,用SAE算法選擇的文本特征可以有效地復原原始文本信息。第三步是利用ELM分類器作為該算法的基分類器,ELM作為第四步中的基分類器參與訓練,最后一步是輸出該文本屬于哪一類。

4 實驗結果與分析

4.1 實驗數據集與評價指標

本文選用的分類文本數據來源于新聞數據集[5],該數據集復旦大學計算機信息與技術系李榮陸提供,數據集標注比較規范,規模適中,適合于進行文本分類的仿真實驗。

在文本分類中常用的評價指標有準確率P(Precision)和召回率R(Recall),公式如下:

P=M/(M+N),R=M/(M+T)

其中,M為正確分類到該類的文本數,N為錯分到該類中的文本數,T為屬于該類確誤分為別類的文本數。

4.2 實驗結果

為驗證本文提出的SEA文本分類模型,需要將文本數據集進行預處理,對于SEA模型來說,就是進行文本分詞。本實驗文本分詞采用的是NLPIR漢語分詞系統,其主要功能包括中文分詞,詞性標注,命名實體識別,用戶字典功能等,是國內比較成熟,用戶較多的中文文本分詞系統。經過文本預處理后,按照本文提出的SEA文本分模型進行實驗,并和幾種經典的分類算法做對比。在本實驗中Adaboost集成學習算法中基分類器的個數設置為10個,基分類器ELM中隱藏層的個數設置為輸入層的0.75倍,稀疏自動編碼器中隱藏層數設置為4,實驗結果如表1和表2所示。

從表1和表2可以看出隨著文本數量的增加,SEA模型的分類準確率和召回率逐漸提高,這是由于在訓練數據集較小時,稀疏編碼器對自動提取的文本特征變現地不是很理想,容易造成SEA分類模型產生過擬合現象,從而影響分類準確率和召回率。SVM算法在訓練數據集比較小時,變現良好,這是由于在訓練數據較少時,可以較容易地找到分類超平面,在數據量變大時,由于計算量的增大,使得計算量變大,導致計算得到的超平面效果不好,使得分類準確率和召回率不斷下降。BP和ELM算法都隨著訓練數據的增大,其分類準確率和召回率在不斷變大,這是由于隨著訓練數據的增大,BP和ELM可以更有效的提取輸入數據的特征,但ELM算法相比BP算法變現得更好,這是由于BP算法可能無法收斂到最優值,導致分類算法的準確率下降。

綜上所述,本文提出的SEA文本分類模型可以有效的提高文本分類的準確率和召回率,尤其是隨著訓練數據集的不斷增大。

5 結束語

文本分類在文本處理中占據著重要的地位,其分類的好壞直接影響著后續的文本處理,如何有效地對文本分類是一個重要的研究課題。本文結合稀疏自動編碼器,極限學習機與Adaboost集成學習方法提出SEA文本分類方法,實驗結果表明該分類方法可以有效將文本分類過程中的特征提取和分類器結合在一起,從而提高了分類結果的準確性。

參考文獻

[1]秦勝君,盧志平.稀疏自動編碼器在文本分類中的應用研究[J].科學技術與工程,2013,13(31):9422-9426.

[2]Baldi P, Guyon G, Dror V, et al. Autoencoders, Unsupervised Learning, and Deep Architectures Editor: I[J].Journal of Machine Learning Research,2012.

[3]Huang G B, Zhu Q Y, Siew C K. Extreme learning machine: Theory and applications[J]. Neurocomputing, 2006,70(1-3):489-501.

[4]Freund, Yoav, Schapire, Robert E. A Decision-Theoretic Generalization of On-Line Learning and an Application to Boosting[J]. Journal of Computer & System Sciences, 1999,55(1):119-139.

神經網絡文本分類范文2

自動鍛壓機封閉高度調整改進設計

基于Matlab的三相電壓型PWM整流器的仿真研究

基于多傳感器數據融合的火災報警系統設計

模擬氫冷汽輪機轉子節能改進

基于VB的大學物理實驗數據處理系統的設計與實現

用激光光源測量凸透鏡焦距實驗探究

項目反應理論在計算機自適應題庫建設中的應用

基于遺傳算法的排課設計

AutoCAD的三維造型與工程圖轉換技術研究

論“云計算輔助教學”CCAI及教學資源組織

基于SOA的數字化校園應用模式的研究

模板法制備納米復合光催化材料HPA/TiO_2

YK73400L數控成形磨齒機工藝設計

環保透水磚的制備與性能研究

混凝土在雙向受壓下力學性質的試驗研究

自動鍛壓機凸模推出機構改進設計

樹麻雀的體溫調節

扎龍濕地面積動態變化趨勢數學模型及因素分析

基于ARIMA的居民消費價格指數建模與預測

用矩陣實現模糊本體映射

激光跟蹤儀在主軸箱體檢測上的應用

一種BP神經網絡改進算法的研究

傳感式智能家用煤氣表的研制

基于對象方向方位的連續方向查詢算法

一種有效檢索和更新移動對象的混合索引結構

較長銷孔加工方案分析

移動對象流量查詢方法研究

空間數據庫R-tree連接方法研究

關聯規則挖掘在臨床診斷中的應用研究

基于距離和的數據挖掘技術在中考成績處理中的應用

燃氣爐供熱改善大氣環境的方法

三層C/S通用試題庫系統的需求分析和總體設計

外凸輪輪廓曲線加工誤差分析

基于單片機的步進電機控制系統的研制

基于組合核支持向量機的圖像邊緣檢測

衣康?;到鈿ぞ厶窃趤喡榭椢餆o甲醛防皺整理中的應用

二氧化硅-氧化鋅溶膠凝膠法制備固相微萃取涂層的研究

燃硫爐出口溫度與三氧化硫氣體濃度的關系

基于網格和XML的異構數據庫集成模型

Excel表格計算工程預算的工程量方法

BP神經網絡在蜜網系統中的應用

改進BP神經網絡在個人信用評估系統的應用

GIS系統在城市燃氣管網中的應用

基于USB接口的便攜式溫濕度記錄儀的設計

基于OracleWebServer的管理信息系統開發

Liu-Liu-Liu-Liu系統的混沌同步

企業實施SPC核心工具——控制圖方法研究

PL/SQL在求解最短路徑問題中的應用

城市燃氣用戶軟管的安裝問題研究

基于廣播模式的錄井儀實時數據傳輸系統的設計與實現

垂直井筒兩相流溫度場的模擬計算

基于固定網絡的移動對象軌跡查詢

壓縮天然氣管道輸送應用研究

CISC與RISC結構CPU間軟件移植技術問題分析

液化石油氣管道供氣方式的應用研究

神經網絡文本分類范文3

獅子關庫區植物群落喬木層優勢種及群落分類

獅子關庫區森林群落演替過程和結構動態

日本落葉松人工林單木模型的研究

論生態林業的理論與實踐途徑

鄂西南地區松褐天牛生物學特性及發生規律研究

應用M99-1引誘劑監測馬尾松病蟲害的研究

松材線蟲在受害馬尾松樹體內的分布及取樣部位研究

湖北恩施松材線蟲病的防治現狀及對策

胡蘿卜板栗糕的試制

丁草胺對水稻根系活力和C/N的影響

TGF-β_1對不同肺癌細胞生物學行為的影響

動物中天然抗癌產物研究

聚合物固體酸催化合成丙烯酸雙酯——固體酸的合成

三溴偶氮氯磷-溴代十六烷基吡啶-釤-乙醇顯色體系的分析研究

化學修飾電極及其測定痕量Pb2+、Cd2+、Hg2+的應用

光度法測定魚腥草中有效成分的質量分數

以β-環糊精衍生物為柱層析固定相拆分氨基酸對映體

化學工業的可持續發展之路——綠色化學

模糊度量空間中的不動點及應用

祝賀生物資源保護與利用湖北省重點實驗室順利通過驗收評估以評促建以評促改以評促發展

奇素數方冪中的孤立數

一類具混合功能反應函數的三種群捕食鏈模型分析

脈沖時滯Cohen-grossberg神經網絡的指數穩定性

一類成批服務排隊模型的時間依賴解的存在唯一性

基于模糊綜合評判的學生綜合素質評價體系

內積H-Z-空間及其性質

關于integralfromx=ato+∞(f(x)dx)的收斂性與limfrom(x+∞)(f(x))=0的關系

復平面上多項式的零點問題

平面復合材料熱傳導問題的一個新的多尺度漸近展開式

對牛頓迭代法條件的一個改進

基于MATLAB的血管三維重建

基于信息熵的TFIDF文本分類特征選擇算法研究

一種基于勢場的威脅模型及其應用

基于協同模式的一站式服務系統的設計與實現

基于ArcGISServer的企業級WEBGIS的設計與開發

整周模糊度的一種半參數解算方法

GPS高程測量精度分析

優質油菜栽培與養分管理智能決策系統的設計與實現

恩施州煙葉生產區域劃分及配套栽培技術措施研究

祝賀生物資源保護與利用湖北省重點實驗室順利通過驗收評估以評促建以評促改以評促發展

奇素數方冪中的孤立數

一類具混合功能反應函數的三種群捕食鏈模型分析

脈沖時滯Cohen-grossberg神經網絡的指數穩定性

一類成批服務排隊模型的時間依賴解的存在唯一性

基于模糊綜合評判的學生綜合素質評價體系

內積H-Z-空間及其性質

關于integralfromx=ato+∞(f(x)dx)的收斂性與limfrom(x+∞)(f(x))=0的關系

復平面上多項式的零點問題

平面復合材料熱傳導問題的一個新的多尺度漸近展開式

對牛頓迭代法條件的一個改進

基于MATLAB的血管三維重建

基于信息熵的TFIDF文本分類特征選擇算法研究

一種基于勢場的威脅模型及其應用

基于協同模式的一站式服務系統的設計與實現

基于ArcGISServer的企業級WEBGIS的設計與開發

整周模糊度的一種半參數解算方法

GPS高程測量精度分析

神經網絡文本分類范文4

關鍵詞:人工免疫網絡;免疫記憶;網絡文本分類

中圖分類號:TP181文章標識碼:A文章編號:1009-3044(2011)26-6492-02

Research of Web Text Classification Based on Artificial Immune System

ZHANG Wei-gang, CHEN Jun-zhang

(Information Engineering Department, Xuchang Vocational Teachnical College, Xuchang 461000, China)

Abstract: This paper concisely introduces some important function and character of narure immune stytem first,and then a new web text classification on artificial immunenetwork memory is presented, which is based on the principle of immune memory. The result of test show that the classifier can class web text fastly and accyracy.

Key words: artificial immune system; immune memory; web text classifier

目前使用的文本分類方法主要有支持向量機(SVM)、K近鄰法、決策樹、線形最小二乘法估計和貝葉斯分類算法。人工免疫網絡記憶分類器(AINMC)受到人工免疫系統(AIRS)的啟發,借鑒人工免疫網絡(aiNet)利用人工免疫產生記憶細胞的思想,將其發展為監督學習系統,并用于數據分類研究。基于人工免疫網絡記憶分類器(AINMC)的文本分類系統能夠將大量文本自動分類,以更好地幫助人們更快地找到所需的信息。

1 人工免疫系統

人工免疫系統是模仿自然免疫系統功能的一種智能方法,它實現一種受生物免疫系統啟發,通過學習外界物質的自然防御機理的學習技術,提供噪聲忍耐、無教師學習、自組織記憶等進化學習機理,結合了分類器、神經網絡和機器推理等系統的一些優點,因此具有提供新穎的解決問題方法的潛力。

本文受自然免疫系統的免疫記憶特性的啟發,提出一種利用人工免疫網絡記憶分類器(AINMC)進行網絡文本分類的方法。

2 AINMC網絡文本自動分類

2.1 特征提取步驟

待分類網絡文本以HTML格式存儲,在利用AINMC進行分類前要首先對該文本進行特征提取。

1) 預處理過程一是要根據禁用詞集去除文檔中語義虛泛和頻繁出現的詞,如地、因此、的、the、a等。二是要對某些表達不同但概念相同的詞語映射為同意概念,例如“計算機”和“電腦”,就要影射為“計算機”。

2) 特征提取

在特征提取算法采用完整的頁集合D=(d1,d2,d3,…,dN)建立網頁中所有詞的列表W=(w1,w2,w3,…,wM)。N,M分別為文件總數和列表中詞的總數。這樣就可以模擬每一個文件di(i=1,2,3,N)為M維空間RM中的一個向量Vi=(vi,1,vi,2,…,vi,M)。vi,j(j=1,2,…,M)表示詞wj(j=1,2,…,M)在文件di(i=1,2,…,N)中出現的關系度量。我們已經預處理了常用詞等對分類沒積極意義的詞,所以利用詞w∈W出現或不出現的期望信息增益E(w,D)確定D的類別,其中P(w=pres)是一個詞在任何頁上至少出現一次的概率,Dw=pres是含有詞w的網頁集合。DC是屬于類別C的網頁集合,P(DC)是一個網頁屬于該類的概率。給定一個特別的詞在文件中出現或者不出現的概率,需要多少信息的度量。這樣,如果一個特別的詞確定文件在哪一個類中,則第二項最小化,E∈(w,D)最大化。反之,如果一個詞的出現或者不出現不提供關于一個文件在哪一類中的信息,第二項最大化,E∈(w,D)最小化。總之,對一個特殊的詞,期望信息增益E∈(w,D)越高,提供越多的決定一個文件屬于哪一類的信息,則該詞被認為提供越多的信息。用該提取算法提取具有最高E∈(w,D)值的n個詞,建立具有n個特征值的特征向量。

2.2 網絡文本自動分類算法實現

在該算法中,上述經過特征提取的待分類數據即對應抗原,用AG表示;記憶細胞即對應抗體,用mi表示,i是文本類別數,由其組成的集合用M表示。因為分類是有監督學習,可以通過學習對未知的數據進行預測。為了構造分類器,即記憶細胞,需要有一個訓練樣本數據集作為輸入。在初始化階段,我們要把全部抗原隨機分為兩個部分訓練抗原AG1與測試抗原AG2,從訓練抗原AG1中隨機抽取一部分用來構造初始記憶細胞集合mi,余下的用來對我們初始形成的記憶細胞集合進行訓練。記憶細胞與訓練抗原模擬生物免疫網絡抗體抗原之間的相互作用,依照它們之間親和力的大小,對初始記憶細胞集合進行優化。對能夠與抗原相匹配的記憶細胞進行克隆與變異??寺∈菍ζヅ溆洃浖毎M行復制,變異是優化記憶細胞,對記憶細胞的局部特征進行變異,能更成功的識別抗原。變異是該過程需要不斷的重復以更好的優化記憶細胞集合,重復次數可根據實際抗原設定。在重復的過程中,不僅要計算記憶細胞與抗原的親和力來選擇記憶細胞進行克隆與變異,而且還要計算記憶細胞間的親和力,將親和力小于設定閾值的記憶細胞清除,以完成克隆選擇。經過該重復過程形成最優的記憶細胞集合M,利用該集合對待分類數據進行自動分類。其算法如下所示:

Begin:

將待分類數據進行特征提取;

用全部抗原隨機形成訓練抗原AG1和記憶細胞集合mi;

While(訓練抗原中每個抗原都與記憶細胞相互作用)

{

依據歐幾里德距離計算初始記憶細胞與訓練抗原親和力;

選擇親和力最大的n個抗體,對每個選取的抗體依據親和力的大小克隆NC個,親和力越大,NC越大;

對克隆的抗體進行變異,以產生具有更高親和力的抗體;

重新計算各變異后的抗體與抗原的親和力,選擇一定數量具有最高親和力的抗體作為記憶集合;

去除記憶集合中相似度大于閾值σs的個體,產生新的記憶體集合

}

將每個訓練抗原產生的記憶體集合合并為記憶集合M,即分類器;

分類:

利用分類器M對AG2進行自動分類;

End;

3 結論

人工免疫系統在數據挖掘、信息提取、模式識別等領域的應用來源與它自身較強的學習、記憶及自適應調節能力。它通過對網絡抗體以記憶數據集迭代克隆變異及抑制操作,從中提取有用特征信息,最終達到識別和分類的要求。對于不同的信息分類要求,在學習,記憶過程中,應合理地調整親和力閾值σr、σs的大小,從而獲得準確的分類效果。

參考文獻:

[1] 程傳鵬,李鉅.中文網頁分類征提取的研究[J].中原工學院學報,2005,16(6):261-265.

[2] Jerne N K.Towards a Network Theory of Immune System[J].Annual Immunology,1974,125C:373-389.

神經網絡文本分類范文5

s—橋圖的色惟一性

對正項級數斂散性判別法的關系的一些探討

實現任意方向橢圓繪制的簡便方法

對極大等重等距碼結構的進一步分析

計算變截面梁橫向振動時桿端力的調和分析法

心臟標記法有限元解的誤差分析

Cs-137γ射線透射法檢測輸油管道油垢的模擬實驗研究

n-Ge樣品中的反常伏安特性

超臨界CO_2色譜法在分析番茄紅素中的應用

薰衣草揮發油化學成分的GC-MS分析

微波溶樣-ICP-AES法測定番茄原料及其萃余物中的微量元素

新疆紅景天紅色素的提取及理化性質的研究

新疆野生黑加侖與馬林果實的營養成分分析

芒硝太陽池的研究

維吾爾族長壽老人紅細胞ABO血型遺傳多態性分析

紅花柄銹菌Pucciniacarthami(Hu+z)Cda生活史超微結構研究

新疆農田十字花科主要雜草幼苗分類特征研究

陸地棉體細胞胚胎的發生和遺傳轉化條件初探

甜菜糖蜜酒精廢液生產菌體蛋白飼料初探

一類可靠性模型研究中出現的投影算子的表達式及其應用

東天山成礦背景及規律(英文)

巨大尺寸零件逆向重構技術應用研究

基于數據挖掘的復合聚類法

有向圖及乘積圖的路由數(英文)

Rb(5P_J)與He的碰撞精細結構混合和猝滅(英文)

遺傳算法研究Pd_n(n=2-57)團簇的結構特性

激發態中的重雙夸克能譜

碳四烴綜合利用研究及評述

固相紫外光接枝對聚丙烯樹脂力學性能的影響

MA_m-St型柴油降凝劑的合成及其研究

裂解氣相色譜質譜法研究增塑劑鄰苯二甲酸二甲酯的熱降解機理

重組真核表達載體pEGFP-C1/cecropin-XJ的構建及其在胃癌細胞MGC80-3中的表達

沙拐棗屬(CalligonumL.)分類學研究進展

新疆杏核結構物理特性的分析與探討

國外城市園林景觀灌溉系統應用與實踐

新疆旅游資源的可持續開發分析

基于數字證書的校園網安全通信模型的實現

電子商務中協商交易的研究及實現

基于粒子群優化的神經網絡預測模型

泡型圖的條件匹配排除

復擬Banach空間的解析q一致凸性與Hardy鞅的原子分解

Herz型Triebel-Lizorkin空間和Herz型Besov空間上的粗糙核奇異積分(英文)

二階變系數非齊次微分方程邊值問題(英文)

非自治的具有階段結構的時滯捕食被捕食模型的周期解(英文)

Rh_nCr(n=1~7)團簇結構和電子性質的密度泛函理論研究

溶劑熱法合成Fe_3O_4八面體微晶及表征

VO_x/SiO_2催化劑上正丁烷氧化脫氫

氫化物發生-原子熒光光譜法測定環境空氣中砷和銻的結果不確定度評定

電子詞典軟件系統中對維、哈、柯文進行自動判別技術的研究

基于系統效益的循環結構網格工作流調度算法

基于二叉樹的多類SVM在Web文本分類中的應用研究

神經網絡文本分類范文6

手語是聾啞人使用的語言。它是由手形動作輔之以表情姿勢而構成的比較穩定的表達系統,是一種靠動作/視覺進行交際的特殊語言。

人類交互往往聲情并茂,除了采用自然語言(口語、書面語言)外,人體語言(表情、體勢、手勢)也是人類交互的基本方式之一。與人類交互相比,人機交互就呆板得多,因而研究人體語言理解,即人體語言的感知,及人體語言與自然語言的信息融合對于提高計算機的人類語言理解水平和加強人機接口的可實用性的極有意義的。手語是人體語言的一個非常重要的組成部分,它是包含信息量最多的一種人體語言,它與語言及書面語等自然語言的表達能力相同,因而人機交互方面,手語完全可以作為一種手段,而且具有很強的視覺效果,它生動、形象、直觀。

手語的研究不僅有助于改善和提高聾啞人的生活學習和工作條件,為他們供更好的服務。同時也可以應用于計算機輔助啞語教學、電視節目雙語播放、虛擬人的研究、電影制作中的特技處理、動畫的制作、醫療研究、游戲娛樂等諸多方面。另外,手語的研究涉及到教學、計算機圖形學、機器人運動學、醫學等多學科。因此,手語的研究是一個非常有意義的課題。這里將結合國內外手語研究的相關方向,對手語的識別、手語的合成、手語的網絡通信、手的運動約束這幾方面作一下綜述。

1 手語的識別

手語的識別不但具有深遠的研究意義,而且具有廣闊的實際應用前景,至少表現在以下幾個方面:(1)能夠使得聾啞人,尤其是使得文件程度比較低的聾啞人,使用手語和正常人交流;(2)從認知科學的角度,研究人的視覺語言理解的機制,提高計算機對人類語言的理解水平;(3)利用手勢控制VR中的智能化;(4)機器人的示范學習;(5)虛擬現實系統中的多模式接口等。

從手語輸入設備來看,手語識別系統主要分為基于數據手套的識別和基于視覺(圖像)的手語識別系統?;跀祿痔椎氖终Z識別系統,是利用數據手套和位置跟蹤測量手勢在空間運動的軌跡和時序信息。這種方法的優點是系統的識別率高。缺點是打手語的人要穿戴復雜的數據手套和位置跟蹤器,并且輸入設備比較昂貴。利用數據手套等典型傳感設備的方法,臺灣大學的Liang等人利用單個VPL數據手套作為手語輸入設備,可識別臺灣手語課本中的250個基本詞條,識別率為90.5%。CMU的Christopher Lee和Xu在1995年完成了一個操縱機器人的手勢控制系統。Kadous用Power Gloves作為手語輸入設備,識別有95個孤立詞構成的詞匯集,正確率為80%。基于視覺的手勢識別是利用攝像機采集手勢信息,并進行識別。該方法的優點是輸入設備比較便宜,但識別率比較底,實時性較差,特別是很難用于大詞匯量的手語錄的識別。在基于視覺的方法方面,具有代表性的研究成果包括:1991年富士通實驗室完成了對46個手語符號的識別工作。Davis和Shah將戴上指間具有高亮標記的視覺手套的手勢作為系統的輸入,可識別7種手勢。Starner等在對美國手語中帶有詞性的40個詞匯隨機組成短句子識別率達到99.2%。Grobel和Assam從視頻錄像中是取特征,采用HMM技術識別262個孤立詞,正確率為91.3%。此外,Vogler與Metaxas將兩種方法結合用于美國手語識別,交互采用一個位置跟蹤器及三個互相垂直的攝像機作為手勢輸入設備,完成了53個孤立詞的識別,識別率為89.9%。

從識別技術來看,以往手語識別系統主要采用基于人工神經網絡(ANN)及基于隱Markov模型(HMM)等方法。神經網絡方法具有分類特性及抗干擾性,然而由于其處理時間序列的能力不強,目前廣泛用于靜態手勢的識別。著名的Fels的GloveTalk系統采用神經網絡方法作為識別技術。對于分析區間內的手語信號,通常采取HMM方法進行模型化。HMM是眾周知并廣泛使用的統計方法,一般拓撲結構下的HMM具有非常強的描述手語信號的時空變化能力,在動態手勢識別領域一直占有主導地址,如卡內基·梅隆大學的美國手語識別系統及臺灣大學的臺灣手語識別系統等均采用HMM作為系統的識別技術。另外,Grobel與Assam利用HMM識別由戴有色手套的用戶通過攝像機輸入的262個孤立手語詞,正確率為91.3%。然而正是由于HMM拓撲結構的一般性,導致這種模型在分析手語信號時過于復雜,使得HMM訓練和識別計算量過大。尤其是在連續的HMM中,由于需要計算大量的狀態概率密度,需要估計的參數個數較多,使得訓練及識別的速度相對較慢。因而以往手語識別系統所采用的HMM一般為離散HMM。

在我國,哈爾濱工業大學的吳江琴、高文等給出了ANN與HMM的混合方法作為手語的訓練識別方法,以增加識別方法的分類特性和減少模型的估計參數的個數。將ANN-HMM混合方法應用于有18個傳感器的CyberGlove型號數據手套的中國手語識別系統中,孤立詞識別率為90%,簡單語句級識別率為92%。接下來高文等又選取Cyberglove型號數據手套作為手語輸入設備,并采用了DGMM(dynamicGaussianmixturemodel)作為系統的識別技術,即利用一個隨時間變化的具有M個分量的混合GaussianN-元混合密度來模型化手語信號,可識別中國手語字典中274個詞條,識別率為98.2%。與基于HMM的識別系統比較,這種模型的識別精度與HMM模型的識別精度相當,其訓練和識別速度比HMM的訓練與識別速度有明顯的改善。他們為了進一步提高識別速度,識別模塊中選取了多層識別器,可識別中國手語字典中的274個詞條,識別率為97.4%。與基于單個DGMM的識別系統比較,這種模型的識別精度與單個DGMM模型的識別精度基本相同,但其識別速度比單個DGMM的識別速度有明顯的提高。2000年在國際上他們首次實現了5000詞以上的連續中國手語識別系統。另外,清華大學祝遠新、徐光等給出了一種基于視覺的動態孤立手勢識別技術,借助于圖像運動的變階參數模型和魯棒回歸分析,提出一種基于運動分割的圖像運動估計方法?;趫D像運動參數,構造了兩種表現變化模型分別作為手勢的表現特征,利用最大最小優化算法來創建手勢參考模板,并利用基于模板的分類技術進行識別。對12種手勢的識別率超過90%。在進一步研究中,他們又給出了有關連續動態手勢的識別,融合手勢運動信息和皮膚顏色信息,進行復雜背景下的手勢分割;通過結合手勢的時序信息、運動表現及形狀表現,提出動態手勢的時空表現模型,并提出基于顏色、運行以及形狀等多模式信息的分層融合策略抽取時空表觀模型的參數。最后,提出動態時空規整算法用于手勢識別。對12種手勢,平均識別率高達97%。

盡管已經實現了一些手語識別系統,但中國手語識別仍然面臨許多挑占性課題,如手勢不變特征的提取、手勢之間的過度模型、手語識別的最小識別基于、自動分割識別基元、詞匯量可擴展的識別方法、手語識別的輔助信息、非特定人的手語識別問題、混合手指語和手勢語的手語識別以及中國手勢語語法等。

2 手語的合成

手語的合成是使聾啞人理解正常語言表達的最有效手段,在手語合成中涉及以下幾個方面的問題:本文輸入部分、文本切分部分、文本的分析與手語碼轉換、手語庫的建立與基于手語詞的手語合成和手語的顯示。

文本輸入部分的功能是編輯輸入漢語句子。文本的切分將句子分成詞,標點符合單獨成詞。系統的分詞過程首先采用最大匹配發切分,然后利用第一步分詞結果通過查找詞條的歧義標志位調用詞規則,進而進行歧義校正。文本分析與手語碼轉換是手語合成的重要部分。雖然中國手語是參考漢語制定的,但是兩種語言的差別主要體現在四個方面:語言表達形態、基本詞匯、句子結構和構詞方法。在語言表達形態上:漢語是靠語音/聽覺交際的有聲語言。中國手語是一種靠動作/視覺交際的可視化語言。在基本詞匯上:漢語的詞匯大約有近五萬多個字組成,總的詞匯量可達十萬多個。中國手語的詞匯僅由3330個手勢語組成。中國手語的手勢詞語與漢語的詞語不完全存在一一對應的關系。在句子的語法結構上:手語句子與漢語句子的詞序有所不同,此外還省略了日常語言的某些詞如量詞。因此從漢語轉換到中國手語,主要解決的基本詞匯上的差別,同時考慮部分詞匯的差別。手語詞庫記錄了每個手語詞的手語運動信息,是手語合成的重要基礎。建立手語詞庫不僅工作量大,而且其質量也直接影響合成手語的結果。目前建立手語詞庫的方法有兩種:運動跟蹤方法和手工編輯方法。也有人綜合使用這兩種方式。運動跟蹤的方法是對腕關節及各手指關節的運動由數據手套獲取,肩關節與肘關節的運動由位置跟蹤傳感器獲取。而手工的方法是通過手工實驗來獲取手勢的參數。手語是一種可視語言,合成的手語只有顯示出來,觀察者才能“讀”取手語的信息與意義。手語的合成與顯示的實現的方法是:在VRML中有一部分是專門用于描述三維人體模型H-Anim標準,根據此標準對虛擬人的定義,一個虛人有47關節96個自由度,只要確定這96個自由度的角度值,應用運動學的方法和計算機圖形學的方法,就可以計算出虛擬人每個肢體的位置和方向,由此確定虛擬人的一個姿態。一個手語運動是一個人體手勢的序列,按照預定的時間間隔連續顯示一個手語運動中的每一個手勢,既可以生成對應的手語運動。

3 手語的網絡通訊

當今,網絡通訊已經成為一種重要的通訊手段。研究啞語通訊,使聾啞人更好地融入網絡社會,感受科技的進步,更好地為他們服務并且方便了他們的生活。而手語作為一種動作語言,從廣義上講,它的應用不僅僅局限于聾啞人之間,聾啞人與非聾啞人之間,以及異語種間健常人的交流都可能應用到動作語言。從這個意義上,研究啞語的表達與通訊,具有更加廣泛的社會意義和實際應用前景。

更實現手語的網絡通訊,必須采用一種恰當的技術,它既能完成手語圖像動畫表示,它既能完成手語圖像的三維動畫表示,產生的數據、文件應該盡可能地短小,且便于壓縮,以利于網絡傳輸,提高網絡傳輸速度,避免網絡擁塞,實現實時反應??梢允褂萌S動畫技術來實現手語動畫,但一般的三維動畫技術形成的圖像雖然可能滿足生動逼真的要求,卻不適合網絡應用。因為它們用于圖像和動畫的文件格式是基于像素的,大小和行為都是固定的,為了得到特體的三維印象,至少需要兩幅圖解,這使傳輸量巨大且不能實現交互。同時,基于HTTP、HTML標準的WWW只能表示和傳遞二維信息,不能滿足對三維環境和三維顯像具有特定要求的應用需求。鑒于這種應用的特殊要求,提出采用VRML技術。VRML(Virtual Reality Modeling Language)是一種可以在WWW上操作的三維圖形可視化工具,VRML 2.0于1996年8月,它能夠靈活有效的方式,將二維、三維圖形和動畫、影片、聲響和音樂等多種效果調和在一起,形成一個綜合性的單一媒體,在環球網上創建動態世界。VRML本身不是一種傳統的編程語言,它是一種建模語言,有它自己的文件格式,人們可以用它描述三維場景。它不但能滿足圖像質量的要求,而且存儲和傳輸的只是物理的三維坐標,圖像本身是在本地生成的,這就大大減少了網絡傳輸量,也便于進行交互操作。同時,使用VRML技術生成的文件格式是ASCII碼,能被有效地壓縮,這就進一步減輕了網絡壓力,提高了傳輸效率,能夠實現手語圖像在網絡上高速傳輸。

另外,日本北海道大學的青木由直教授是研究手語通訊的倡導者,他通過建立一個不同語言的手語翻譯字典在Internet實現了日語和韓語的手語的聊天系統,進一步又研究了日本與中國的手語變換,手語手成的二維及三維動畫,以及帶有面部表情和嘴唇形狀的日語和韓語的手語聊天系統等。

4 手的運動約束

人手的組成是一個非常復雜的結構。手是由骨頭,連接骨頭的韌帶,作為拉力動力服務的肌肉,運動時連接肌肉與骨頭的腱,以及覆蓋著保護的軟組織和皮膚。骨頭通過關節連接起來并且不能改變大小,肌肉產生扭矩和關節通過拉力運動都存在一塊或更多的肌肉群為其服務。因此,手的運動極其復雜的。由于真實手的生理特點,手的運動受到一些限制和約束。分析手的運動約束,就可以更好研究虛擬三維人手的運動。這樣一來就可以在有關手的動畫片中避免一些不真實的動作,使其更加擬人化。

亚洲精品一二三区-久久