神經網絡情感分析范例6篇

前言:中文期刊網精心挑選了神經網絡情感分析范文供你參考和學習,希望我們的參考范文能激發你的文章創作靈感,歡迎閱讀。

神經網絡情感分析

神經網絡情感分析范文1

關鍵詞:主成分分析;混合蛙跳算法;BP神經網絡;帕金森氏病;分類

中圖分類號:TP393 文獻標識碼:A 文章編號:1009-3044(2013)04-0861-05

Based-on PCA of SFLABP Neural Network Model in Application of Parkinson Disease’S Classification

ZHANG Zhi-hao,TANG De-yu

(College of Medical Information Engineering,Guangdong Pharmaceutical University,ZhongShan 528458,China)

Abstract:For the shortcomings of BP neural network which is low learning efficiency and is easy to trap into local optimum, according to these problems, a new BP neural network model optimized by Shuffle Frog Leaping Algorithm based on Principal Component Analysis is proposed. Using Principle Component Analysis to extract the features of high dimensional data, the input variables; the bias of BP neural network are optimized by Shuffle Frog Leaping Algorithm and then build the classification model of Parkinson's disease based on SFLABP neural network. At last, taking the data of Parkinson from UCI for example, the experiment result demonstrates the new model is better than the traditional BP neural network.

Key words:principal component analysis (PCA); shuffle frog leaping algorithm (SFLA); BP neural network; Parkinson; classification

隨著智能計算的不斷發展,人工神經網絡由于其自身的適應能力和學習能力,在醫療診斷上的應用越來越廣泛,其中BP神經網絡[1]是人工神經網絡中應用最廣的一種神經網絡,但由于其具有學習效率低、參數選擇敏感、網絡結構難確定、易陷入局部收斂等缺點,給實際應用帶來了一定的困難,尤其是當網絡輸入變量過多時,網絡結構更復雜,網絡訓練負擔過重,學習效率驟降,將高維數據在不影響較多期望的前提下降維,網絡的學習效率才會有所提高,BP網絡的實際應用也將更有價值。

混合蛙跳算法,是2003年由Eusuff 和Lansay提出的一種基于啟發式搜索的全局優化群體智能算法,它具有全局搜索能力強、參數少、原理簡單易實現等特點,將混合蛙跳算法與BP網絡結合,利用SFLA的全局搜索優化BP網絡的結構參數,可以有效解決BP網絡易陷入局部最優等問題。

為了解決BP網絡中的缺陷,該文利用了主成分分析法降維與SFLA 全局搜索能力強等優點,網絡輸入使用PCA降維,網絡參數使用SFLA優化,提高了BP網絡的學習效率,實驗證明,新模型更優。

1 主成分分析

主成分分析是由霍特林于1933年第一個提出的,主要是根據降維的思想,在損失較少信息期望的前提下,將多個相互關聯的指標轉化為幾個綜合指標的多元統計分析方法。其主要計算步驟為:

設有m個指標,n個對象的各項指標組成了原始數據矩陣

1)對進行標準化處理,使各項指標的均值為0,方差為1,具有可比性,即令:

(1)

2)計算各指標的相關系數矩陣R與R的特征值

(2)

3)確定主成分的個數

計算各個主成分的方差貢獻率與累計貢獻率,一般取累計貢獻率達的特征值所對應的第一、第二、…,第p個主成分。

(3)

4)計算主成分的因子載荷矩陣I

其中為λ的特征向量。 (4)

5)根據因子載荷矩陣,確定各主成分表達式,得到各主成分得分。

2 混合蛙跳算法

混合蛙跳算法[2],在模擬青蛙群體尋找食物時,將蛙群分為幾個子種群,每個子種群以及每只青蛙覓食的思想相互傳遞相互影響,將全局信息混合交換與局部信息深度搜索相結合,局部深度搜索能夠快速有效地在一個特定區域內尋優,加快尋優速度;而全局混合交換可以避免個體陷入局部最優,使得算法能夠跳出局部最優,不斷靠近全局最優。算法的基本流程[3]如下:

1)初始化種群X。確定青蛙的數量F、種群以及每個種群青蛙的個數m,n,與青蛙最大步長。

2)隨機產生初始青蛙,計算各個蛙的個體適應度值,并按個體適應度值的大小進行降序排列,并記錄最優解。

3)將青蛙進行分組,將青蛙分成m個子種群,每個子種群有n只青蛙,分組規則如下:

(5)

即將第1只青蛙放入第1個子種群,第2只青蛙放入第2個子種群,…,第m只青蛙放入第m個子種群,第m+1只青蛙放入第1個子種群,第m+2只青蛙放入第2個子種群,依此類推,直至全部青蛙分組完畢。

4)對每一個分組進行模因進化,即局部搜索最優。進化過程如下:

a)找出該分組中個體適度值最差與最優的個體

b)對個體適度值最差的個體進行更新,更新策略為:

i.蛙跳步長更新: (6)

ii.位置更新: (7)

如果優于,則=,否則,再重復i,ii步驟,若此時的還比差,則隨機產生一只新的青蛙代替

2)重新將進化完的各個分組進行混洗,對青蛙進行重新排序和分組,得到最優解。

3)重復計算(3)(4)(5)直至滿足迭代條件為止。

3 BP神經網絡

BP神經網絡[1]是一種單向傳播的多層前饋網絡,其主要特點是信號前向傳遞,誤差反向傳播。其拓撲結構如圖所示:

由圖1可知,BP神經網絡是一種具有三層或三層以上的神經網絡,包括輸入層、隱含層和輸出層,層與層之間多采用全連接的方式,可以被看成是一個從輸入到輸出的高度非線性映射,即:

以典型的3層BP神經網絡結構為例,轉移函數采用Sigmoid函數,, (8)

則:

其中為權值,為閾值,為隱含層輸出,為輸入層節點數,為輸出層節點數,

4 PCA-SFLA-BP神經網絡模型

標準的BP網絡算法學習效率低,收斂速度慢。當輸入層的節點數較多時,也易陷入“維數災”的問題,同樣會影響其收斂的速度。

主成分分析[4]基于降維的思想,可以減少BP網絡陷入“維數災”的問題;混合蛙跳算法是一種群體智能優化算法,通過個體間的協作與競爭來實現在多維空間中對最優解的搜索。

因此,在進行BP神經網絡訓練時,我們使用PCA對網絡的輸入層節點數進行降維,使用混合蛙跳算法改進優化BP網絡的權值和閾值,從而提高網絡的學習效率[5][6]。其中適應度函數定義如下:

式中,N為網絡輸入節點數,為網絡預測輸出值,為樣本實際輸出值,q為用于網絡訓練時輸入輸出的數據維數,s為網絡輸出節點數。

整個模型流程圖如圖2所示:

5 實驗結果與分析

為了驗證模型的有效性,選用UCI機器學習數據庫中的Parkinson數據集作為測試,該數據集有195個樣本,由Little于2007年所建,主要針對31位病人,用生物醫學儀器進行約6次的發音測試后記錄而成,共有23個字段,其中有22個字段為測試的屬性,如:MDVP、FO、Jitter、Shimmer、RAP、PPQ、HNR等一些聲學參數,1個類標號(status),其值為0和1,1表示為確定病例。其中1有147例 ,0有48例。

上述數據集兩類中分別隨機選取100例和36例作為網絡訓練,其余的作為網絡測試。并對網絡輸出重新定義,即將類標號進行了處理,其中[0 1]表示0,[1 0]表示1。

隱含層節點數l采用公式:其中n為輸入層節點數,m為輸出層節點數,a取1-10。

(11)

構建BP神經網絡n-l-m,且本文中混合蛙跳算法的各參數分別為:青蛙規模F=20,子種群數量(模因組組數)m=5,每組中蛙的數量n=4,模因進化迭代次數Ne=10,全局迭代次數max gen=10,相當于總迭代次數為在這種平臺上得到了本次實驗結果。

5.1利用主成分分析選取網絡的輸入變量

將UCI中Parkinson[8]數據集的22個屬性作為原始數據,按照前面主成分分析的步驟對原始數據進行主成分分析。得到特征值碎石圖見圖3,累計方差貢獻率見表1。由表1可確定前4個特征值的累計方差貢獻率已大于80%,所以選取4個主成分,同時也可得出各主成分的表達式與主成分得分,將主成分得分作為網絡的輸入變量。其中之一的表達式如下:

5.2構建SFLA-BP的帕金森病分類模型

利用主成分得分作為網絡的輸入,即輸入層為4,分別以隱含層為4,6,8,10,輸出層為2構造SFLA-BP神經網絡的Parkinson分類模型,隱實驗結果以隨機某10次結果的平均值,其中得到某次實驗(隱含層節點數為10)的均方誤差圖見圖4,結果見表2。

由圖4可得,應用了主成分分析法,減少網絡的輸入變量個數,網絡的結構得到了簡化,以及應用了SFLA優化BP的網絡參數,學習率得到提高,網絡訓練的次數減少,由表2可知:網絡的預測效果比較精確,模型有效可用。

5.3 預測結果比較

為了更好地對新模型與傳統BP模型進行比較,該文多做了以下兩個實驗,對未經過主成分分析的數據,建立三層BP神經網絡模型與SFLA-BP模型,實驗結果仍然以隨機某10次結果的平均值,其中得到某兩次實驗的均方誤差圖見圖5,6,結果見表3,4。

可見:對于Parkinson數據集,PCASFLABP分類模型訓練速率與準確率都優于SFLABP網絡,更優于傳統的BP網絡,能較好地改善BP網絡。

6 結束語

通過對BP神經網絡的研究,該文提出的模型明顯優于單純的BP網絡。該模型通過主成分分析對數據集進行降維,SFLA全局優化網絡參數,較好地解決了BP神經網絡參數復雜、易早熟的問題,得到了較好地分類效果,將對Parkinson診斷方面有較大的幫助。

參考文獻:

[1] Haykin S.神經網絡原理[M].北京:機械工業出版社,2004.

[2] Eusuff M M, Lansey K E. Optimization of water distribution network begin using shuffled frog leaping algorithm[J].Journal of Water Resources Planning and Management,2003,129(3):210-225.

[3] 王曉笛,何燦.混洗蛙跳算法的研究[J] 電腦知識與技術,2011,7(19):4661-4664.

[4] 許新征,丁世飛,楊勝強,等.煤與瓦斯突出的PCA-BP神經網絡預測模型研究[J].計算機工程與應用,2011,47(28):219-222.

[5] 智晶,張冬梅,姜鵬飛.基于主成分的遺傳神經網絡股票指數預測研究[J].計算機工程與應用,2009,45(26):210-212.

[6] 余華,黃程韋,張瀟丹,等.混合蛙跳算法神經網絡及其在語音情感識別中的應用[J].南京理工大學學報,2011,5(35):659-663.

神經網絡情感分析范文2

關鍵詞:圖像特征提??;人機交互系統;BP神經網絡;Canny邊緣檢測算法

中圖分類號:TP391

在感性消費的社會里,情感與體驗等無形的因素逐漸變成衡量人生活品質的關鍵要素,在這樣的背景下,公寓作為人的生理心理雙重港灣,更是不得不考慮住戶的感性需求。如何能夠實現用戶只通過表達自己的情感就找到符合自己需求的公寓圖片呢?本文設計了一個自選公寓人機系統,使得用戶能方便快捷地獲得符合自己情感需求的公寓圖片,并進行選擇。

1 感性空間

感性空間的建立主要有下面幾個步驟:一是搜集挑選用戶對于公寓圖片的心理感覺形容詞對;二是挑選用戶進行問卷調查,利用感性工學語義量化(SD)方法,建立用戶情感認知空間;三是對多維情感認知空間進行多元分析,簡化情感空間的維數。一和二屬于調查階段,三屬于分析階段。

1.1 調查階段

首先挑選了11對感覺形容詞,再加上一對反映用戶喜好的形容詞,喜歡和不喜歡,共計十二對:喜歡的――不喜歡的,寬廣的――狹窄的,溫馨的――清冷的,協調的――不協調的,整齊的――雜亂的,優雅的――不優雅的,明亮的――陰冷的,舒適的――不舒適的,柔和的――剛硬的,現代的――傳統的,簡約的――復雜的,放松的――緊張的。

選取200幅公寓圖片,針對上述十二對形容詞,邀請120名用戶進行等級評價。評價分為五個等級,例如圖1的形容詞對寬廣的――狹窄的,1、2、3、4、5分別表示非常寬廣的,有些寬廣的,中性,既不寬廣也不狹窄的,有些狹窄的,非常狹窄的。

圖1 五級評價

這樣就得到最終的結果模型,也即用戶感性數據庫,可描述為:A= ,其中akij為第k個用戶對第i個公寓圖片的第j個感性詞匯對的等級評價,K=120,I=200,J=12,i=1,2,…,I,j=1,2,…,J。

1.2 分析階段

因子分析的思想是將眾多變量之間的內部關系簡化成用少數幾個公共變量來描述,一般假設某一樣本變量由所有變量均有的公共因子和自己獨有的特殊因子兩部分組成,因子分析的數學模型為:

X=B F+ε, (1)

(i*j)(i*m) (m*j) (i*j)

其中X為i個原變量j個評價標準的i維矩陣,B為因子載荷矩陣,F為m維的公共因子變量矩陣,ε為特殊因子矩陣,因子載荷矩陣是各個原始變量的因子表達式的系數,表達提取的公共因子對原始變量的影響程度。

對于上述感性數據庫A,由于akij為第k個用戶對第i個公寓圖片的第j個感性詞匯對的等級評價,于是可求得所有用戶對第i個公寓圖片的第j個感性詞匯對的等級評價,進而可得到一個均值意象評分矩陣A′,A′= ,對該均值意象評分矩陣利用(1)式進行分析,可得到一個m維公共因子矩陣,也即將原感性空間從i維降到m維,并可得形容詞在該感性空間的坐標。

2 情感客戶模型

建立情感客戶模型即建立圖像特征空間到用戶情感空間的一個映射,為此,需要先對公寓樣本圖片進行特征提取。

2.1 公寓設計樣本圖片特征提取

2.1.1 圖片顏色特征提取

顏色特征采用顏色直方圖法表示,顏色直方圖可以是基于不同的顏色空間和坐標系。大部分的數字圖像都是用RGB顏色空間表達的,然而為了更接近于人們對顏色的主觀認識,首先將RGB顏色空間轉換到HSV顏色空間,其轉換公式具體為下面(2)、(3)、(4)式:

(2)

(3)

(4)

其中 。再將HSV顏色模型進行顏色量化,最后計算得到顏色直方圖。

2.1.2 圖片形狀特征提取

本文選擇Canny算子邊緣檢測算法對圖片形狀分析,首先對圖像按(5)式灰度化;接著用高斯濾波器平滑濾波,濾波器高斯函數為(6)式,即是根據待濾波的像素點及其鄰域點的灰度值按照一定的參數規則進行加權平均,這樣可以有效濾去圖像中的高頻噪聲;之后計算圖像灰梯度的幅值和方向,并對灰度幅值進行非極大值抑制,即尋找像素點局部最大值,將非極大值點所對應的灰度值置為0,這樣可以剔除一大部分非邊緣的點;剩下的也不都是邊緣點,為了減少假邊緣,采用雙閾值法,選擇相對高低兩個閾值,由高閾值可以得到一個邊緣圖像,由于閾值較高,這樣圖像就含有很少假邊緣,但是產生的圖像邊緣可能有間斷,因此又采用了一個低閾值,將高闕值得到的邊緣連接成輪廓,在到達輪廓的斷點時,選擇低闕值直到邊緣能夠閉合為止;之后采用Hu不變矩對提取出來的輪廓進行特征提取。

Gray=0.299R+0.587G+0.114B (5)

(6)

2.2 建立情感模型

本文采取的是BP神經網絡方法,通過神經網絡學習圖像特征與用戶感性詞匯之間的關系,結構圖如下:

圖2 BP神經網絡結構圖

輸入層維數為基本顏色的個數,輸出層維數為感性詞匯的個數。我們選擇200幅公寓圖片作為BP神經網絡的訓練圖,邀請20位用戶對這些圖像進行情感標注,挑選出代表性詞匯,假設我們得到的詞匯空間為溫馨,清冷,簡約,古典,恬淡,高貴,輕快,優雅,分別用(10000000),(01000000)…(00000001)一一對應表示,之后提取圖片的顏色特征,得到十二種基本顏色特征,紅橙黃綠青藍紫褐灰粉黑白,分別用(100000000000),(010000000000)…(000000000001)一一對應表示,這樣就得到神經網絡的訓練集。輸入層與輸出層之間隱含層的作用是根據訓練樣本,學習提取并儲存其內在規律。對于隱含層節點來說,確定其最佳數目的常用方法是試湊法,一般以式(7)作為試湊法的初始值:

(7)

式中m為隱層節點個數,n為輸入層節點個數,l為輸出層節點個數,a為1-10之間的常數。完成訓練后,就可以將訓練樣本以外的數據輸入到網絡中,判斷網絡的預測能力。

3 客戶自選公寓設計人機系統

圖3給出了該人機系統的框圖,圖4給出了用戶自選流程,用戶可以對顯示的圖片進行選擇,文中選取的是200幅公寓圖片,但系統圖片庫中遠遠超過這個數目,而且系統管理人員會及時更新圖片庫,所以要求系統能夠對更新的圖片進行感性注釋,當用戶輸入的是系統形容詞庫中所沒有的形容詞時,系統能夠進行訓練學習,找到其感性空間中對應坐標,并且系統可以該形容詞匯自動記憶并加入感性形容詞庫。

圖3 客戶自選公寓人機系統框圖 圖4 用戶自選公寓流程

4 實驗及分析

本文共選取了200幅公寓圖片,邀請用戶對圖片進行評價和量化,形成情感數據庫,當用戶提出形容詞配對自選公寓時,從圖片庫中找出符合條件的樣本,并顯示出來。圖5為“清冷的”顯示結果。實驗中用戶感覺較好。

圖5 自助公寓系統獲取圖像

5 結束語

本文將感性工學方法與圖像特征提取相結合用于設計人機系統,研究出一種情感模型,通過神經網絡方法,使得圖片的特征空間可以映射到客戶情感空間,從而完成了自選公寓系統最重要的部分,致力于實現人機之間的和諧交流。在公寓樣本圖像的分析這個問題上,包括圖像選取是否涵蓋所有類型,包括怎樣使提取的特征更準確代表圖像,比如有的學者將圖像的全局顏色特征和局部特征相結合,等等,未來研究中可以著重這些方面,進一步完善。

參考文獻:

[1]黃,賴茂生.圖像情感特征的分類與提取[J].計算機應用,2008(03).

[2]許青,陳坤,彭兆元.基于感性工學的消費者需求分析[J].設計藝術研究,2012(03).

[3]汪霞,張曉如,馮成.基于顏色、形狀的情感圖像檢索[J].科學技術與工程,2009(11).

[4]薛雨麗,毛峽,張帆.BHU人臉表情數據庫的設計與實現[J],2007(02).

[5]Akiya Inoue,Takeshi Kurosawa,Motoi Iwashita,Ken Nishimatsu.Customer Choice-Behavior Modeling Applied to Kansei Engineering.2011 International Conference on Biometrics and Kansei Engineering.

[6]湯凌潔.感性工學方法之考察[D].南京藝術學院,2008:21-39.

[7]蘇建寧,李鶴歧.應用數量化一類理論的感性意象與造型設計要素關系的研究[J].蘭州理工大學學報,2005(02).

[8]柯惠新,黃京華,沈浩.調查研究中的統計分析法[M].北京:北京廣播學院出版社,1999.

[9]靳清澤.基于神經網絡的圖像特征和情感映射規則的研究[D].太原理工大學,2012.

[10]李清勇,胡宏,施智平.基于紋理語義特征的圖像檢索研究[J].計算機學報,2006(01).

[11]李海芳,柳凌燕,陳俊杰.基于免疫規劃的神經網絡規則抽取算法[J].電腦開發與應用,2010(07).

[12]劉紅巖,陳劍,陳國青.數據挖掘中數據分類算法綜述[J].清華大學學報(自然科學版),2002(06):727-730.

[13]王上飛,陳恩紅,王勝惠.基于情感模型的感性圖像檢索[J].電路與系統學報,2003(06).

神經網絡情感分析范文3

關鍵詞:教學設計前端分析;數據挖掘;綜合集成方法論;BP神經網絡;層次聚類

中圖分類號:G40-057 文獻標識碼:A 文章編號:1673-8454(2011)21-0084-04

教學設計對于教學工作科學化,提高學習者分析問題、解決問題的能力和培養科學思維能力與科學態度,促進教育技術的實踐與理論的發展和適應信息社會發展的需求等方面都有著重要的意義和價值。前端分析,是教學設計的第一步,它是教學設計過程的基礎,有助于理順問題與方法、目的與手段的關系,其設計的好壞直接影響到后面的一系列工作。在不同的教學設計過程模式中,前端分析的內容略有不同,但主要包括:學習任務、學習需要、學習者特征和學習環境等。鑒于本文的研究主要定位于學科課程范圍,學習需要和學習任務由學校學科專業所規定,學習環境一般在具體的情境中由授課教師掌握控制,又由于學習者是教學活動的主體,教學設計的一切活動都是為了學習者的學,學生之間存在著共性,也存在著差異,本文只對學習者特征做主要研究。對學生進行分析的目的是了解影響學生學習的認知能力、學習風格、學習動機。通過對學習者三個方面特征的研究,使得教師更好地把握學習者的情況,從而達到更好地實現因材施教、因風格施教的口的。

為了有利于后續教學設計自動化的探索,本文基于綜合集成(Meta-synthesis)方法論,即將專家的知識與經驗、統計數據和信息資料,以及計算機技術三者有機動態地結合起來,構成一個高度智能化的人機交互系統,把數據挖掘技術應用于數字化后的教學設計前端分析中,列舉出實驗過程,并對實驗結果進行分析。

一、理論基礎

1.數據挖掘技術概述

數據挖掘(Data Mining,DM)是從大量的、不規則的、含有噪音的數據集中識別出有效的、新穎的、潛在有用的,以及最終可被人理解和利用的模式的高級處理過程。它包含神經網絡、聚類、粗糙集、遺傳算法、決策樹、關聯規則等多種技術。它被廣泛應用于各個領域,包括金融業、零售業、電信業及其他科技應用領域。

2.BP神經網絡方法

BP神經網絡(誤差反向傳播網絡)是目前使用最廣泛、發展最成熟的一種經典的神經網絡模型,它是一種監督學習型數據挖掘方法。BP神經網絡是一種多層前饋神經網絡,主要特點是輸入信號前向傳遞,誤差反向傳遞,并且在這個過程中不斷修改權值直到達到目標值。網絡包括:輸入層,隱層和輸出層。其網絡模型如圖1所示:

其中,X1,X2……Xn是輸入信號。YI,Y2……Yn是輸出信號。Wij,wjk代表權值。輸入層輸入信號,輸出層輸出處理結果信號,隱層處理信號,在處理的過程中,根據來自輸出層的反饋信號,權值不斷被調整,當輸出層誤差減小到預定值時,學習結束。可以說,BP神經網絡學習的實質就是權值的改變。

3.聚類分析方法

聚類分析是一種無監督學習型數據挖掘方法,其實質是建立一利,分類方法,它能夠將一批樣本數據按照他們在性質上的親密程度在沒有先驗知識的情況下自動進行分類。層次聚類是聚類分析中的一種方法,它是根據樣本間的親疏程度,將最相似的樣本結合在一起,以逐次聚合的方式分類,白:到最后所有的樣水成一類。

根據聚類過程的不同,層次聚類法可分為方向相反的兩大類:分解法(自頂向下)和凝聚法(自底向上)。本研究采用的是凝聚法,其基本思想是:(1)假定N個樣本各自成一類,計算類間距(等于各樣本之間的距離);(2)選擇距離最近的兩類并成一個新類:(3)計算新類與其他類問的距離;(4)重復第2步和第3步,這樣每次縮小一類,直到所有樣本都成一類為上。

二、學習者特征測量方法

學習者特征主要包括認知能力、學習風格、學習動機三個方面。

美國著名教育心理學家布魯姆(B.S.Bloom)的“教育目標分類”理論把教學目標分為認知、情感和動作技能三個目標領域,其中認知能力的目標按智力活動的復雜程度由低級到高級又可劃分為六個等級:(1)認記――記憶或重復以前呈現過的信息的能力,也就是知識保持能力;(2)理解――用自己的語言來解釋所獲得的信息的能力;(3)應用――將知識(概念、原理或定律)應用于新情況的能力;(4)分析――把復雜的知識分解為若干個彼此相關的組成部分的能力;(5)綜合――將有關的知識元素綜合起來形成新知識塊或新模式的能力:(6)評價――根據已有知識或給定的標準對事物作出評價和鑒定的能力。根據認知能力的評估與測量方法的不同,可以把學生認知能力值測量方法分為兩種:“小組評估法”和“逐步逼近法?!毖芯渴歉鶕靶〗M評估法”來設計量表測試學生認知能力的。

學習動機是指直接推動學生進行學習的一種內部動力,是激勵和指引學生進行學習的一種需要,本文學習動機測量是根據王迎、彭華茂、黃榮懷等在《遠程學習者學習動機測量工具的編制與應用》一文中提出的“遠程學習者學習動機問卷”測量的,該問卷是根據奧蘇貝爾的學習動機分類理論從三個動機維度,即認知內驅力、自我提高內驅力和附屬內驅力來制定的一種測驗學生學習動機類型和強度的表格:奧蘇貝爾將學習動機劃分為三個方面:即認知內驅力(cognitive drive)、自我提高內驅力(ego-enhancement drive)以及附屬內驅力(affiliative drive),認知內驅力是一種要求了解和理解的需要,要求掌握知識的需要,以及系統地闡述問題并解決問題的需要,這是一種內部動機;自我提高內驅力是個體因自己的勝任能力或工作能力而贏得相應地位的需要,這是一種外部動機:附屬內驅力:是個體為了保持長者(家長、教師等)的贊許:或認可而表現出來的把學習或工作做好的一種需要,也是一種外部動機。

學習風格(Learmng Stvte)的概念是由美國學者Herbert Thelen于1954年首次提出,在今天的教育和技能培訓領域中,學習風格一詞已是研究者最廣泛使用的概念之一,學習風格理論已成為當今教育心理學一個新的領域。學習風格是學習者持續一貫的帶有個性特征的學習方式,是學習策略和學習傾向的總和。其測定方法主要有測驗法、行為觀察法、行為評定法和作品分析法。其中,測驗法是最主要的方法。學習風格的測量在手段上可以分為圖式和量表兩種形式。大多數研究者采用量表方式來測定學習風格。學習風格的測量工具可以分為七種二場獨立一場依存類型測量工具、榮格個性

類型測量工具、感知覺類型測量工具、社會互動類型測量工具、多元智能類型測量工具、基于經驗的學習風格測量量表、基于三維模型的學習風格測量量表。所羅門學習風格量表屬于多元智能類型測量工具。多元智力理論是由加德納提出的,但他并未開發測量工具。所羅門學習風格量表(也稱Felder-Si/verman量表)是由Feldel和Soloman于1997年開發的一種用來測量學生學習風格類型的量表,是教育領域比較有權威的學習風格量表。所羅門(Barbara A.Soloman)從信息加工感知、輸入、理解四個方面將學習風格分為4個組對8種類型,它們是:活躍型與沉思型、感悟型與直覺型、視覺型與言語型、序列型與綜合型,比較全面地反映了學習者的學習風格,且具有很強的操作性,可以較好地進行學習風格的調試。因此,本文中學習風格測量選用“所羅門學習風格量表”測量。

三、調查問卷結果

本研究的調查對象是云南大學2008屆職業與繼續教育學院市場營銷和財會專業現代教育技術學課程的89名本科生的認知能力、學習動機和學習風格。調查問卷共89份,經篩選整理后,有效問卷為89份?表1、2、3為問卷處理后的部分數據。

四、層次聚類方法分類

利用SPSS軟件,用層次聚類分析法對上述問卷數據進行聚類得到分類結果,然后把結果反饋給被調查者,再由被調查者和專家對結果進行核實、探討,取得共識,接下來對可疑或不合理的數據進行相應的調整,如此反復修改,最后形成用于接下來的實驗研究中的學生特征分類結果。其中,把認知能力分為較強和一般兩類,學習動機分為較強、中等和較弱三類。

學習風格的測量結果可以直接用于描述學習者,故不做進一步研究。

五、認知能力數據分析預測

1.BP網絡設計

首先,需要獲得網絡的輸入和目標樣本。根據上面得到的學生特征分類結果,選取其中30組作為訓練樣本、樣本被分為較強組和一般組。

接下來確定網絡結構,根據Kohnogorov定理,采用一個Nx(2N+I)xM的3層BP網絡作為狀態分類器。其中,N表示輸入特征向量的分量數,M表示輸出狀態類別總數。對于本例,N=6。為了簡化網絡,用(1,1)表示較強狀態,(1,0)表示一般狀態。這樣一來,就可以在網絡中只設計兩個輸入神經元表示這兩種狀態類別。由此可得,該BP網絡結構為:輸入層有6個神經元,中間層有13個神經元,輸出層有2個神經元。按照一般的設計方案,中間層神經元的傳遞函數為s型正切函數,輸出層神經元的傳遞函數為S型對數函數,是因為該函數為0-1麗數(后面我們必須將樣本數據歸一化到0-1內),正好滿足狀態類別的輸出要求。

令P表示網絡的輸入樣本向量,T表示網絡的目標向量,由上表可得

P=[81 82 69 78 65 46、69 68 65 72 72 53,79 92 56 67 78 61、

79 60 62 69 81 60 82 85 70 82 80 62 66 g4 69 63 85 59,

80 90 75 78 79 51,90 93 63 88 77 59

69 78 60 76 83 57,……]

T=[1 1 1 1 1 1 1 1,1 1 1 1,1 1 1 1 1 1,1 1 1 1,1 1,1 1 1 1 1 1

1 0 1 n 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 10

利用如下代碼建立一個符合以上要求的BP網絡。網絡的訓練函數為trainhn,學習函數取默認值learngdm,性能函數取默認值mse。其中麗數mlnnaax設定了輸入向量元素的閾值范圍。

net=newff(minmax(P),[13,2],{tansig','logsig”),’trainlml;

2.網絡訓練

net=train(net,P,T)

訓練結果為:

TRAINLM,Epoch 0/50,MSE 0 730893/0.001,Gra-dient 1.60962/le-010

TRAINLM,Epoch 7/50,MSE 0.000444178/0.001,Gradient 0.0902879/le-010

TRAINLM,Performance goa]met,

可見,經過7次訓練后,網絡誤差達到了設定的最小值,結果如圖2所示。

3.網絡測試與運用

網絡測試的目的是為了確定網絡是甭滿足實際應用的需求。選取7組“較強”狀態數據和3組“一般”狀態數據作為測試數據。利用上面設計的網絡,判別它們分別屬于哪一種狀態。運行結果如圖3所示:

由此可見,前7組數據預測其為“較強”狀態,后3組數據預測其為“一般”狀態,這與實際情況相符合,說明所設計的網絡是合理的,可以投入運用。

六、學習動機數據分析預測

學習動機在BP網絡設計、網絡訓練、網絡測試與應用上的方法與認知能力相似,故不再贅述。在此只給出網絡的目標樣本訓練的結果圖(圖4)、測試樣本(表4)和測試結果(圖5)。

目標樣本為:

由此可見,前2組數據預測其為“較強”狀態,第3組數據預測其為“中等”狀態,第4組不能判斷其狀態情況,第5組數據預測其為“中等”狀態,第6組數據預測其為“較弱”狀態,其中,第1、2、3、6組數據預測結果與實際相符合,第4、5組預測結果與實際情況不符合,故神經網絡預測成功率為66.7%,基本可以使用。

七、小結

教學設計前端分析是一個復雜的問題,本文以從定性到定量綜合集成方法為主,在大量實驗數據的基礎上,選用數據挖掘技術中的BP神經網絡和層次聚類分析對教學設計前端分析中的認知能力和學習動機做了研究,系統預測成功率較高,這對于進一步開展后續的教學設計研究及實現教學設計自動化的研究起著很好的鋪墊作用。

參考文獻:

[1]于景元,涂元季從定性到定量綜合集成方法――案例研究U]系統工程理論與實踐,2002(5):2.

[2]陳文偉,陳晟知識工程與知識管理[M].北京:清華大學出版社,2010:165.

[3]韓力群人工神經網絡教程[M].北京北京郵電大學出版社,2006:59-64.

[4]楊曉明SPSS在教育統計中的應用[M].北京:高等教育出版社,2004:247.

[5]瞿俊,基于重疊度的層次聚類算法研究及其應用[D].福建:廈門大學,2007.

[6]羅伯特?M?加涅學習的條件[M].北京:人民教育出版社,1985.

[7]張正蘭,張明,蔡紹稷建造認知型學生模型的研究[J].南京師大學報(自然科學版),1997,20(1):2-4.

[8]陳琦,劉孺德當代教育心理學[M].北京:北京師范大學出版社,1997:120.

[9]王迎,彭華茂,黃榮懷遠程學習者學習動機測量工具的編制與應用U1開放教育研究,2006,12(5):1-4

[10]李淑霞成功遠程學習者研究綜述[J].成功(教育),2007.

[11]陳晶,李玉斌,劉家勛.網絡遠程學習者特征分析方法初探[J].現代遠程教育研究,2006(5).

[12]龍雪梅WBI設計中的學習風格分析[J].西南師范大學學報,2001(8):480-483.

[13]陳麗遠程教育學基礎[M].北京:高等教育出版社,2004(7).

神經網絡情感分析范文4

一、移情的定義

盡管“移情”一詞來源于西方的美學,但在我國傳統文化中很早就出現了關于移情的理論。例如,孔子學說的核心是“忠恕”;朱熹說:“恕,推己以及人也。”推己以及人就是移情??梢?,我國古代所講的“推己及人”“設身處地”其實就暗含了移情的內涵。

在西方,對移情最早做出系統闡述的則是德國美學家T.李普斯,他在《論移情作用》里說:“審美欣賞的特征在于,在它里面使我感到愉快的自我和使我感到愉快的對象并不是分割開來成為兩回事,這兩方面都是同一個自我,即直接體驗到的自我。”李普斯側重于由我及物,但沒有著重分析自然景物對人的情緒的作用。

盡管東西方文化都提到移情理論,但對移情的側重點在這兩種文化中稍有不同。我國傳統文化側重的是“由我及人”的移情,而西方美學側重的是“由我及物”的移情。

在心理學領域中,移情的概念最早在1909年由鐵欽納提出,他認為人不僅能看到別人的情感,而且也能用心靈感受到別人的情感,他把這種情形稱為移情。在心理學百科全書中,移情稱為感情的移入,指的是個體從他人角度出發感受到他人的情感、想法和認識的心理現象。

綜上所述,移情的概念非常復雜,有關移情的定義至今仍存爭議。文中筆者將移情定義為覺察、理解別人感覺和情緒的傾向以及敏感程度。

二、如何增強移情能力

(一)情感分享

建立移情雖然很簡單,但并不總是很容易。研究已經得出,當我們體驗別人的經歷時,自然做出情感分享反應。這主要是因為別人的經歷無意識地激發了我們大腦鏡像神經元,鏡像神經元能反應別人大腦細胞的情況。從嬰兒期開始,鏡像神經元幫助我們將別人的姿勢同化到自己的動力系統,成為分享表象。我們的神經網絡儲存并編碼這些分享表象,當受到相應的刺激時,我們會無意識地分享別人的情感。姿勢、身體語言以及聲調等分享表象形成我們的神經網絡,這些神經網絡就像大腦的“硬件”,其他諸如語言等分享表象形成的神經網絡就像大腦的“軟件”,研究者認為孤獨癥患者在某種程度上不能形成足夠的鏡像神經元,因而分享情感能力受到影響。

形成這些產生移情的神經通路,需要我們耐心觀察別人:不是用我們學習的理論分析別人,而是要特別注意別人的行為、面部表情、聲調以及話語等等,這純粹是由我們的經驗形成的。這意味著雖然理論對于分析問題以及解決問題是必需的,但是要做到移情唯一要做的就是觀察別人的行為、姿勢、面部表情、說話的聲調等等。

(二)自我—他人意識

情感分享在很多領域都非常重要,但是有研究表明:情感分享亦能導致情感枯竭或者生理耗盡。許多社會工作者對那些需要救濟者有很強的情感分享行為,但是往往在擺脫他們的情感困擾時出現問題,因此當他們想要放松時,仍有負擔。這種對別人情感卷入的程度不是建設性的,阻止了建設性的行為反應。外科醫生禁止為那些與之感情卷入過深的人做手術,因為客觀性是提供幫助的基礎。這對于那些希望治愈心理困擾者的社會工作者來說也是同樣的道理,對于我們自身來說也是同樣的道理,我們對別人的情感卷入過深時,容易將別人的情感困擾帶給自己。

從教育的視角來看,社會工作者應該知道,如果不能區分自我意識與他人意識,那么真正的移情不存在。自我意識允許我們自己的情感從別人的情感中脫離出來,避免過度情感卷入以及允許我們理智推斷別人的心理狀態及別人的態度。換句話說,自我—他人意識就像閘門一樣,適當的阻止我們認知與情感之間的自動聯結。如果社會工作者缺乏自我—他人意識,那么很容易體驗求助者的憤怒、絕望以及焦慮等情緒。沒有自我與他人邊界的社會工作者不僅容易體驗求救者的消極情緒,還可能將自己的情緒投射給別人。

對事實情況的覺察可以幫助社會工作者在情感分享的同時清晰的區分自我與別人。如果我們確實看清楚了當下情境下發生了什么,我們不僅對別人產生移情,我們也能看清事實:那是別人的傷痛、困惑和失落感,而不是我的。

(三)心理靈活性,自我情感控制

心理靈活性是復雜的認知能力,讓我們在接受和拒絕別人觀點之間,識別自我與別人之間反復變化。Eisenberg等人將情感控制定義為“開始、避免、抑制、維持的過程或者調節發生,形成,強度的過程或者維持內在情感狀態,情緒心理過程,情緒目標,伴隨情緒的行為,實現目標的過程?!?/p>

心理靈活性也是有效運用移情的關鍵成分。如果我們不開啟對別人經歷的感受能力,就不能感受別人的感受。同樣,如果不能抑制對別人的感受能力,那么就會感受別人的消極情緒,導致情感枯竭。

自我控制被定義為控制個體想法、情緒以及行為的有意識、有目的地努力。因此,大部分理論家強調那些想控制或改變自己行為的人必須多注意自己的行為,有意識地控制行為。

研究表明,自我覺察是控制個體情緒狀態的關鍵。我們控制情感分享以及達到健康的自我—他人意識狀態的關鍵是覺察別人與自己的想法或情感。

神經網絡情感分析范文5

【關鍵字】人工智能,計算機網絡技術,措施手段

中圖分類號:G623文獻標識碼: A

一、前言

人工智能手段在我國的很多的領域都有所涉及,人工智能的應用不僅僅方便了人們的生產生活,而且有助于我國各項科學技術的運行和發展。我們根據現今先進的人工智能的計算機網絡應用模式進行了具體的分析和探討,有如下的幾點結論,希望有一定的借鑒作用:

二、人工智能

1.人工智能(Artificial Intelligence)簡稱AI。它是研究、開發用于模擬、延伸和擴展人的智能的理論、方法、技術及應用系統的一門新的技術科學。人工智能研究如何用計算機去模擬、延伸和擴展人的智能;如何把計算機用得更聰明,如何設計和建造具有高智能水平的計算機應用系統。人工智能是相對于人類智能而言的,它是采用人工的方法和技術來模擬、延伸和擴展人類智能行為的一門綜合學科。隨著計算機硬件和軟件突飛猛進的發展、計算機速度的不斷提高、存儲容量的不斷擴大、價格的不斷降低以及網絡技術的不斷發展,許多原來無法完成的工作現在已經能夠實現,AI具備了更多的現實應用的基礎,AI研究出現了新的。目前人工智能研究的3個熱點是:智能接口、數據挖掘、主體及多主體系統。

2.智能接口技術是研究如何使人們能夠方便自然地與計算機交流。數據挖掘就是從大量的、不完全的、有噪聲的、模糊的、隨機的實際應用數據中提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。主體是具有信念、愿望、意圖、能力、選擇、承諾等心智狀態的實體,比對象的粒度更大,智能性更高,而且具有一定自主性。下一步就是模仿人類右腦的模糊處理功能和整個大腦的并行化處理功能。人工神經網絡是未來人工智能應用的新領域,未來智能計算機的構成,可能就是作為主機的馮.諾依曼型機與作為智能的人工神經網絡的結合。研究表明:情感是智能的一部分,而不是與智能相分離的,因此人工智能領域的下一個突破可能在于賦予計算機情感能力。情感能力對于計算機與人的自然交往至關重要。

3.在人工智能中,這樣的領域包括語言處理、自動定理證明、智能數據檢索系統、視覺系統、問題求解、人工智能方法和程序語言以及自動程序設計等。隨著計算機網絡的普及,特別是Internet的出現,各種計算機技術包括人工智能技術的廣泛應用推動著人機關系的重大變化。據日美等國未來學家的預測,人機關系正在迅速地從“以人為紐帶”的傳統模式向“以機為紐帶”的新模式轉變。人機關系的這一轉變將引起社會生產方式和生活方式的巨大變化,同時也向人工智能乃至整個信息技術提出了新的課題。這促使人工智能進入第三個發展時期。在這個新的發展時期中,人工智能面臨一系列新的應用需求。

三、人工智能在網絡技術中的應用。

1.人工智能在網絡安全中的運用?;ヂ摼W將千千萬萬的用戶聯系起來。極大地方便了人類的生活。目前,威脅用戶個人資料安全的網絡隱患層出不窮。如果能將人工智能技術運用到網絡安全領域,將大大提高計算機網絡性能,確保用戶隱私得到充分的保護。人工智能具有處理不確定性以及不可知性的能力、協作能力、處理非線性能力、學習、解釋以及推理能力等,這些能力均在網絡安全領域得到了廣泛的應用利用統訓、記憶、概率以及決策等智能方法對數據進行甄別.達到訪問控制目的的智能防火墻技術以及利用基于專家系統、人工神經網絡、模糊識別、自治面向對象技術等開發的入侵檢測技術有效阻止了病毒的入侵.保障r資源的完整性、保密性和可用性。

2.人工智能Agent技術推動計算機網絡信息服務水平的提高。人工智能Agent技術的全稱為人工智能技術。通過每個Agent所有的知識域庫處理新信息,并給予其解釋推理機制對周圍環境進行判斷,當一個Agent獲得一項任務.利用便捷的通訊網絡,實現各個之間的相互溝通,共同完成任務。人工智能Agent技術具有自主性、學習型、協作性、個性化、智能化以及社會性等特征。該技術的運用使計算機能夠自動執行由人所分配的工作,大大改善了計算機的使用方式。促進了計算機網絡信息服務水平的提高。

3.軟件方面,新的開發工具不斷出現,使人工智能越來越方便地運用于各種領域。硬件方面,性能更好、價格更低的人工智能芯片,如模糊芯片、神經網絡芯片甚至“知識芯片”將不斷涌現,模糊計算機、神經計算機等新一代計算機將出現,以代替在該領域的數字計算機,這無疑又將給人工智能的實際應用帶來徹底革命。人工智能與計算機圖形學之間的相互結合和相互影響正在迅速地發展,新的智能自主圖形角色開始普及到游戲、動畫、多媒體、多用戶虛擬世界、電子商務和其他基于web的活動領域。智能自主圖形角色建模是多方面努力的成果,從底層的幾何模型、物理模型,中間層的生物力學模型到高層的行為模型。

4.由于計算機芯片的微型化已接近極限。人們越來越寄希望于人工智能能夠帶動全新的計算機技術的發展。目前至少有三種技術有可能引發新的革命,他們是光子計算機、量子計算機和生物計算機。根據推測,未來光子計算機的運算速度可能比今天的超級計算機快1000到1萬倍人工智能一直處于計算機技術的前沿,人工智能研究的理論和發現在很大程度上將決定計算機技術的發展方向。

四、“信息一系統一機制”方法論與人工智能的新進展

1.發現“智能生成的共性核心機制”和“人工智能的機制模擬方法”,在研究中體會到,雖然人類智能的定義相當復雜。但是依然可表述如下。智能所模擬的,實際上只是人類智能的“顯性智能”。于是,可把這個方法稱為“人工智能的機制模擬方法”,或簡稱為“機制模擬方法”。這是在新的方法論啟迪下發現的人工智能模擬的新方法。

2.發現“知識的生態學結構”根據“以信息觀、系統觀、機制觀為主要標志的復雜信息系統科學方法論”,發現了智能生成的共性核心機制是“信息一知識一智能轉換”。

3.發現“機制模擬方法是人工智能的統一模擬方法”把人工智能的機制模擬方法“信息一知識一智能轉換”與知識的生態學系統“經驗知識一規范知識一常識知識轉換”相結合,就發現:機制模擬方法可有四種具體的工作模式:

模式A:信息一經驗知識一經驗型智能策略轉換(人工種經網絡是它的特例);

模式B:信息一規范知識一規范型智能策略轉換(物理符號系統是它的特例);

模式C:信息一常識知識一常識型智能策略轉換(感知動作系統是它的特例);

模式D:信息一奉能知識一本能型智能策略轉換。

不難證明,基于結構模擬的人工神經網絡方法就是機制模擬方法的模式A,它們都是利用經驗知識生成經驗型智能策略?;诠δ苣M的物理符號系統方法就是機制模擬方法的模式B,它們都是利用規范知識生成規范型智能策略。把原先看不見的本質聯系揭示出來,這就是先進方法論的威力。

五、結束語

綜上所述,我國的人工智能的科學技術已經有了很大的突破和創新,科學技術與計算機網絡在人工智能上的應用和發展是顯而易見的。因此,相信只要在我國科學家的不斷探索和研究下,會有更加廣泛的人工智能的應用,我國的各個領域的生產生活也會更加的智能化和系統化。

參考文獻:

[l]蔡自興。徐光佑.人工智能及其應用.北京:清華大學出版社,2012.

[2]劉樹玲.基于Internet的草坪病害診斷專家系統.華中農業大學.2013.

[3]廖桂平.棉花病蟲草害診斷與防護專家系統.湖南農業大學.2012.

神經網絡情感分析范文6

關鍵詞: 情感分析; 情感傾向性; 詞典擴充; 電力客服工單; 主動服務

中圖分類號: TN915.853?34; V249 文獻標識碼: A 文章編號: 1004?373X(2017)11?0163?04

Dictionary expansion based sentiment tendency analysis of power customer service order

GU Bin, PENG Tao, CHE Wei

(State Grid Jiangsu Electric Power Company, Nanjing 210000, China)

Abstract: In order to improve the customer satisfaction and active service consciousness of the electric power enterprises effectively, the textual characteristic of the power customer service order is combined to construct the sentiment analysis model of the power customer service order. The keywords of the service order are extracted according to TF?IDF thought. The word2vec training is used to get the word vector of each word. The cosine similarity is calculated to expand the high similarity field vocabulary to the sentiment dictionary. The service order sentiment analysis and text classification are performed. The validity of the method is verified with experimental analysis. The results show that, in comparison with the original sentiment dictionary, the method of dictionary expansion and service order sentiment tendency analysis is superior, has higher accuracy, and can provide a certain reference significance for the customer relation management of power enterprise.

Keywords: sentiment analysis; sentiment tendency; dictionary expansion; power customer service order; active service

0 引 言

隨著電力體制改革的逐步深化,配電市場競爭不斷加劇,迫切需要供電企業改變傳統的思維方式和工作模式,進一步樹立市場化服務意識,從客戶需求出發,挖掘客戶的潛在需求和內在價值,從而提升客戶滿意度和運營效益。作為與客戶交流、溝通的重要窗口,電力企業95598客服系統記錄了海量的客戶信息,若能徹底挖掘客服工單中的客戶特征、情感信息并了解客戶的關注焦點,對電力企業和客戶都將具有十分重要的意義[1]。

電力客服工單情感傾向性分析可以有效地發掘客戶情感信息和需求,可根據客戶情感傾向性識別潛在的投訴客戶,可根據反饋信息判別某項業務的實施效果等。針對文本情感傾向性分析,現有的理論研究比較側重于文本特征提取以及采用機器學習方法對文本進行分類,但是基于具體業務特征進行情感詞典擴充的研究還比較少,導致情感傾向性計算往往會存在一定的差異,因此,根據電力行業的特c,進行客戶服務工單情感詞典擴充及情感傾向性的研究非常有必要。

情感分析是指利用文本挖掘、機器學習技術分析挖掘隱藏在文本中的情感信息,并將其分類為積極情感態度和消極情感態度[2]。目前,國內外關于文本情感傾向性分析已經進行了較多的研究工作[3?7],文獻[3]基于情感詞間的點互信息和上下文約束,提出一種兩階段的領域情感詞典構建算法,提升了情感詞情感傾向的識別能力。文獻[4]研究了基于矩陣投影(MP)和歸一化向量(NLV)的文本分類算法,實現對商品評價的情感分析,不僅可以有效識別商品評論情感性傾向,而且提升了識別效率。文獻[5]將詞級別向量和字級別向量作為原始特征,采用卷積神經網絡提取文本特征并進行情感傾向性分析,結果表明字級別向量可取得較高的準確率。文獻[6]提出一種詞圖模型的方法,利用PageRank算法得到情感詞的褒貶權值,并將其作為條件隨機場模型特征預測情感詞傾向,提升了具體語境下預測的準確性,但是針對文本數量較大的情況準確率較低。文獻[7]結合句子結構上下文語義關聯信息,提出一種基于深度神經網絡的跨文本粒度情感分類模型,提升了分類準確率,但該方法只適應于特定領域,泛化能力較低。

鑒于以上研究現狀,本文以電力客戶服務領域文本特征為突破口,構建了電力客服工單情感分析模型,基于工單關鍵詞提取對原始的情感詞典進行擴充,并對工單情感傾向性進行分析,最后,通過算例應用驗證了本文所提方法的有效性。

1 相關工作

1.1 情感分類

情感分類技術的主要目標是基于文本數據識別用戶所表達的情感信息,并將文本數據分為正類和負類。當前,針對情感分類的研究,主要從監督學習、基于規則方法、跨領域情感分析等方面展_研究,與此同時,針對文本特征的提取和特征情感判別是情感分類研究的兩個關鍵問題。

1.2 Word2vec介紹

word2vec是Google在2013年開源的一款將詞表征為實數值向量(word vector)的高效工具,采用的模型有CBOW(Continuous Bag?of?Words,即連續的詞袋模型)和Skip?Gram兩種,word2vec采用的是Distributed Representation的詞向量表示方式,經過對輸入集數據進行訓練,可以實現將文本詞匯轉換為維空間向量,然后基于空間向量相似度來表達文本語義相似度,模型輸出結果可用于自然語言處理領域相關工作,比如文本聚類、詞典擴充、詞性分析等。

word2vec生成詞向量的基本思想來源于NNLM(Neural Network Language Model)模型,其采用一個三層神經網絡構建語言模型,假設某個詞的出現只與前個詞相關,其原理示意圖如圖1所示。

圖1中,最下方的為前個輸入詞,并根據其預測下一個詞每個輸入詞被映射為一個向量,為詞語的詞向量。網絡的第一層(輸入層)為輸入詞語組成的維向量網絡第二層(隱藏層)計算為偏置因子,使用激活函數tanh;網絡第三層(輸出層)包含個節點,每個節點表示下一詞的未歸一化log概率,并使用softmax激活函數將輸出值歸一化,最后使用隨機梯度下降法對模型進行優化。

圖1 NNLM原理模型圖

模型的目標函數為:

需要滿足的約束條件為:

2 電力客服工單情感分析模型

本文以某電力公司客服工單數據為研究對象,在深入理解電力業務及工單文本語義特點的基礎上,建立了一種電力客服工單情感分析模型。首先,在進行文本預處理的基礎上,對文本進行分詞處理并且完成關鍵詞提??;然后,采用word2vec訓練工單數據,并基于關鍵詞進行情感詞典擴充,構建電力客服領域專用情感詞典;最后,進行工單情感傾向性分析。

2.1 工單文本預處理

由于工單文本數據中存在大量價值含量較低甚至沒有價值意義的數據,在進行分詞、情感分析中會對結果產生較大的影響,那么在文本挖掘之前就必須先進行文本預處理,去除大量沒有挖掘意義的工單數據。工單文本預處理工作主要包括:刪除未標注業務類型數據、分句處理、文本去重、短句刪除等。

分句處理:將工單數據處理成以句子為最小單位,以句尾標點符號為標志分割,包括“,”,“?!?,“;”,“!”等符號。

文本去重:就是去除工單數據中重復的部分,常用的方法有觀察比較刪除法、編輯距離去重法、Simhash算法去重等。

短句刪除:刪除過短的文本,如“還可以”,“非常好”等,設置文本字符數下限為10個國際字符。

2.2 電力客戶服務領域情感詞典構建

2.2.1 分詞

本文采用python的jieba分詞工具對數據集進行分詞,并完成詞性標注和去除停用詞,由于情感分析通常由名詞、形容詞、副詞和連詞等反映出來,因此刪除詞性為動詞的詞匯。jieba中文分詞工具包包含三種分詞模式:精確模式、全模式和搜索引擎模式,綜合分詞效果及后文的研究,本文選擇精確模式進行分詞,三種模式的分詞效果如表1所示。

另外,在實際的分詞過程中,出現了個別分詞結果與實際的語義不符,原因是字典中缺少相關的專有名詞,或者是這些詞語的詞頻較低,比如“客戶/咨詢/抄/表示/數等/信息”,“客戶/查戶/號”,“變壓器/重/過載”,“查/分/時/電價”等,因此,需要對原有詞典進行更新。python中采用jieba.load_userdict(dict.txt)語句添加自定義詞典,其中dict.txt是保存字典內容的文件,其格式為每一行分三部分:一部分為詞語;另一部分為詞頻;最后為詞性(可省略),用空格隔開。

2.2.2 關鍵詞提取

構建電力客戶服務領域專屬情感詞典,需要盡可能保證領域詞典的多樣性,關鍵詞的提取要求一方面能夠盡量反應出這個特征項所屬的類別,另一方面能夠把自身屬于的類別與其他類別有效地區分開來,依據此原理,本文采用TF?IDF思想進行電力客戶服務領域關鍵詞的提取,關鍵詞選取的權重決定了情感詞典的多樣性,為下文情感詞典的擴充做好基礎,算法原理如下。

將工單文檔和特征項構建成二維矩陣,各條工單的特征向量可表示為:

式中:表示第個工單中第個特征中的詞頻。則與為:

式中:表示語料庫中的文件總數;表示包含詞語的文件總數,防止分母為零的情況,通常對分母做+1的處理。因此,的計算公式為:

實際應用中,依據維度的大小確定相應的權重大小,這樣就形成了代表語料特征的關鍵詞集。

2.2.3 基于word2vec進行情感詞典擴充

隨著經濟技術的發展及客戶文化的差異,不同的客戶通常使用不同的詞匯描述同一個對象特征,且電力行業中存在許多專用詞匯,同樣也表達了一定情感,但這些詞脫離于現有的情感詞典,因此,有必要對現有的情感詞典進行擴充,進而提升工單情感傾向性分析的準確性[8]。選取中國知網情感詞集和大連理工大學林鴻飛教授整理和標注的中文情感詞匯本體庫作為基礎的情感詞典,然后依據權重較大的關鍵詞對原有詞典進行擴充[9]?;谏衔碾娏蛻舴展沃刑崛〉年P鍵詞,采用word2vec工具對工單數據集進行訓練,根據CBOW模型或Skip?Gram模型訓練出每個詞的詞向量,并通過計算余弦相似度得到文本語義上的相似度,并將相似度較高的詞語加入到情感詞典中。

依據上文分詞后得到的工單文本數據,采用Linux Version2.6環境對數據進行訓練,操作命令如下:

./word2vec ?train data95598.txt ?output vectors_95598data.bin ?cbow 0 ?size 200 ?winodw 5 ?negative 0 ?hs 1 ?sample le?3 threads 12 ?binary 1

其中,data95598.txt為輸入數據集;vectors_95598data.bin為模型輸出文件;采用Skip?Gram模型進行訓練,詞向量維度設置為200;訓練窗口大小設置為5;-sample表示采樣的閾值,訓練結果采用二進制方式存儲。這樣,得到的模型文件中就包含了每個詞的詞向量。

采用余弦相似度計算關鍵詞的相似詞,即基于生成的詞向量計算兩個維向量的相似度,因為word2vec本身就是基于上下文語義生成的詞向量,因此,余弦值越大,表明兩個詞語的語義越相似。向量與的余弦計算公式如下:

通過distince命令計算輸入詞與其他詞的余弦相似度,經過排序返回相似詞列表,再經過人工篩選,將這些詞加入到原有情感詞典中,實現對原有情感詞典的擴充。

2.3 工單情感傾向性分析

工單情感傾向性分析是基于構建的情感詞典,計算每個客服工單的情感分值,從而判斷工單的情感傾向性。通過上文處理,每一個客服工單都可以被分割成一個個子句片段,表示為每個子句片段由一系列分詞后的詞語構成,提取每個句子的情感詞、否定詞等,表示為依據情感詞典中給定詞的極性值計算每個子句的情感值,分別算每個句子的正向和負向情感分值,計算公式如下:

式中:SenSum表示某個客服工單的情感分值;表示第個子句中第個正向情感詞的極性值;表示第個子句中第個負向情感詞的極性值。

在否定子句中,當為偶數時,否定子句情感為正;當為奇數時,否定子句情感極性為負。對所有的子句情感分值求和并求均值,就得到了整個客服工單的情感值,進而判斷客服工單的情感傾向性,若SenSum為正,表示工單情感為正向;否則,工單情感為負向。

3 實驗分析

3.1 實驗數據準備

本文的實驗環境基于Linux系統,采用python語言進行算法的實現,抽取某電力公司95598客服工單數據作為研究對象,運用jieba包進行中文分詞處理,并采用word2vec訓練數據生成詞向量及擴充情感詞典。由于工單數據是按照業務類型生成的,因此選取業務類型為表揚的工單作為正類,選取業務類型為投訴的作為負類,其中,正類和負類數據比例為21,共得到20 000條數據作為實驗數據集,隨后進行情感傾向性分析,隨機選擇70%的數據作為訓練集,30%的數據作為測試集。

3.2 評價指標

當前針對文本分類效果評估有許多方法,本文選擇準確率(precision)、召回率(recall)和值進行文本情感分類效果的評估,準確率是對分類精確性的度量,召回率是對分類完全性的度量,值越大說明分類效果越好,準確率和召回率是一組互斥指標,值是將二者結合的一個度量指標,值越大,分類效果越好,并將通過本文情感分析模型得到的結果與業務員標注的類型做對比分析。它們的計算公式如下:

3.3 實驗結果及分析

本文基于抽取到的客服工單數據,結合設計的電力客服工單情感分析模型,實現對電力客戶服務領域情感詞典的擴充,并基于構建的電力客服領域專屬詞典進行工單情感傾向性分析,70%的數據用于訓練word2vec并進行情感詞典的擴充,30%的數據用于測試工單情感分類的準確性。測試集共包含工單數6 000條,其中正類工單3 895條,負類工單2 105條。將采用本文情感分析模型得到的結果與原始基礎情感詞典得到的結果進行對比分析,見表2。

由表2可知,采用本文構建的電力客服工單詞典針對正向和負向的情感詞都有較高的準確率、召回率和值,由此可知,本文設計的電力客服工單情感分析模型是合理的,且具有明顯的性能優勢。

4 結 語

本文設計了一種電力客服工單情感分析模型,構建了電力客服領域情感專用詞典并進行工單情感傾向性分析。采用word2vec工具對采集到的數據進行訓練,并用測試集數據對本文提出的模型進行驗證分析,結果表明,本文所提方法具有一定的合理性和可行性,可為電力企業客戶關系管理提供一定的參考意義,促進企業客戶滿意度及運營效益的提升。此外,本文主要研究了基于構建的電力客服專用情感詞典進行客戶情感傾向性分析,但是對于無監督性學習方法情感傾向性分析以及情感強度的分析還有待進一步研究。

參考文獻

[1] 李勝宇,高俊波,許莉莉.面向酒店評論的情感分析模型[J].計算機系統應用,2017,26(1):227?231.

[2] SINGH VK, PIRYANI R, UDDIN A, et al. Sentiment analysis of movie reviews: a new feature?based heuristic for aspect?level sentiment classification [C]// Proceedings of 2013 International Multi?Conference on Automation, Computing, Communication, Control and Compressed Sensing (iMac4s). Kottayam: IEEE, 2013: 712?717.

[3] 郗亞輝.產品評論中領域情感詞典的構建[J].中文信息學報,2016,30(5):136?144.

[4] 鐘將,楊思源,孫啟干.基于文本分類的商品評價情感分析[J].計算機應用,2014,34(8):2317?2321.

[5] 劉龍飛,楊亮,張紹武,等.基于卷積神經網絡的微博情感傾向性分析[J].中文信息學報,2015,29(6):159?165.

[6] 黃挺,姬東鴻.基于圖模型和多分類器的微博情感傾向性分析[J].計算機工程,2015,41(4):171?175.

[7] 劉金碩,張智.一種基于聯合深度神經網絡的食品安全信息情感分類模型[J].計算機科學,2016,43(12):277?280.

亚洲精品一二三区-久久