神經網絡在高考英語口語中的應用

前言:尋找寫作靈感?中文期刊網用心挑選的神經網絡在高考英語口語中的應用,希望能為您的閱讀和創作帶來靈感,歡迎大家閱讀并分享。

神經網絡在高考英語口語中的應用

摘要:

基于神經網路方法實現高考英語口語成績的采集,實現口語成績等級手寫體的識別,提高在英語口語成績處理的效率,實現口語成績的自動采集。目前該方案應用于蘇州市高考英語口語成績采集。

關鍵詞:

成績采集;模式識別;神經網絡;特征提取

對于未實行高考口語人機對話的省市,高考口語還是采用打分模式。然后人工采集,為解決這一問題,通過識別手寫評分和OCR識別結果比對確保成績采集的準確。而神經網絡很適合用于解決字符識別問題。

1BP神經網絡

人工神經網絡是在人類對其大腦神經網絡認識理解的基礎上人工構造的能實現某種功能的神經網絡,是一種典型的前饋神經網絡,包含輸入層、隱層及輸出層。BP網絡是典型的多層網絡,分輸入層、隱含層和輸出層,算法由數據流的前向計算和誤差信號的反向傳播兩個過程構成。通過這兩個過程的交替進行,在權向量空間執行誤差函數梯度下降策略,動態迭代搜索一組權向量,使網絡誤差函數達到最小值,從而完成信息提取和記憶過程[1]。

2基于神經網絡的英語口語成績采集的實現

為實現更好的采集,需要設計適應識別的評分表,其中定位點、考生條碼用于定位到考生并采集成績,等級手寫的分區需要通過神經網絡識別等級,OCR等級識別區用采集等級并通過神經網絡采集的等級進行比較。

2.1采集過程

首先預處理圖像獲取樣本進行訓練,輸入神經網絡訓練后輸出看誤差并調整各階層的權值讓輸出同OCR值一致,正式識別兩種模式結果不一致需要人工干預,有可能等級打錯也有可能等級涂錯,然后修正結果,確保等級信息準確無誤。

2.2圖像預處理

原始評分表的輸入有可能產生污點等噪音。所以在識別之前必須對圖像進行預處理。預處理一般包括圖像分割、灰度、二值化、平滑、去噪音、歸一化和細化等。不同識別方法對于處理要求不一樣預處理后離散和噪聲和歸一化和細化處理,將圖片形成一個40×40像素點陣(圖1得分區圖像預處理后圖像)。

2.3神經網絡的特征提取

在手寫等級識別中,特征的選擇是非常關鍵問題。將經過預處理后的等級數字圖像中提取最能體現這個字符特點的特征向量,然后提取出訓練樣本中的特征向量代入BP網絡之中就可以對網絡進行訓練,提取出待識別的等級樣本中的特征向量代入訓練好的BP網絡中,就可以對等級得分字符進行識別。

2.3.1英語口語成績采集中BP神經網絡結構

將A、B、C、D等級圖像的特征向量作為神經網路的輸入,確定輸入神經元。經過預處理的為40×40的矩陣,共1600各輸入神經元。輸出較為簡單,只要識別A、B、C、D4個等級,輸出節點數為4。為加快神經網絡學習速度,3層BP網絡最為恰當效率高。同時根據網絡收斂性能的好壞來確定隱含層神經元個數。根據經驗公式:s=51.035.077.054.212.043.02mnmnm其中,n為輸入層神經元個數,m為輸出層神經元個數[2]。計算可得隱含層神經元個數為79。

2.3.2BP神經網絡的訓練

手寫字符歸一化和細化后的圖像為40×40的布爾矩陣,1600個元素組成一個手寫字符的列矩陣,即字符的特征向量。由A、B、C、D這4個字符的特征列向量組成一個1600×4的輸入矢量,訓練次數達到最大值神經網絡訓練就結束。

2.3.3口語等級識別等分結果

字符識別的正確率和拒識率與字符識別的判斷值有關,判斷值越高,識別的正確率就高。為確保成績錄取100%正確,通過識別和OCR識別比較,不同再通過人工識別錄入確保準確(圖2成績自動識別等分)。神經網絡在口語成績登分中的應用過程中大大減輕勞動強度,提高準確率,通過多重比對確保成績錄入準確,經過實踐應用和比對成績登分準確率100%,完全可以滿足實際需要。

參考文獻

[1]蔣宗禮.人工神經網絡導論.高等教育出版社出版,2001(5):26-88.

[2]杜選,高明峰.人工神經網絡在數字識別中的應用.計算機系統應用,2007(2):21-22+27.

作者:李東升 單位:蘇州教育考試院

亚洲精品一二三区-久久