前言:尋找寫作靈感?中文期刊網用心挑選的英語分層在線考試系統設計與實現,希望能為您的閱讀和創作帶來靈感,歡迎大家閱讀并分享。
摘要:傳統考試和現階段的考試系統已不滿足教育行業對于考試的需求了,因此,總結了目前的考試系統的不足,結合人工智能的方式,在抽題組卷上,采用自適應化遺傳算法,達到高效率的智能組卷。再結合神經網絡算法,通過LDA模型、詞向量、CNN、RNN、sigmoid激活函數等方式相結合,在經過訓練后即可進行作文自動評分的體系,實現一個高效率的智能在線英語考試系統。
關鍵詞:智能組卷;神經網絡;自動評分;在線英語考試系統
1概述
隨著計算機的高速發展,工作崗位上對于工作效率也要求越來越高。而最為傳統的紙質考試已經不滿足對于現在對于考試方面的需求了,這種傳統的考試中,不僅耗時,而且對于紙張的浪費量大,成本需求高。而且在一個考場里,作弊率會非常的高。在最后的評卷時,評卷老師需要批閱大量的時間,很容易精神疲憊,這樣就會在不經意間將一些試題批改錯誤,而且對于一張試卷上的總分也需要教師手動計算,在大量的評卷后,進行這樣的數學計算,很容易計算錯誤,導致試卷實際分數與評改的分數不一致,造成不公平現象。在多年的發展下,對于使用計算機來進行考試的技術已經逐漸成熟了。這些考試系統相對于傳統的考試是一個很大的提升,但這樣的考試系統并不完善,在考試方面已經很好了,而在抽題方面只能從試題庫里隨機抽題,導致兩個學生的試題可能完全不同,失去了一定的公平性。在評卷方面,只能對于一些固定答案的題型(選擇題、判斷題、填空題)來進行評判。而對于一些主觀題(問答題、作文)卻很難做出評改。而對于這樣的題型來說,一般都是通過人工來進行評分,這樣的方法確實提高了對于主觀題的準確性,但是對于評改的教師來說,無疑與傳統考試并無兩樣,只是少了一部分題型而已。這樣的傳統考試系統雖然解決了考試上客觀題的評判,但是在主觀題上還是沒有太大辦法,最多也只能通過對比正確的參考答案進行一個模糊的評判,正確率十分的低。
2基于遺傳算法的抽題體系
在傳統的抽題中,是在一個題庫里的每種題型中給每個學生進行隨機抽題,題型里肯定是由一個難度值的,對于一個學生來說,可能抽的題很簡單,對于另一個來說,也許都是難題,所以這樣的抽題方法,雖然很大程度的杜絕了作弊現象的發生,但是還是影響了考試的公平性。而一個基于機器學習的抽題是一個從遺傳算法中脫胎出來一個抽題算法,遺傳算法借用于生物進化中“適者生存”的規律,通過對于生物進化過程中的選擇、交叉、變異機理的一個模仿,完成對最優解的自適應搜索過程;可以說,遺傳算法是通過自適應的尋優的只能搜索技術。[1]最后經過一系列運算,得到一個適應值滿足條件的最優解。在遺傳算法的基礎上產生以下的結果:通過隨機函數生成試卷群體,然后在試卷群體中的試題基因進行打散并在再次重組,從而產生新的試卷群體,周而往復會產生大量的組合型群體,在每次基因重組完成后在對群體進行逐一標記,最后編排判斷,以獲取滿足需求的最佳匹配結果。完成以上需求后進行實際情況分析。試題庫出題的過程中,通過獲取題型、知識點等種群標記需求,然后將里面的試題(基因)隨機打亂,同時選項(基因)也進行打亂,在雙重隨機的情況下盡量的杜絕規律性、重復性、偶然性。相較于其他的算法來說,既提高了算法速率,又滿足了實際情況下的系統需求。重組后的每張試卷題目的順序不同的目的,從而在一定程度上杜絕作弊。所以以遺傳算法來抽取試卷,相對于其他算法來說,不僅提高了速率,更能根據需求來得到一張更為合理的試卷。
3基于機器學習的試卷主觀題評分
在一場英語考試中,作文的評分對人的精力消耗最大。評改過程中,要關注作文中單詞的正確性,語法結構是否正確,上下文是否合理。對于評分老師來講,不僅評分需要合理,而且也是十分耗時的。在現有的一些考試系統中,雖然解決了客觀題的評分,但是這樣一個主觀題還是需要由老師來進行評分。從一定角度來說,失去了考試系統的意義。一片作文就是由一個個單詞構成的,在這些單詞之間,則是通過語法來銜接單詞,構成語句,再由語句構成作文。要構成智能的作文評分,那么就需要LDA模型將文本中每一個話題下詞分布、每個詞對應得話題分布,再通過使用詞向量one-hotrepresentation將單詞數字化。再以卷積神經網絡操作,將通過計算詞向量組得到的卷積值拼接,再次將作文特征提取,然后在通過循環神經網絡LSTM對信息處理,得到關于文本離散程度特征的向量,最終將得到的多個向量進行一個回歸分析,并給出分數。LDA模型:這是一種能夠用于特征提取的技術,在使用LDA模型之后,對于數據分析中的計算效率用明顯的提高,在對一篇作文分析評分前,我們使用LDA模型將作文中潛在的主題結構。更能直觀的看出每一個主題與詞匯表中的N個詞的分布,也能看出一個詞與N個主題之間的分布。詞向量:一個英語單詞是不能直接被計算機所識別的,而我們要讓計算機能夠識別這些詞,因此,我們需要將這些詞轉換成計算機能識別的數學信號。在詞向量里,word2Vec是一種模型,一種精簡化的神經網絡,經過算法不停的鍛煉神經網絡,在經歷長時間的訓練后,就可以的一個權重矩陣,使用來作為輸入的詞向量,相比one-hot(離散表示)不受維數災難的困擾。經常使用的word2Vec模型有兩種:CBOW,Skip-gram。CBOW模型是一種連續性的詞袋模型,它是根據文章的上下文,在經過編碼,形成權重矩陣,最后計算,預測出中心詞,而Skip-gram模型則恰恰相反,它和CBOW模型相比就是一個鏡像關系,它是通過中心詞來預測上下文。要具體分析作文的分數,采用CBow模型,通過上下文來預測出中心詞。CBOW模型通過不斷的訓練,就會獲得權重矩陣WV*N,這種權重矩陣就是輸入的詞向量的表示。卷積神經網絡:在通過詞向量得到了一個權重矩陣后,在卷積神經網絡的輸入層,將各個詞向量拼接,在卷積神經網絡的卷積層中,每次卷積的過程都會產生一個卷積核。循環神經網絡:在循環神經網絡中,這一步讓機器真正的像人一樣的記憶,循環神經網絡中,循環神經網絡中,有RNN結構,但是RNN結構有個小缺點,當一個神經元距離長了之后,RNN結構就無法有效的利用歷史的信息,因此更多時候采用的是LSTM結構,它沒有RNN的缺點,能夠很好的保持與遺忘信息。均值分析:在這這一步驟中,將從循環神經網絡中得到結果h=(h1,h2,…,hm),通過計算其平均值得到一個與作文評分相關的特征,在多層的神經網絡之中,要將上一層信號作為下一層的輸入,那么在輸入到下一層前就要通過sigmoid激活函數f=sigmoid(Wx+b)得到一個基于0到1之間的值,在最后平均值帶入得到的值就是一個相關于分數的權重,值越大,這個權重的作用就會越大。作為一個剛建好的作文自動評分是還不能使用的,需要將大量的作文篇幅用于訓練這個系統,使其在訓練中不斷更新參數,做到能合理的評分。
4結語
本文通過傳統的英語紙質考試的繁雜與現有系統只能自動評改客觀題,不能評作文這一類主觀題的缺點。為了提高考試效率以及維護考試公平性,以及提高評卷速率,結合現有系統的優缺點,結合書籍找到一個通過自適應的遺傳算法作為組卷的方式,大大的提高了組卷的效率,同時并再次打亂試卷來改變題目順序,達到預防作弊效果,在作文這類主觀題方面,通過使用LDA文檔主題模型,詞向量,神經網絡中、卷積神經網絡、循環神經網絡等方式建立了一個自主評分的作文評分體系。實現了從出卷到評分過程一體化的英語考試系統。
參考文獻:
[1]王萬良.人工智能導論[M].高等教育出版社,2017.7:134-135.
[2]王耀華,李舟軍,何躍鷹,巢文涵,周建設.基于文本語義離散度的自動作文評分關鍵技術研究[J].北京:北京航空航天大學計算機學院.
作者:董澤東 孫新杰 胡洋 單位:六盤水師范學院數學與信息工程學院