決策樹在教學評價中的應用研究

前言:尋找寫作靈感?中文期刊網用心挑選的決策樹在教學評價中的應用研究,希望能為您的閱讀和創作帶來靈感,歡迎大家閱讀并分享。

決策樹在教學評價中的應用研究

摘要:決策樹學習是人們廣泛使用的一種歸納推理形式。先就決策樹和決策樹學習算法進行介紹,然后用實例闡述決策樹在教育信息處理中的應用,主要以在教學評價中的應用為例來加以介紹。

關鍵詞:決策樹;數據挖掘;教育信息處理;教學評價

    當今社會處于一個信息爆炸的時代,海量的數據可以用來選擇和發掘信息,然而有時卻讓人無從下手,因此數據挖掘技術受到人們的高度關注。數據挖掘是從大量的、不完全的、有噪聲的、模糊的或者隨機的數據中提取人們事先不知道的但又是有用的信息和知識的過程。它的方法很多,其中決策樹是一種解決實際應用分類問題的數據挖掘方法。在教育教學中,根據決策樹算法的實際特點,它可以在教育信息處理中的信息采集上發揮很大的作用。

1 決策樹介紹

決策樹學習是人們廣泛使用的一種歸納推理形式。決策樹起源于概念學習系統,其思路是找出最有分辨能力的屬性,把數據庫劃分為許多子集(對應樹的一個分枝),構成一個分枝過程,然后對每一個子集遞歸調用分支過程,直到所有子集包含同一類的數據。最后得到的決策樹能對新的例子進行分類。它一般是從一組無次序、無規則的事例中推理出決策樹表示形式的分類規則。它一般需要給定一組訓練例子,訓練例子一般被看成用于創建模型的數據集。由此可以看出,決策樹是一個類似于流程圖的樹結構,其中每一個內部結點表示對一個屬性的測試,每一個分支代表一個決策輸出,而每個葉節點代表一個目標分類。決策樹通過把實例從根節點排列到某個葉子節點來分類實例,葉子結點即為實例所屬的分類,樹上每個節點說明對實例的某個屬性的測試,節點的每個后繼分支對應于該屬性的一個可能值。假如需要根據人員的外貌特征對人員進行分類,用于人員的外貌特征有3個,外貌列表={高度,發色,眼睛};各屬性的值域分別為:高度={高,矮},發色={黑色,紅色,金色},眼睛={黑色,棕色}。分類結果有兩種:種類={+,-}。提供的訓練例子集為:T={<(矮,金色,黑色),+>,<(高,金色,棕色),->,<(高,紅色,黑色),+>,<(矮,黑色,黑色),->,<(高,黑色,黑色),->,<(高,金色,黑色),+>,<(高,黑色,棕色),->,<(矮,金色,棕色),->}。上述文字可構造圖1所示決策樹。

2 決策樹學習算法

決策樹算法有幾種,如ID3、C4.5、CART等。其中ID3算法是最經典的算法,該算法從根節點開始,這個根結點被賦予一個最好的屬性。隨后對該屬性的每個取值都生成相應的分支,在每個分支的終點上又生成新的節點。然后按照該屬性的取值將每個訓練例子都分別賦給一個相應的新節點。如果沒有任何訓練例子能賦給某個節點,那么該節點連同相應的分支都將被刪除。這時,將每一個新節點都視作一個新的根節點,重復執行整個過程。這里,最好屬性的選擇要基于信息增益這個統計特性。在定義信息增益前,先要了解另一統計特性:熵。

給定一組有c個分類的訓練例子,對屬性a來說,它有值v,那么它的熵E定義為:E(a=v)=。其中pi是在第i類中屬性a取值為v的概率。為了能選出最好的屬性,需要使用度量信息增益。一屬性的信息增益就是按照該屬性對訓練例子進行劃分所帶來的熵的減少量,定義:Gain(T,A)=E(T)-。其中,T是訓練例子的集合,Tj是屬性A取值為j的訓練例子集合,為T的一個子集。

3 決策樹在教育中的應用

在教育教學中,尤其是在高等教育體系中,學校的數據庫中存貯著大量的教育教學信息,其中一部分和教學有關,如學校的開課排課情況、教師情況;一部分和學生有關,如學生歷年的考試、測驗成績等。這些大量的數據后面隱藏著大量的信息,只要加以分析,就能得到許多有用的信息,如教育規律、學生的培養模式、學生學科間的差異性和相關性的一些規律。這些規律對教育管理決策來說是相當重要的,對教育教學改革有指導性的意義。

3.1 決策樹在教育信息處理中的應用

決策樹表示的是一個離散值函數,樹中每一個節點表示一個屬性,同時目標分類具有離散的輸出值信息。教育中的大量信息,一般都是對一些離散的數據進行分析,比如學習成績一般分成優、良、中、差,外語六級成績分成過與未過,這些信息都可以用決策樹來加以分類歸納,對于連續的屬性值,也可以進行離散化處理后再利用決策樹來加以分析。

3.2 決策樹在教學評價中的應用案例

決策樹在教育信息處理中的應用很廣泛,下面以決策樹在教學評價中的應用為例,來說明在教育信息處理中是如何使用決策樹來分析的。教學評價在教育中是一個重要的問題,它是指依據一定的教學目標與教學規范標準,通過對學校教與學等教育情況的系統檢測與考核,評定其教學效果與教學目標的實現程度。教學評價具有復雜性、多因素性和模糊性等特點。如何客觀、科學、全面地對教學進行評價,是教學評價中一個重要的課題,下面嘗試將決策樹應用于教學評價。

在評價之初要有一個數據采集的過程,之后可以用決策樹來加以分析。課堂教學評價指標體系分為若干項,從教師的角度可以分為授課態度A1、授課方法A2、授課內容A3、授課效果A4、教學評價A5,可以取訓練例子如表1所示。 #p#分頁標題#e#

對給定的訓練例子數據是把連續的數據離散化的結果,A為評分90~100,B為評分80~89,C為評分70~79,D為評分60~69,E為評分<60,N1為教師編號,表中的A5為目標分類。

如果利用前面的ID3算法建立決策樹,先檢驗所有信息增益的特征屬性,選擇信息增益最大的屬性作為決策樹的結點,由該特征的不同取值建立分支,對此分支的實例子集遞歸該方法建立決策樹的結點和分支,直到某一子集中的例子屬于同一類。

對給定訓練例子的熵為:

E(T)==1.295 46。

以屬性A1為例,A1的值={A,B,C},由表中可以看出,|TA|=2,|TB|=6,|TC|=2,E(TA)==1,E(TB)==0.650 025,E(TC)=0。所以,可得E(T,A1)==0.590 015,Gain=(T,A1)= E(T)- E(T,A1)=0.705 445。同理可得Gain=(T,A2)=0.459 009,Gain=(T,A3)=0.970 9488,Gain=(T,A4)=0.809 986,所以可得Gain=(T,A3)>Gain=

(T,A4)>Gain=(T,A1)>Gain=(T,A2)。可以看出A3的信息增益最大,所以選A3屬性作為根節點的測試屬性,并根據其值向下分支,利用ID3算法進一步劃分,當根節點到當前節點的路徑上包括所有屬性或當前節點的訓練樣本同屬一類時,算法結束。根據以上分析給出圖2所示決策樹。

可以根據生成的決策樹,方便地提取其描述的知識,比如授課內容A3在這里產生的信息增益最大等信息。

4 小結

在教育信息中存在隱藏在數據中的規則,這些規則可以用不同的方法被挖掘。本文只是對決策樹中的分類ID3算法在數據處理中的應用進行研究,目的是得到教育教學中存在的規則,利用發現的規則對教育管理決策提供有參考意義的信息。

參考文獻:

[1]Callan R.人工智能[M].北京:電子工業出版社,2004

[2]尹朝慶.人工智能與專家系統[M].北京:中國水利水電出版社,2003

[3]朱福喜,等.人工智能原理[M].武漢:武漢大學出版社,2002

[4]陳翔,劉軍麗.應用決策樹方法構建評價指標體系[J].計算機應用,2006,26(2):368-370

[5]谷瓊,等.基于決策樹技術的高校研究生信息庫數據挖掘研究[J].電子技術應用,2006,32(1):20-22

[6]王中輝,等.決策樹在教學評價中的應用[J]甘肅科技,2006,22(3):125-126,106

 

亚洲精品一二三区-久久