前言:中文期刊網精心挑選了數據挖掘課程范文供你參考和學習,希望我們的參考范文能激發你的文章創作靈感,歡迎閱讀。
數據挖掘課程范文1
關鍵詞:數據挖掘;成績分析;決策樹算法
一、引言
成績作為考試的結果,不僅是對學生學業和教師教學效果的檢查和評定,進而激勵學生學習及教師工作;更是一種信息,具有反饋于教學活動、服務于教學決策、為教育科研提供資料等作用。為充分發揮考試的效能,綜合評價命題質量,及時反饋教學效果,溝通教學信息,教學部門對考試成績進行統計分析和總結是非常必要的。
二、問題提出
我們以軟件技術系軟件開發專業為例進行分析。在眾多專業課程中,很多科目之間是相互聯系相互影響的,例如《Java初級程序設計》是《Java高級程序設計》的前置課程,《J2EE企業級應用開發》則是《Java高級程序設計》的后續課程,《網頁制作―HTML、CSS》的學習效果將會影響《網頁制作―JavaScript》,而這些課程之間又是相互滲透相互聯系的。有時候有的教師在上一門課時會抱怨這個班的基礎不好,后續課程很難上,那么究竟是什么哪些前置課程對后續課程造成了影響呢?這里我們以軟件開發專業核心課程《J2EE企業級應用開發》為例,分析研究影響這門課成績的前置課程對其的影響。
三、數據預處理
07級軟件開發專業一共9個班,前4個學期一共開設23門課程,在教學管理的數據庫中保存著大量屬性繁多,定義復雜,冗余多,不完整的數據。我們首先要從大量的數據中篩選出適合分析的數據。
在課程的選擇中,我們選取《計算機基礎》、《計算機網絡基礎》、《計算機數學基礎》、《Java程序設計基礎》、《數據結構》、《數據庫原理與SQL Server》、《Java高級程序設計》、《網頁制作技術》以及《J2EE企業級應用開發》這幾門有關聯的課程進行分析。并且在分析之前把《計算機基礎》、《計算機網絡基礎》、《計算機數學基礎》這3門基礎課取平均值合并成一個《計算機基礎》。
這是在軟件技術專業9個班400多人中隨機抽樣選取91個學生的記錄作為樣本集。
表1 采樣成績表
經統計,91個學生記錄中,各門課程及格和不及格人數如表5.2所示。
表2 樣本集中各門課及格不及格人數統計
四、建立模型
1. 決策樹方法介紹
決策樹是一個類似流程圖的樹型結構,其中樹的每個內部結點代表對一個屬性(取值)的測試,其分支就代表了測試的每個結果;而樹的每個葉結點就代表一個類別,可以根據決策樹的結構對數據集中的屬性值進行測試,從決策樹的根結點到葉結點的一條路徑就形成了對相應對象的類別預測。
2. ID3算法的基本思想及原理
ID3算法是R.Quinlan于1986年提出的,其前身是CLS。CLS的工作過程為:首先找出最有判別力的因素,把數據分成多個子集,每個子集又選擇最有判別力的因素進行劃分,一直進行到所有子集僅包含同一類型的數據為止,最后得到一棵決策樹,可以用它來對新的樣例進行分類。
3. 構建決策樹
成績結果分為正例和反例兩類:及格(P)和不及格(N)。
下面用ID3算法,建立決策樹,對課程成績分類。
具體計算過程如下:
首先計算J2EE課程所含有的信息量。J2EE及格人數P=81,不及格人數N=10,則可得到:
0.4493
然后計算當J2EE及格和不及格時,其他課程所包含的總信息量。經統計,其他6門課程和J2EE有如表3所示的統計數據:
計算機基礎:
0.4421
從而得到計算機基礎的信息增益度為:
Gain(計算機基礎)=0.4493-0.4421=0.0072
同樣的方式,得到其他課程的信息增益度,結果如表4所示:
表4 各門課程的信息增益度
可以看出所有課程當中JAVA高級程序設計是最能區別訓練集中決定J2EE成績與否的課程。根據各個課程的信息增益度,應該選擇JAVA高級程序設計作為所建決策樹的根結點。由于JAVA高級的屬性值只有兩個:1(及格)和0(不及格),所以在JAVA高級下可以建立兩個分支。此時,將訓練實例集分為二個子集,生成包含二個葉結點的決策樹。如圖1所示。
圖1 根節點分類決策樹
經統計,JAVA高級程序設計及格且J2EE也及格的人數為73,其準確率為73/79=92.4%。因此對JAVA高級程序設計及格這個分支(結點一)停止分割。經統計,JAVA高級程序設計不及格的12人中有5人J2EE及格,7人J2EE不及格,所以對高級程序設計不及格這個分支(結點二)進行再次分割。
對圖1中的葉結點二進行分類。經過計算,此刻正例為4,反例為8,所以此時的熵值為:
0.9799
采用上面同樣的方法計算各門課程的信息熵,得到
計算機基礎:
0.9799
得到Gain(計算機基礎)= 0.9799-0.9799=0.0000
同理,得到:
Gain(JAVA基礎)= 0.9799-0.9371=0.0482
Gain(數據結構)= 0.9799-0.8669=0.1130
Gain(數據庫)= 0.9799-0.9799=0.0000
Gain(網頁設計)= 0.9799-0.9371=0.0482
選擇數據結構為分裂點,將結點二分為兩個子集。JAVA高級不及格且數據結構及格的人數為1人,該結點停止分割,JAVA高級不及格且數據結構不及格的11人中有4人J2EE及格,7人不及格,因此對該節點需要再次分割。
采用上述同樣的方式劃分,最后得到如圖2所示的最終決策樹。
圖2最終決策樹
五、結果分析
分析圖2所示的決策樹,我們可以得到:對于軟件專業后期的核心課程《J2EE企業級應用開發》來說,《Java高級程序設計》的學習程度直接影響其學習效果,《數據結構》和《JAVA初級程序設計》也會對《J2EE企業級應用開發》的成績帶來影響,如果學生《JAVA高級程序設計》學習一般但是《數據結構》和《JAVA初級程序設計》基礎較好的話,依然能夠在學習《J2EE企業級應用開發》時取得好的成績。這比較符合專業課程學習過程的實際情況。決策樹得出的結果反映了實際情況,這也充分說明了數據挖掘是一個強有力的輔助決策工具。
六、結束語
回顧一下這個案例,驗證數據挖掘技術解決這個問題的效果。在分析過程中,我們利用相關的數據,通過橫向比較《計算機基礎》、《Java程序設計基礎》、《數據結構》、《數據庫原理與SQL Server》、《Java高級程序設計》、《網頁制作技術》以及《J2EE企業級應用開發》等課程成績,經過數據收集、數據選擇、數據清理、數據歸納、數據轉換等過程,運用決策樹中的ID3算法課程之間知識結構相互支撐的模型,發現專業核心課程之間的內在聯系。輔助教學管理人員根據該模型對現有教學計劃做出調整,對師資資源合理利用,將優質師資用在主干課程上。
參考文獻:
1.李小映,數據挖掘在高職院校學校綜合信息中的應用,計算技術與自動化,2006.12
2.陳松、盧繼萍,教學管理系統中的數據挖掘技術的應用研究,中國教育技術裝備,2007.12
3.李雪真、陳燕國 ,基于數據挖掘的高校課程設置評價方法,科技資訊,2008.8
數據挖掘課程范文2
課程相關性分析數據挖掘相關分析典型相關分析關聯規則一、引言
課程是實現教學內容傳遞的集中體現,是學校教育的目的性、計劃性和組織性的集中體現。課程設置規定著課程類型、課程性質、課程排序和學時分配,還規定各類各科課程的學習目標、學習內容和學習要求等,其合理與否將直接影響到所培養人才的質量,關系到學生知識面的寬度、深度、動手實踐和研究能力的高低,同時也已經成為了影響大學生就業的主要因素之一。因此,課程結構和課程內容的合理設置尤為重要。
課程相關性分析可定量描述課程之間的相關性,可根據相關系數值的大小確定課程間關系的緊密程度,然后從順序性、整體性、關聯性和連續性四個方面為優化課程設置提供參考信息,優化課程結構和課程內容。近年來,國內外教育工作研究人員開展了大量的課程相關性方面的研究,國內外多所著名高校已將課程相關性研究成果作為課程設置的基本依據。
目前課程相關性分析研究所采用的方法均基于數據分析,其方法主要包括傳統數據分析法和數據挖掘分析法兩種,而兩者又有著本質的區別。在探索數據關系時,傳統的分析方法一般是基于驗證的方法,即用戶首先對數據之間的關系做出一定的假設,然后通過數據分析來驗證假設是否正確來得出相應結論,其分析過程是基于假設驅動的演繹型分析;數據挖掘不是用于驗證某個假定的模式(模型)的正確性,而是在數據庫中自己尋找模型,數據挖掘在本質上是一個完全基于發現驅動的歸納型分析過程。
本文對課程相關性分析中的數據挖掘過程及基于數據挖掘技術的課程相關分析方法進行介紹,以期為我國高校課程的優化設置研究提供理論指導和方法借鑒。
二、數據挖掘技術
數據挖掘(Data Mining,DM)又稱數據庫中的知識發現,是從大量的、不完全的、有噪聲的、模糊的、隨機的實際應用數據中,通過使用成熟的數據挖掘模型,提取出隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識,得到數據中反映出來的數據內在的關系,從而進一步應用到具體的數據分析研究中去。數據挖掘得到的信息具有先前未知、有效和實用三個特征。
目前,數據挖掘技術的已被應用于關聯分析(Association Analysis)、概念/類別描述(Concept/Class Description)、分類與估值(Classification and Estimation)、聚類分析(Clustering Analysis)、時間序列分析(Time-Series Analysis)、偏差分析(Deviation Analysis)、孤立點分析(Outlier Analysis)等方面,隨著數據挖掘技術的發展,可能還會繼續出現新的數據挖掘功能。課程相關性分析為其關聯分析功能中的一部分,所采用的分析方法主要有相關分析法、典型相關分析法和關聯規則分析法等。
數據挖掘分析過程各步驟之間互相影響、反復調整,形成一種螺旋式上升過程,具體分析流程見圖1所示。目前已建立的數據挖掘模型有CRISP-DM模型(Cross Industry Standard Process for Data Mining)、ODDM模型(OLE DB for Data Mining)、Oracle9i數據挖掘模型等多種,對于課程相關性分析來說,具有直觀、簡單和可靠等特點的CRISP-DM模型最為適用,其模型見圖2所示。
三、基于數據挖掘的課程相關性分析方法
基于數據挖掘的課程相關性分析方法主要有相關分析法、典型相關分析法和關聯規則分析法,三種方法各具優缺點,互不可取代。
1.相關分析法
相關分析法又稱單因子相關分析法,主要用于研究兩個變量因子間的相關關系。作為教育信息多元統計分析方法的一種,相關分析法主要用于測定現象之間相關關系的規律性,據此進行預測和控制。將其用于課程相關性的探討研究,可直接量化兩門課程間的相關性,分析過程簡單、快捷,顯示方式直觀,數據可信度高。
相關分析法在課程相關性分析研究中應用,主要有以下幾個步驟:
數據挖掘課程范文3
關鍵詞:數據挖掘技術;應用型本科;理論教學;實驗教學
中圖分類號:G642 文獻標識碼:A 文章編號:1009-3044(2016)22-0148-02
1 引言
數據挖掘總是讓人覺得就是“高大上”、“深不可測”,而該領域當前主要是博士生、碩士生所研究的,另外,也只在一些研究生或重點大學的高年級的本科生中開設數據挖掘課程,在應用型本科院校中很少開設 [1]。
數據挖掘技術應用很廣,應用較好的領域、行業有:金融保險業、電信、市場營銷分析、醫學、體育、生物信息學(Bioinformatics)等方面[2]。在商業領域中,主要應用如:客戶細分、客戶獲得、公司風險管理、企業危機管理、欺詐行為檢測和異常模式的發現等;在計算機領域中,主要應用如:信息安全(入侵檢測,垃圾郵件的過濾)、互聯網信息挖掘、自動問答系統、網絡游戲(網絡游戲外掛檢測、免費用戶到付費用戶的轉化)等[3]。這一技術的廣泛應用,必然在相關的企業中迫切需求掌握這一技術的人才。所以,開設數據挖掘技術課程對于應用型本科來說是很有必要的。
但對于應用型本科來說,若是像重點本科院?;蜓芯可n程那樣,在教學中以研究型為主,會導致學生的培養要求與教學內容的深度和廣度不適應,學生會感覺到學習得很吃力,而且他們今后工作中的需求與所學到的知識相差也較大。對于應用型本科的數據挖掘技術課程的內容的安排,不僅要反映出數據挖掘技術的特點及前沿,還應該結合學生的學習能力及興趣,也還需要綜合考慮本校該課程的學時分配、教學條件等,要具針對性,突出應用這一重點,目的是使學生能夠“學以致用”。
本文從應用型本科的實際出發,討論了數據挖掘課程的理論教學內容及方法、實驗教學內容及方法,使學生能夠掌握和應用所學的知識。
2 先導課程及課程的基本要求
先導課程有:程序設計語言、數據結構、數據庫技術、Web技術、概率論等[4]。必須深入學習一門程序設計語言,從計算機發展和應用角度,推薦學習C/C++和Java;對于“數據結構”課程,掌握樹的知識,數據挖掘中的很多算法都涉及樹的應用;對于“數據庫技術”課程,掌握數據庫操作和應用,因為數據挖掘的主要對象是數據庫中的數據;對于“Web技術”,因為Web已經存在于我們生活方方面面,對于Web挖掘相當重要,而且還具有巨大的應用價值;對于“概率統計”課程,要能夠熟練掌握其中的思維方式、條件概率以及各種分布,在數據挖掘中的關聯規則、分類預測等,都會涉及概率統計中的思維和方法。
課程的基本要求:①了解數據挖掘的重要性,了解國內外的發展的狀況及未來發展的方向;②掌握數據挖掘中的一些基本概念、經典算法及相關技術;③對于實際應用問題,能熟練地運用數據挖掘技術及工具解決;④為以后進一步深造或進行高級應用開發打下基礎。[5,6]
3 理論教學及方法
對于應用型本科生數據挖掘技術課程的教學,本人認為重要的是普及經典算法,若有多余時間,可以補充一些較難的算法。對于經典算法原理的講解,采取的是一步步地對小數據集案例進行算法演練,以具體化比較抽象的算法,對于算法的優缺點,采取課堂討論的方式,可以加深學生對算法的理解和吸收。本校的數據挖掘技術課程的理論教學是32個學時,課程的理論教學內容主要包括:
(1)緒論(4學時):①先舉幾個數據挖掘中有意思的例子。第一個:超市貨架的組織―“啤酒與尿布”;第二個:基于拐點變化的股票趨勢預測;第三個:網上購物―“定向營銷”;第四個:農夫山泉用大數據賣礦泉水;第五個:阿迪達斯的“黃金羅盤”;第六個:網易的“花田”―定制愛情。通過例子讓學生對數據挖掘有一個大致的認識,可以提起學生對學習本課程的興趣,也讓學生了解到目前的數據挖掘已經發展到何種程度。②講解KDD與數據挖掘相關概念。③數據挖掘對象:關系數據庫、數據倉庫、事務數據庫、空間數據庫、時態和時間序列數據庫、文本數據、萬維網數據、流數據等等。④數據挖掘的方法與相關領域:分類預測型和描述型,通過例子簡單介紹聚類、關聯規則、分類算法的概念、應用領域等,使學生對要學習的算法有大致的認識。⑤數據挖掘軟件與應用系統:介紹數據挖掘軟件:IBM Intelligent Miner、SPSS Clementine、Microsoft SQL Server 2008 Data Mining、Weka;數據挖掘應用系統:介紹在商業領域和計算機領域的應用。
(2)數據預處理(2學時):先對數據進行概述,包括:數據集的三個特性:維度、稀疏性和分辨率,它們對數據挖掘技術具有重要影響;數據挖掘中一些很常見的數據集的類型:記錄數據、基于圖形的數據和有序的數據。然后分別詳細介紹數據預處理的主要任務:①數據清理;②數據集成;③數據變換;④數據歸約;⑤數據概念分層與離散化。每一項任務舉例講解。
(3)關聯規則(6學時):主要介紹關聯規則的相關概念、關聯規則的經典算法Apriori及它的改進算法FP_Tree、規則的產生,簡單介紹多級關聯規則和多維關聯規則、非二元屬性的關聯規則、關聯規則的評估(提升度(lift) /興趣因子的計算)等。
(4)聚類(6學時):主要介紹聚類的概念及距離的計算(歐氏距離、曼哈頓距離、明可夫斯基距離)、基于劃分的聚類算法(基本K-means聚類算法及其拓展、PAM算法)、層次聚類算法(凝聚的層次聚類算法AGNES、分裂的層次聚類算法DIANA)、基于密度的聚類算法(DBSCAN);簡單介紹層次聚類方法的改進―BIRCH算法、CURE算法以及聚類算法評價。
(5)分類和預測(10學時):①決策樹(4學時):主要講解決策樹的概念、信息論、ID3算法和C4.5算法。②貝葉斯分類(2學時):主要講解貝葉斯定理及樸素貝葉斯分類算法。③人工神經網絡(4學時):主要介紹人工神經網絡的概念及單感知器模型,簡單介紹BP神經網絡。
(6)數據挖掘模型的評估(2學時):簡單介紹模型的過擬合、沒有天生優越的分類器、模型選擇和模型評估、評估分類器或預測器的準確率――簡單劃分和交叉驗證、數據挖掘模型評估的錯誤觀念。
對于9個需主要介紹的經典算法的講解,如Apriori算法,先介紹算法的流程,然后通過超市購物籃的一個小數據集一步步地進行算法的演練,得出頻繁項集,如下圖所示:
又如決策樹算法和樸素貝葉斯分類算法,通過如下所示的關于動物的數據集,一步步地進行相關算法的演練,通過建立決策樹或計算概率問題,判斷一個未知的動物X={1,0,0,1,?}是否會生蛋。
對于算法的優缺點,在講解完算法的過程之后,采取課堂討論的方式,與學生共同分析總結算法好在哪里,不足又在哪里,學生通過參與,可以加深對算法的理解與掌握。
4 實驗教學及方法
對于應用型本科的學生來說,采用Weka進行算法編寫是不切實際的,實驗教學工具建議采用目前一些主流的數據挖掘軟件,如 SPSS Clementine或 Microsoft SQL Server 2008 Data Mining等[7]。這些軟件都具有必需的數據預處理工具及預設的挖掘算法,學生可以把注意力放在要挖掘的數據及要相關需求上,設定挖掘的主題,然后采用這些軟件完成相關主題的數據挖掘過程,這樣也可以積累一定的處理實際挖掘問題的實戰經驗,今后碰到項目時也可知道從何處下手。
本校的數據挖掘技術課程的實驗教學是8個學時,共兩次上機,采用Microsoft SQL Server 2008 Data Mining對Adventure Works DW 2008R2 示例數據庫進行數據挖掘。課程的實驗教學內容主要包括:
實驗一:SQL Server 2008 數據多維分析環境的建立;
實驗二:關聯規則挖掘方法;
實驗三:決策樹挖掘方法;
實驗四:聚類挖掘方法。
為了讓學生更好地進行實踐動手,在教學中分兩步:第一步,具體的操作步驟的講解,由老師進行;第二步,學生上機并詳細的分析挖掘結果,要求學生熟悉使用Microsoft SQL Server 2008進行數據挖掘的步驟,以及幾種常用的算法的挖掘過程:包括創建數據源、創建數據源視圖、創建挖掘結構(主要參數的設置)、處理和瀏覽挖掘模型。如關聯規則,要求學生分析挖掘的模型,找出有價值的規則出來。
5 結論
為迎接大數據時代帶來的互聯網經濟機遇,很有必要同時也是時代迫使在應用型本科中開設數據挖掘課程。對這一類學校的教學也是一個挑戰,需要老師們在教學過程中不斷摸索和改進。在教學過程中,需要針對應用型本科生的學習能力、知識結構,設計好教學內容并采用適當的教學方法,從而使學生對學習的內容感興趣,改進課堂教學效果,以提高學生實際動手能力,使學生對數據挖掘課程的整體結構、基本概念、經典算法有較深入理解和掌握,最終達到教學目的。
參考文獻:
[1] 徐金寶.對應用型本科生開設數據挖掘課程的嘗試[J].計算機教育,2007(14):27-29,57.
[2] 李姍姍,李忠. 就業需求驅動下的本科院校數據挖掘課程內容體系探討[J].計算機時代,2015(1):60-61,64.
[3] 張艷.大數據背景下的數據挖掘課程教學新思考[J].計算機時代,2014(4):59-61.
[4] 李忠,李姍姍. 應用型本科院校IT專業數據挖掘課程建設[J].計算機時代,2014(11):65-69.
[5] 張增平,喬曉華. 針對應用型本科生數據挖掘課程的教學實踐[J].內蒙古財經大學學報,2015,13(4):132-137.
數據挖掘課程范文4
Abstract: By using classification and regression, this article constructs an attribute which can express the trend of Customer Loyalty, and validates the practicability of this method by the customer relation data.
關鍵詞: 數據挖掘;分類;回歸;客戶忠誠度
Key words: Data Mining;classification;regression;Customer Loyalty
中圖分類號:F83 文獻標識碼:A 文章編號:1006-4311(2013)06-0140-04
0 引言
上世紀八十年代來,隨著市場競爭的日趨激烈,企業在市場營銷上面臨著新的挑戰,傳統的4P理論越來越不適應市場發展變化的需求。如今的市場營銷無論是理論還是實踐都已經實現了向4C的轉變。在4C營銷理論中,首先強調的就是客戶(Customer),它居于這一理論的核心地位。所以這種營銷理論又被視為一種“以客戶為中心”的營銷戰略。而這一營銷戰略的核心思想就是追求“客戶忠誠”的目標。對于“客戶忠誠”,至今還沒有一個準確的定義,但是在一些理論闡述和實踐應用中,這一概念被普遍理解為是某個企業的客戶對該產品或服務有愿意繼續購買的傾向。雖然這種解釋并非正式的,但是從一些衡量客戶忠誠度的指標上可以得到證實,比如客戶對其所認可的產品進行長期、頻繁、大量的購買,或者與企業建立某種長期的合作關系等。
隨著市場營銷實踐的不斷發展,客戶的忠誠度以及變化趨勢進行研究引起了業內的廣泛關注。本文針對這一趨勢,設計了一套客戶忠誠度預測系統,通過數據挖掘技術的引入,對客戶數據進行科學分析,幫助決策者做出正確決策。
1 系統功能簡介
到目前為止,國內外已經有許多成熟的CRM產品,它們已廣泛應用于零售業、制造業、金融業等,這些產品也用到了數據挖掘技術,如聚類分析算法或孤立點算法等。但是它們更多的是將目標放在對客戶分類或找出最忠誠的或是最不忠誠的客戶上,其功能受到了一定局限,無法對客戶忠誠度的變化趨勢進行可靠預測。例如,銀行業中的客戶忠誠度分析只是找出存款多的重點客戶,或者是找出那些行為異常的有欺詐行為的客戶。本文針對這一問題進行研究,結合實際應用,既構造出了能夠反映趨勢變化的屬性,又把不能用于分類分析的連續屬性離散化,然后再利用所構造出的屬性和其他的相關屬性,進行分類分析,最終得到客戶忠誠度的變化趨勢。該系統的主要功能如下:
1.1 數據預處理 能夠對已有數據集中的數據進行缺值填充、數據轉換、數據離散化、數據規范化等功能。
1.2 發掘重點客戶 忠誠度高的客戶和忠誠度低的客戶都屬于重點客戶的范疇。而客戶關系管理理論中的2/8原則告訴我們:80%利潤來自20%客戶,因此不僅要緊緊抓住老客戶、繼續保持老客戶的忠誠度,而且還要積極促成那些非忠誠客戶轉變為忠誠客戶。為了達到這一目的,該系統通過利用數據挖掘中的孤立點分析技術,使得這些客戶可以從龐大的數據集中被有效識別出來。
1.3 客戶忠誠程度預測 從客戶關系數據庫中提取相關客戶信息,在充分考慮到各種主客觀因素的前提下,采用回歸分析和分類分析等方法預測客戶忠誠度變化的趨勢,為決策者提供市場分析參考,以便于采取有針對性的措施,留住更多的客戶。
統機構如圖1。
2 客戶忠誠度預測模塊的實現
該模塊的主要作用是通過分析研究客戶關系數據集中客戶信息,實現對客戶忠誠度變化趨勢的預測。在技術運用上,主要采用了數據挖掘中的分類和回歸技術。在分類預測算法的運用中,需要通過訓練集建立分類模型,然后用該模型進行預測并得出結果。
下面我們以某一客戶關系數據來詳細介紹客戶忠誠度預測模塊的實現過程。
我們從客戶編碼表、客戶訂單提報表、訂單商流確認表和訂單銷售發票表等與客戶有關的資料中,選取了兩項——客戶編碼表和客戶訂單提報表作為分析的數據源。這兩項數據資料不僅反映了客戶的相關信息,而且也反映出了客戶的購買意圖,對于客戶忠誠度的分析有很大作用。下面將從數據預處理和客戶忠誠度預測等方面對上述兩項數據資料進行分析。
2.1 數據的選取 客戶訂單提報表內容包括:訂單號、訂單類型、工貿、客戶編碼、存貨類型、產品編碼、會計期、會計周、市場經理編碼、型號經理編碼、提報數量、訂貨數量、減庫存數量、提報日期、要貨日期、狀態、唯一標識、產地、類別、單價等20個屬性。為了從中得出有效的客戶信息,需要通過查詢每位客戶的所有訂單,計算得出其訂貨次數、訂貨金額的數據信息。
訂貨次數(order count):指在某一時間段內,客戶所下訂單的數目??紤]到訂貨次數在10次以下的客戶以一次性客戶居多,針對這一群體討論客戶忠誠的意義不大,因此我們在這里只將訂貨次數大于等于10次的客戶納入到研究范圍中來。
訂貨金額(order product count):指在某一時間段內客戶每一次訂貨的金額,其計算方式為:訂貨數量×單價。
客戶編碼表內容包含:Email,客戶編碼,傳真,地址,電話,客戶級別,簡稱,建檔日期,開戶行,客戶類別,客戶全稱,客戶狀態,聯系部門,聯系人,市場級別,稅號,所屬客戶,所屬區域,網址,信用額度,信用期限,信用商場,郵編,賬號,主管業務員,特殊標識,網點性質,審核,部門編碼,銷售能力等30個屬性。
從客戶編碼表中,我們可以得出客戶建檔日期的信息。建檔時間(make date)可以告訴我們客戶與企業的合作時間,通過對這一數據進行分析,我們可以得出某一客戶的忠誠度信息。讓Datediff(date1,date2)表示date1與date2之間的天數,建檔時間可表示為:
Datediff(min(make date),max(make date))
接下來就可以得到訂貨周期的信息,并對其進行規范化處理。計算方式為:訂貨周期=建檔時間÷訂貨次數。
除此之外,在客戶編碼表中,我們還可以得到客戶編碼,客戶級別,市場級別,信用額度,銷售能力等信息。
客戶級別:通過聚類分析模塊或有經驗業務員的劃分,我們可以判斷客戶的級別,即對方是大客戶還是小客戶。
市場級別:調研人員對客戶所在地區進行市場調查所得出的該地區商品的飽和度。
信用額度:代表客戶的信譽度。
銷售能力:客戶每個月的銷售金額。
2.2 數據的處理 選定屬性后,按照具體分類分析的規則進行數據處理?;陬A測客戶忠誠度的功能要求,因此需要參照現有屬性來構造一個新的屬性,以期將客戶購買能力變化趨勢客觀的反映出來?;谏鲜鲈?,設計人員還需要全面分析訂貨金額等信息。筆者取一個客戶的購買情況作為典型案例,來具體闡明客戶購買能力變化趨勢屬性的構造,經過數次循環也能夠獲取其余客戶的購買能力的屬性。
在選定的屬性分析案例中,基于客戶級別、銷售能力和市場級別對客戶訂貨金額的影響,所以采用三元線性回歸建立模型:yi=?茁0+?茁1xi1+?茁2xi2+?茁3xi3,i=1,2,…,n。 (1)
其中:yi代表客戶每一次的訂貨金額,
xi1,xi2,xi3分別代表客戶每一次訂貨時的當時的售貨能力、市場級別和客戶級別。
?茁0、?茁1、?茁2、?茁3為回歸系數。
n為客戶的訂貨次數。
為了求得回歸系數?茁0、?茁1、?茁2、?茁3,我們建立以下方程組
l11?茁1+l12?茁2+l13?茁3=l1yl21?茁1+l22?茁2+l23?茁3=l2yl31?茁1+l32?茁2+l33?茁3=l3y(2)
首先求出各個因子的均值:
■■=■∑xi1,■2=■∑xi2,■3=■∑xi3,■=■∑yi
然后求出各乘積和∑xiuxiv,∑xiuyi,∑y■■之值,并由此進一步求出各luv,luy,lyy:
l11=∑x■■-n■■■,l22=∑x■■-n■■■,l33=∑x■■-n■■■
l21=l12=∑xi1xi2-n■■■■,
l31=l13=∑xi1xi3-n■■■■,
l32=l23=∑xi2xi3-n■■■■,
l1y=∑xi1yi-n■■■,l2y=∑xi2yi-n■■■,l3y=∑xi3yi-n■3■
lyy=∑y■■-n■■,
代入(2),然后解方程組得:?茁1、?茁2、?茁3。
再由?茁0=■-?茁1■1-?茁2■2-?茁3■3求得?茁0。
把回歸系數?茁0、?茁1、?茁2、?茁3代入(1)得出回歸方程。再合理套用回歸方程來分析某一客戶數據,就可以分析出該客戶購買能力的變化趨勢。按照慣例,客戶購買能力具體表現為增、減、無變化三種變化趨勢,據此便能夠得出反映客戶購買能力變化趨勢的屬性。圖2為通過回歸分析得到的一個客戶的購買能力變化趨勢。
上圖2反映了某一客戶25個月以內購買能力的變化趨勢。圖中,“客戶實際購買能力(即訂貨金額)”為藍色曲線,客戶的購買能力變化趨勢為紅色曲線。通過該圖表的分析得知,該客戶的購買能力變化趨勢屬性呈增加趨勢,基于此,我們構造了該客戶購買能力的變化趨勢屬性,再將屬性分析循環套用到所有客戶數據中,繪制出一個變化趨勢圖,由此得到一個反映每個客戶購買能力的變化趨勢(詳見圖3)。
圖3中,第二列就是構造出的客戶購買能力變化趨勢屬性。其中,0表示趨勢是不變的,1表示趨勢是增加的,2表示減少。
2.3 訓練集的選取 首先預測客戶類別,找出與預測模型相符的訓練數據,我們可以按照下列方法來選定合適的訓練集:①根據試驗數據選定相應類別的訓練集??梢詮目蛻魯祿靸冗x定一部分數據進行試驗,將產品資料發送給這些客戶,并將做出回應的客戶名單收集起來,基于推銷回應記錄建立一個模型,客觀反映出對所推銷產品感興趣的客戶類型,再以該模型數據為依據對所有客戶類型進行分析;②若無法通過試驗確定數據類別,則先通過數據聚類,并對數據進行人工篩選最終確定合適的訓練集。我們無法通過試驗來判定客戶忠誠度,唯一的辦法就是借助人力來分析判定,因此,先采用客戶忠誠度分析系統的聚類分析,再選定所聚簇中的數據組成訓練集。
所謂聚類分析,實際是前期設計組建的模型。訓練集為客戶數據中的5000條記錄,我們通過聚類分析得出以下結論:第一個簇中數據對象為3101個,這是數據集中包含最多的模式,說明客戶忠誠度未發生增減的變化;第二個簇的數據對象為50個,客戶購買能力呈增加的變化趨勢,而且大都在初期建檔,訂貨周期也短,因此客戶忠誠度較高;第三個簇的數據對象為1264個,該簇中的數據對象情況大致等同于第二個簇,客戶購買能力呈增加趨勢。與第二個簇相比,第三個簇的建檔時間和訂貨周期都不及第二個簇,客戶忠誠度增加的趨勢不明顯,但都屬于客戶忠誠度增加的范疇;第四個簇的數據對象為585個,客戶購買能力變化呈遞減的趨勢,而且相比于第二個簇和第三個簇,它的數據對象的訂貨周期較長,大部分在后期建檔,因此客戶忠誠度呈顯著下降的趨勢。
2.4 客戶忠誠度預測 預測客戶忠誠度的技術是基于客戶忠誠度分析系統中的預測分析功能,通過分類分析中CART分類器來預測客戶忠誠度。
先將記錄集作為一個根結點,按照雜度削減最大的設計要求把根節點分割成左節點和右節點兩個部分,再參照上文所述的方法步驟進行遞歸處理,當節點變成純潔點,或者當節點記錄數低于額定值,抑或將所有屬性分割完畢,才視為建樹完畢。
輸入:決策樹根節點
輸出:建立的決策樹
算法:
建立根節點的ID鏈表和屬性表,置所有屬性為可用的
將root節點壓入棧stack1中;
While (stack1不空)
while (stack1的棧頂節點不滿足結束條件)
對stack1的棧頂節點進行分裂,并建立該節點的左子樹并壓入stack1;
同時將分裂信息壓入stack2;
標記stack1的棧頂節點為葉結點,并將其從棧中彈出;
if (stack1和stack2不空)
將stack1和stack2的棧頂節點彈出;
利用從stack2中彈出的節點信息建立從stack1中彈出節點的右子樹,同時壓入stack1;
在噪音數據的干擾下,大部分由建樹階段生成的決策樹都存在過度擬合的現象,也就是說這個決策樹具有準確分類處理給定訓練集的相關記錄的能力,但是如果有新數據引入,就無法保證其數據處理的精準度,需要在建樹完成以后作進一步修剪:
輸入:決策樹,代價矩陣和樣本記錄
輸出:修剪后的決策樹T1
算法:
while (修剪還可以進行)
將root節點壓入棧中;
while (棧不空)
while (棧頂節點不為葉節點)
if (棧頂節點的代價與其左右子節點的代價相等)
調用freetreemem釋放其左右子樹所占的內存,并置為葉節點;
break;
else 將棧頂節點的左子樹壓入棧中
if (棧不空&&棧頂節點為葉節點) 將棧頂節點彈出;
if (棧不空) 將棧頂節點彈出并將其右子樹壓棧;
修剪時,應該將最小代價的節點(一般為多個)一次性剪去,將節點以數組t的形式存在于prune中??赡苡幸徊糠止濣c是另一部分節點的父節點,如果將父節點的子樹一并剪掉,那么子節點的子樹也會被剪掉。所以修剪前,我們應該仔細判定一個節點是不是另一個節點的父節點的函數IsAncestor,同時用flag數組來指明需要修剪掉的節點,flag[i]=1表明該節點為某節點的子節點,在剪枝時,只需剪掉flag[i]=0的節點。
運行結果如圖4。
在圖4中,“1”、“2”、“0”分別表示忠誠度增加、忠誠度減少和忠誠度不變三種變化趨勢,在“忠誠度變化趨勢”的數列中,“0”出現的次數較多,說明客戶忠誠度比較穩定;出現“1”的變化趨勢,說明客戶忠誠度有所增加,這是基于未來發展潛力來說的;出現“2”的變化趨勢說明客戶忠誠度呈下降的趨勢,其原因有兩點,一是客戶本身購買意向的轉變,二是行業競爭激烈,可能客戶選擇了更為優惠的政策。
3 總結與展望
文章從客戶忠誠度的概念入手,深入探究了客戶忠誠度變化趨勢及其重要意義,并對系統功能進行了詳細的說明;同時,取某一客戶忠誠度作為案例進行分析,對客戶忠誠度分析數據的選定及處理進行了具體說明,以此來準確預測客戶忠誠度的變化趨勢。筆者通過聚類分析的方式將所調查的客戶數據進行了歸類分析,再由各類數據中選定數據對象組成訓練集,以此來證明客戶忠誠度分析系統的實用性。
目前,客戶忠誠度分析系統的某些功能還有待完善:①采用回歸分析構造客戶購買能力變化趨勢時,只能夠使用線性回歸,而對于有些成非線性趨勢的屬性還不能處理,如對數回歸等;②客戶忠誠度分析數據的選取問題。針對不同的客戶數據,辨明客戶關系數據??蛻糁艺\度分析數據的選定及處理的方法流程對最終客戶忠誠度分析結果至關重要,目前這方面的技術研究尚待完善。
參考文獻:
[1]魏宗舒等,概率論與數理統計,高等教育出版社,1983.
數據挖掘課程范文5
關鍵詞:數據挖掘; 延期畢業
中圖分類號:TP311.13 文獻標識碼:A 文章編號:1006-3315(2012)04-135-001
一、數據挖掘技術
數據挖掘就是從海量的、不完全的、有噪聲的、模糊的、隨機的數據中,提取隱藏在其中人們事先不知道的但又有潛在有用的信息和知識的過程。數據挖掘技術要完成不僅是面向一般數據庫的簡單查詢工作,而且要對這些數據進行統計、分析、綜合和推理,得到有用的信息,以指導實際問題的求解.發現事件間的相互關聯。甚至利用已有的數據對未來的活動進行預測。數據挖掘是一門交叉學科,涉及數據庫、數理統計、人工智能、可視化、并行計算等方面的技術。數據挖掘技術從產生以來,已經被應用于多種領域,并得到了充分的驗證,顯示了其重要的經濟價值,同時在應用過程中得到不斷的完善和進步。
二、數據挖掘在電大學員數據中的應用
1.數據倉庫的建立
1.1數據倉庫主題的分析。建立數據倉庫和進行數據預處理是進行數據挖掘的數據準備.它的任務是為數據挖掘提供合適的數據。經過分析,我們可以發現要學員延期畢業有以下幾個方面原因:專業的因素;課程的因素;考試的因素。數據倉庫所要實現的系統功能包括:數據倉庫可以幫助制定招生策略:還可以對學員平時的學習提供一些有效的建議,提高畢業率。
1.2數據倉庫模型設計。對“學員延期畢業”主題進行模式劃分。采用星型架構設計出下面的事實表和各維表:
1.2.1事實表設計:事實表名稱、學員成績事實表
索引字段:學號、課程代碼、班代碼、專業代碼、學年學期號
度量值:成績、學分
1.2.2維度表設計:
1.2.2.1學員維度表名稱:學員信息
學員維度表結構:學號、姓名、班代碼、單位代碼、性別、年級、身份證號、籍貫、學籍狀態、專業代碼、職業
1.2.2.2班級維度表名稱:班級信息
班級維度表結構:班代碼、班級名稱、專業代碼、畢業學分、補專學分、年限、必修學分、限選學分、選修學分
1.2.2.3專業維度表名稱:專業信息
專業維度表結構:專業代碼、專業名稱、本???/p>
1.2.2.4課程維度表名稱:課程信息
課程維度表結構:課程代碼、課程名稱、學分、學時、開設學期、性質
1.2.2.5時間維度設計:時問維度表名稱、學年學期時間維度表結構:學年學期號、學年、學期
1.2.2.6考試考勤維度設計:考試考勤維度表名稱、考勤信息
考勤維度表結構:學號、課程代碼、考勤時間、考勤結果
2.系統的實現
首先,將源數據(學員、班級、專業、課程等相關數據)經過抽取、轉換、加載存儲到SQL Server數據庫中,SQL Server的DTS工具可以完成大部分數據的轉換和清理工作,這樣不同源數據就可以統一有序地存儲在服務器端的SQL Server數據庫中,為數據挖掘做好數據準備。其次,利用某種高級語言實現數據挖掘算法,編制相應的外掛數據挖掘模塊。最后與服務器上的數據庫進行數據交互。在這種利用外掛模塊實現數據挖掘的方案中,不同的數據庫的訪問技術有所不同,微軟公司主要的數據訪問方法是ADO,它是一個簡單的對象模型,在應用程序中使用該模型可以方便地與SQL Server數據庫進行數據交互。
3.數據挖掘試驗結果分析
本文隨機選取了20名學員的數據作為樣本數據,對數據進行離散化等一系列處理以后得到最終決策樹。
從決策樹中,可以方便地得出以下規則以供決策參考:
3.1若課程不及格比例
3.2若考勤為差則會延期畢業;
3.3若課程不及格比例>50%且考勤為一般且年齡在20~30的公司職員則不會延期畢業。
3.4若課程不及格比例≥50%且考勤為一般且年齡在30~40的干部,則會延期。
從上述規則中,可以很直接地看到在延期畢業這個問題上考試考勤是一個非常值得關注的原因,一般考試不能正常來的學員都會延期畢業;平時考勤好且課程不及格比例小于50%的,一般都會如期畢業;而課程不及格超過50%的學員,雖然考勤為良,但是由于年齡和工作的關系,也會延期。
三、結束語
把數據倉庫和數據挖掘技術應用于電大開放教育,通過需求分析確立主題,利用電大開放教育數據庫中已有的數據進行整合建立電大開放教育數據倉庫,并利用粗糙集挖掘出一定的規則,生成對開放教育有效的決策規則,并對規則進行分析,最后利用一組隨機數據驗證了決策規則的有效性。
參考文獻:
數據挖掘課程范文6
關鍵詞:數據挖掘;關聯規則;教務管理
中圖分類號:TP311文獻標識碼:A文章編號:1009-3044(2009)33-9452-02
隨著信息技術、計算機技術和數據庫技術的飛速發展以及高等教育的大眾化,很多高等院校的教學和管理工作中都產生和積累了大量的數據。但是由于缺乏信息意識和技術,對于數據的處理還只是簡單的備份、查詢與統計,并沒有對于大量的數據進行深入的分析,加以捕捉有利于教學工作的信息,從而導致隱藏在這些數據中的信息未能得到有效的利用。因此如何快速而準確地從浩瀚的數據倉庫中提取出所需要的信息,就需要一種新的數據分析技術加以處理,而數據挖掘技術正是解決這個問題的可行而有效的方法。利用數據挖掘技術,針對已有的海量的教務信息進行有效的知識發現,是提高學校競爭力,幫助管理者進行決策的一種有效的方法。
1 數據挖掘技術概述
1.1 數據挖掘的概念
數據挖掘(Data Mining,簡稱DM)就是從大量的、不完全的、有噪聲的、模糊的、隨即的數據中,提取隱含在其中的、人們事先不知道的、但又有潛在的有用信息和知識的過程,是數據庫中知識發現(Knowledge Discovery in Databases,簡稱KDD)的核心。數據挖掘是一個基于多學科的交叉研究領域,它融合了數據庫技術、人工智能、機器學習、統計學、知識工程、面向對象方法等最新技術的研究成果。通過該技術,使信息系統的功能得到了最大程度的利用。
1.2 數據挖掘的對象
根據信息存儲格式,數據挖掘的對象有關系數據庫、面向對象數據庫、數據倉庫、文本數據源、多媒體數據庫、空間數據庫、時態數據庫、異質數據庫以及Internet等。
1.3 數據挖掘的常用方法
數據挖掘常用方法主要包括關聯分析、分類、預測、時序模式和偏差分析等
1) 關聯分析:關聯規則挖掘是由Rakesh Apwal等人首先提出的。兩個或兩個以上變量的取值之間存在某種規律性,就稱為關聯。數據關聯是數據庫中一類重要的、可被發現的知識。關聯分為簡單關聯、時序關聯和因果關聯。
2) 聚類分析: 聚類是把數據按照相似性歸納成若干類別,同一類中的數據彼此相似,不同類中的數據相異。
3) 分類:分類就是找出一個類別的概念描述,它代表了這類數據的整體信息,即該類的內涵描述,并用這種描述來構造模型,一般用規則或決策樹模式表示。
4) 預測:預測是利用歷史數據找出變化規律,建立模型,并由此模型對未來數據的種類及特征進行預測。
5) 時序模式:時序模式是指通過時間序列搜索出重復發生概率較高的模式。它是用己知的數據預測未來的值,但這些數據的區別是變量所處時間的不同。
6) 偏差分析:在偏差中包括很多有用的知識,偏差分析的基本方法就是尋找觀察結果與參照之間的差別,從而得到數據庫中數據存在的異常情況。
2.4 數據挖掘的過程
1) 確定挖掘對象:定義出問題,確定數據挖掘的目的。2) 數據準備:①選擇數據:在大型數據庫和數據倉庫中提取數據挖掘的目標數據集;②數據預處理:進行數據再加工,包括檢查數據的完整性及數據的一致性、去噪聲,填補丟失的域,刪除無效數據等。3) 數據挖掘:根據數據功能的類型和數據的特點選擇相應的算法,在預處理過的數據集上進行數據挖掘。4) 結果分析:對數據挖掘的結果進行解釋和評價,轉換成為能夠最終被用戶理解的知識。5) 知識的運用:將分析所得到的知識應用于業務信息系統的組織結構中去。
3 數據挖掘在高校教務管理中的應用
3.1 課堂教學評價
評價教師的教學質量,往往會從多方面的因素考慮,其中最主要的是從學生的角度出發對教師的課堂教學質量給予評價。課堂教學評價是學校教學管理重要的組成部分,是評價教學工作成績的主要手段。對教學起著激勵、改進、鑒定和研究作用。課堂教學的主要要素是教師、學生和教學信息,教師和學生通過教學信息發生相互作用?,F在絕大部分學校每學期都要搞課堂教學評價調查,積累了大量的教學信息數據。而目前對教學的評價主要基于數值計算,將學生的評價簡單的歸納總結后,將結果通報給任課教師,并不做深入的思考。利用數據挖掘技術,從教學評價數據中進行數據挖掘,將關聯規則應用與課堂教學評價系統中,探討教學效果的好壞與教師的教齡、職稱、學歷、教學對象、教師整體素質以及教學方法之間的聯系。合理配備每個班級的上課教師,使學生能夠較好的保持良好的學習態度,從而為教學部門提供了決策支持信息,促使更好地開展教學工作,提高教學質量。
3.2 合理選課
為適應社會發展我國高校的教育體制都進行了改革,高校教育體制的改革使學分制在各高校相繼出現,在學分制下學生不僅可以自主制定自己的學習計劃,還可以根據自己的實際情況隨時來調整學習計劃,同時還可以通過選課來完善自己的知識。因此選課便成為高校運行體制的核心之一。選課對于高年級的學生來說可能具有一定的針對性,但對于低年級的學生來說他們剛剛跨入大學的校門,對于一些專業不是很了解,如果在剛開始就讓他們制定自己的學習計劃,并選擇適合自己的專業課程,勢必會造成一定的盲目性,因此教務部門應該在選課之前制定出有效的指導學生選課的方針對學生進行選課指導,使學生選課的盲目性降到最低限度,而數據挖掘中的關聯規則就是尋找指導方針的有效方法。通過使用數據挖掘技術從學年制教學體制下積累的大量數據中發現潛在的知識與規律,可以有效的指導學生選課減少學生在選課中的盲目性。
3.3 課程設置
課程設置,通常是指各年級各類學校或其他機構關于課程安排的方案,包括要開設那些課程,在哪一學期可設以及開設相關課程的先后次序等。在學校學生課程安排是循序漸進的,而且課程之間有一定的關聯與前后順序關系,在學習某一門課程之前必須先修一些課程作為它的基礎,如果先開設的課程沒有學好,勢必會影響后續課程的學習。隨著教學規模的不斷擴大,教務管理人員及任課教師很難再像以前那樣直接根據學生的成績數據分布找出諸如前期課程與后繼課程的關系,并據此進行教學進程的決策。在這種情況下,我們利用數據挖掘技術,挖掘教務管理系統中積累的有用信息,可以使學校的相關院系調節相關課程的設置,調整熱門課程和冷門課程的人數,通過選課率及相關信息鼓勵和引導學生選擇互補的課程,這樣可以提高學生的整體素質,也有利于教學資源的合理分配,為決策提供必要和準確的理論支持。
3.4 教師教學方法評價
在教學過程中,教師可以采用多種方法來完成自己的教學任務,例如講授法、討論法、計算機輔助教學法、參觀法、調查法、實習法等。在通常的情況下,一般可以采用一種或幾種方法進行。因此可以用數據挖掘的方法來挖掘數據庫中的數據,判定下一步應采用什么樣的教學方法,以滿足教學的需要,更有利于學生對知識的吸收。從每個學生對教學方法的評價以及不同的教學方法得出的教學成績來進行分析,運用回歸線性分析、關聯規則的方法判定此種教學方法適合哪一類學生或哪幾門課程,使得分層次教學能夠得到更進一步的實施。
3.5 試卷分析評價
考試是檢驗教與學效果的一種手段,而學生成績的高低與許多因素有關,其中試卷質量與學生成績有著最為密切的關系。例如試卷的難易度p知識覆蓋面p試卷考查形式的合理分配等。將關聯規則應用于試卷分析數據庫中,根據得分情況分析出每道題的難易度p區分度p相關度等指標,教師根據所得的幾種指標就能夠對試卷的質量做出比較準確的評價,進而可以用來檢查自己的教學情況及學生的掌握情況為今后的教學提供指導。
4 結束語
數據挖掘是深層次的數據信息分析,可以幫助決策者尋找規律,發現被忽略的要素,預測趨勢,進行決策。數據挖掘技術被廣泛的應用于市場營銷、醫藥業、電信業、金融業、互聯網等方面。將數據挖掘技術引入到教育領域中,挖掘出高校教務管理系統海量數據中潛在的信息可以提高教育管理的科學性,同時增強了教育數字化建設的實效性。
參考文獻:
[1] 劉曉霞.數據挖掘技術在高校教學中的應用[J].現代計算機,2008(6):115-116.
[2] 賈璐潔,張靖.數據挖掘技術在高校教務管理中的應用[J].中國科技信息,2007(12):225-226.
[3] 孟躍紅.數據倉庫技術在高校教育管理中的應用[J].徐州師范大學學報,2003(6):78-80.