數據挖掘技術下高校圖書館管理論文

前言:尋找寫作靈感?中文期刊網用心挑選的數據挖掘技術下高校圖書館管理論文,希望能為您的閱讀和創作帶來靈感,歡迎大家閱讀并分享。

數據挖掘技術下高校圖書館管理論文

一、Web數據挖掘技術簡介

要了解Web數據挖掘技術,首先就必須要了解數據挖掘技術。數據挖掘是指從大量不完全的、有噪聲的、模糊的、隨機的數據中,提取隱含在其中的、有用的信息和知識的過程。它的表現形式為概念(Concepts)、規則(Rules)、模式(Patterns)等形式。數據挖掘技術是人們長期對數據庫技術進行研究和開發的結果。起初各種商業數據是存儲在計算機的數據庫中的,然后發展到可對數據庫進行查詢和訪問,進而發展到對數據庫的即時遍歷。數據挖掘技術是人們長期對數據庫技術進行研究和開發的結果。起初各種商業數據是存儲在計算機的數據庫中的,然后發展到可對數據庫進行查詢和訪問,進而發展到對數據庫的即時遍歷。Web數據挖掘是一種綜合的技術,它主要是使用數據挖掘技術在互聯網挖掘各種有用的、有趣的、隱藏起來的信息或者是有用的模式。與傳統的數據挖掘相比,Web數據挖掘所挖掘的信息更加的海量,這些信息具有異構和分布廣的特點。對于服務器上的日志與用戶信息的挖掘仍然屬于傳統的數據挖掘。Web數據挖掘由于Web的邏輯結構其所挖掘到的模式有可能是關于Web內容的,也有可能是關于Web結構的。同時有些數據挖掘技術也不能直接運用到Web數據挖掘中。Web數據挖掘的研究范圍十分廣泛,它的研究主要包括了數據庫技術、信息獲取技術、統計學、神經網絡等。Web數據挖掘根據所處理的對象可以分為三類:Web文檔的內容挖掘、Web文檔的結構挖掘、Web使用的挖掘。Web文檔的內容挖掘指的是從Web文檔及對其的描述內容中獲取到有用的信息,即是對Web上大量的各種文檔集合的內容進行處理,例如摘要、分類、聚類、關聯分析等。同時內容挖掘還可以對各種多媒體信息進行挖掘。Web上的內容摘要是用簡潔的語言和方式對文檔的內容進行描述和解釋,讓用戶在不用瀏覽全文的情況下就可以對全文的內容和文章寫作的目的有一個總體的了解。文章寫作的目的有一個總體的了解。而Web內容挖掘的這種方式非常有用,例如應用到檢索結果的顯示中。Web分類則指的是根據已經確定好的類別,為每一個獲得的Web文檔確定一個大類。聚類則是指的在沒有確定類別之前,將相似度高的文檔歸為一類。關聯分析指的是從文檔集合中找出不同語詞之間的具有的關系。Web文檔的結構挖掘指的是從互聯網的整體結構和網頁之間的相互鏈接以及網頁本身的結構中獲取有用的信息和知識。目前為止針對結構的挖掘主要還是鏈式結構模式。對于Web結構的挖掘主要源于對引文的分析,引文分析的主要內容就是通過對網頁的鏈接數和被連接數以及對象的分析來建立一個鏈接結構模式,這種模式可以用來對網頁進行歸類,同時還可以獲取網頁之間的相似度和關聯度等信息。Web使用的挖掘一般情況下指的是對Web日志的挖掘。其挖掘的對象是用戶與互聯網交互過程中所抽取出來的各種信息,例如訪問記錄、用戶名、用戶注冊信息以及用戶所進行的操作等。在這一方面的研究已經比較成熟,同時也有很多較為成熟的產品例如NETPERCERPION公司的Netpercerptions,Accrue公司的AccrueInsight和AccrueHitList等都是技術較為成熟的產品。

二、Web數據挖掘技術的工作流程

Web數據挖掘技術的主要工作流程可以分為以下幾個步驟:第一步,確立目標樣本,這一步是用戶選取目標文本,以此來作為提取用戶的特征信息;第二步,提取特征信息,這一步就是根據第一步得到的目標樣本的詞頻分布,從現有的統計詞典中獲取所要挖掘的目標的特征向量,并計算出其相應的權值;第三步,從網絡上獲取信息,這一步是利用通過搜索引擎站點選擇采集站點,然后通過Robot程序采集靜態的Web頁面,最后再獲取這些被訪問站點的網絡數據庫中的動態信息,然后生成WWW資源庫索引;第四步,進行信息特征匹配,通過提取源信息的特征向量,去和目標樣本的特征向量進行匹配,最后將符合閾值條件的信息返回個用戶。

三、Web數據挖掘技術在高校數字圖書館中的應用

高校數字圖書館為師生主要提供以下功能:查找圖書、期刊論文、會議文獻等數字資源;圖書借閱、歸還等服務;圖書信息、管理制度;導航到圖書光盤、視頻資源等數據庫系統。師生時常登錄到網站中查找其需要的信息,根據師生所學專業、研究方向不同,關注目標也不同。通常這類師生會到常用的圖書館網站上,查找自己所需要的特定領域的資源;瀏覽一下有哪些內容發生變化,是否有新知識增加,而且所有改變常常是用戶所關注的內容;另外,當目標網頁所在的位置有所改變或這個網站的組織結構、層次關系有所變動時,所有這些問題只要稍加改動,容易使用戶難以找到所需內容。本課題采用Web挖掘技術與搜索技術相結合。首先允許用戶對感興趣的內容進行定制,構造數據挖掘的先驗知識,然后通過構造瀏覽器插件,捕獲用戶在瀏覽器上的行為數據,采用Web數據挖掘的方法,深入分析用戶的瀏覽行為數據,獲得用戶的信息資料集,最終為用戶提供不同的個性化服務頁面,并提供用戶對站內信息進行搜索功能,同時可以滿足師生對于圖書館資源進行查找訪問的需求,實現高校圖書館網站資源真正意義上的個性化服務。

1、為開發網絡信息資源提供了工具

數字圖書館需要的是一種可以有效的將信息進行組織管理,同時還能夠對信息進行深層的加工管理,提供多層次的、智能化的信息服務和全方位的知識服務,提供經過加工、分析綜合等處理的高附加值的信息產品和知識產品的工具。目前許多高校數字圖書館的查詢手段還只局限于一些基本的數據操作,對數據只能進行初步的加工,不具有從這些數據中歸納出所隱含的有用信息的功能,也使得這些信息不為人知,從而得不到更好的使用,這些都是對網絡信息資源的一種浪費。而通過Web數據挖掘技術科研有效的解決這一問題。這種技術可以用于挖掘文檔的隱含的有用的內容,或者可以在其他工具搜索的基礎上進一步進行處理,得到更為有用和精確的信息。通過Web數據挖掘技術科研對數字圖書關注中的信息進行更加有效地整合。

2、為以用戶為中心的服務提供幫助

通過瀏覽器訪問數字圖書館后,可被記載下來的數據有兩類,一類是用戶信息,另一類是用戶訪問記錄。其中用戶信息包括了用戶名,用戶訪問IP地址,用戶的職業、年齡、愛好等。用戶名師用戶登錄圖書館時輸入,用戶訪問IP地址通過程序獲得,其他的信息都是用戶在注冊時所填寫的,訪問記錄則是在用戶登錄時所記錄的,也是由程序獲得。對這些用戶信息進行分析可以更加有效的了解用戶的需求通過分析服務器中用戶請求失敗的數據,結合聚集算法,可以發現信息資源的缺漏,從而指導對信息資源采集的改進,讓高校數字圖書館的信息資源體系建設的更加合理。對數字圖書館系統的在線調查、留言簿、薦書條等的數據進行收集整理,并使之轉化為標準的結構化數據庫,然后在通過數據挖掘,皆可以發現用戶所感興趣的模式,同時還可以預先發現用戶群體興趣的變遷,調整館藏方向,提前做好信息資源的采集計劃。通過Web數據挖掘,可以對用戶的信息需求和行為規律進行總結,從而為優化網絡站點的結構提供參考,還可以適當各種資源的配置更加的合理,讓用戶可以用更少的時間找到自己所需要的資源。例如可以通過路徑分析模式采掘捕捉確定用戶頻繁瀏覽訪問的路徑,調整站點結構,并在適當處加上廣告或薦書條。

3、Web數據挖掘技術在圖書館采訪工作中的應用

在圖書館的工作中有一步十分的重要,這就是采訪工作,采訪工作的做的好壞程度會直接的對圖書館的服務質量產生影響。通常情況圖書館的工作人員會根據圖書館的性質、服務對象及其任務來決定采訪的內容。但是這種采訪局限性很大,很多時候會受采訪人員的主觀意識的影響,同時這種方式也會顯得死板不靈活。很多時候會出現應該購進的文獻沒有買,不應該買的文獻卻買了很多等與讀者的需求不符的現象。這些現象的產生都是因為缺乏對讀者需求的了解和分析。要解決這些問題就必須對讀者的需求進行全面的了解和分析,而Web數據挖掘則為解決該問題提供了一種較好的方法。通過對各種日志文件和采訪時獲得的數據進行分析,可以很清楚的得到讀者需要的是什么樣的書籍、不需要的又是什么樣的書籍,從而為采購提供各種科學合理的分析報告和預測報告。根據對分析還能幫組圖書館管理人員確定各種所需書籍的比例,從而確定哪些文獻應該及時的進行補充,哪些文獻應該進行剔除,對館藏機構進行優化,真正的為高校里的師生提供所需要的文獻和資料。

4、使用Web數據挖掘技術提供個性化服務

傳統的信息檢索工具在友好型、可理解性、交互性方面都存在著很大的缺陷。通常情況下都只是將各種查詢結果毫無邏輯的簡單的進行羅列,用戶很難從其中獲取自己需要的信息,通過數據挖掘,可以對圖書館網站上的在線調查、留言簿、讀者調查表等數據進行收集整理,對不需要的冗余信息進行剔除。通過分析可以獲知用戶所喜好的瀏覽模式是哪種,他們常訪問的網站的路徑是什么,他們對圖書館中的那些資源比較有興趣。然后再根據用戶的普遍需求與每個人的個性需求,建立起相應的規則,從而幫助網站設計人員對網站進行設計和優化,使得這些信息檢索變得更加的個性化、智能化,并根據每個用戶的偏好等特征將檢索到的信息排列處理,使得讀者可以用最快的速度獲得想要檢索的文獻信息。通過Web數據挖掘技術可以對用戶的特征信息進行總結,將那些從沒有發出過信息的潛在用戶進行歸類,同時還可以免費的為他們提供各種他們所感興趣的信息和資料,把這些潛在的用戶轉變為正式的用戶使用Web數據挖掘可以對用戶的檢索日志進行分析,從而得知用戶所感興趣的內容、他們的研究方向,并根據這些內容為用戶指定個性化服務的內容,為用戶提供各種他們所感興趣的各種信息。

5、應用Web數據挖掘技術可以為學校決策者提供更好的決策支持

Web技術的發展和普及,使得Web上擁有豐富的信息資源。在這種信息“大爆炸”的時代里,高校圖書館可以通過Web數據挖掘技術,對與學校建設和發展的有著重大影響的各種嬉戲那些進行分析處理,從而使得更加方便的對這些信息進行有效的辨識、評價、管理。為學校的決策者及時的提供各種對學校的發展和成長有用的重要信息。這些信息可以是院校內的各種專業的設置情況,每個專業的課程設置情況,可以是其他知名院校相關專業的設置和專業課程設置的情況,也可以是研究課題的調查與申報,學校圖書館的建設,還可以是社會上對人才的需求信息以及其他與學校發展息息相關的信息。從而讓學校的決策者可以在越來越激烈的競爭下,抓住轉瞬即逝的機會,讓學校能夠健康、穩步的成長和發展。

亚洲精品一二三区-久久