云計算在圖書館數據管理中應用

前言:尋找寫作靈感?中文期刊網用心挑選的云計算在圖書館數據管理中應用,希望能為您的閱讀和創作帶來靈感,歡迎大家閱讀并分享。

[摘要]隨著時代的發展,傳統圖書館的數據存儲與處理模式無法滿足人們日益增長的快捷化需求,將云計算技術引入圖書館的數據管理技術中,會大幅提高圖書館的運行效率,這也是將來圖書館數據管理技術的發展方向,文章在如何將云計算技術引入圖書館數據管理途徑方面進行了初步研究。

[關鍵詞]云計算;圖書館;數據存儲;技術

0引言

隨著網絡信息服務的發展和數字信息資源的增長,人們在追求信息存儲容量擴增的同時,也越來越關注信息存儲的有效性、安全性和便捷性等問題。圖書館作為信息資源的匯集中心,每天要存貯處理大量的數據,若將云計算技術引入圖書館的數據管理技術中,與互聯網技術相結合,可有效實現數據的存儲、使用、共享,滿足用戶日益增長的服務需求。

1云計算技術概述

云計算(CloudComputing)是分布式計算的一種,是指通過網絡“云”將巨大的數據計算處理程序分解成無數個小程序,然后,通過多部服務器組成的系統進行處理和分析這些小程序,得到結果并返回給用戶。云計算早期,簡單地說,就是簡單的分布式計算,解決任務分發,并進行計算結果的合并。因而,云計算又稱為網格計算。通過這項技術,可以在很短的時間(幾秒鐘)內完成對數以萬計的數據的處理,從而達到強大的網絡服務。現階段所說的云服務已經不單單是一種分布式計算,而是分布式計算、效用計算、負載均衡、并行計算、網絡存儲、熱備份冗雜和虛擬化等計算機技術混合演進并躍升的結果。與傳統網絡應用模式相比,云計算技術具有可虛擬化、可動態擴展、按需部署、靈活性高、可靠性高、性價比高等優勢與特點。

2傳統圖書館數據存儲中的問題

傳統圖書館數據存儲常存在以下四個方面問題:(1)空間要求高。傳統圖書館是存儲實體圖書,占地面積大,如果要保證圖書數量就要保證圖書館有十分龐大的空間。同時,圖書館藏書量由于受到資金和建筑物空間格局限制,不得不減緩新書上架,或是加快老圖書下架,這兩種情況都會給使用者造成不便。(2)維護成本高。圖書館里的圖書種類數量龐大,不管是新增書籍、下架書籍還是在架書籍,它們的日常維護都是十分煩瑣的事情,而這正是圖書館日常進行的事務,因此會消耗大量的人力、物力、財力。(3)搜索查閱困難。雖然在圖書館內不同的書籍都有不同的分區,但是每個讀者能按照分區,快速瀏覽查閱到想要的圖書并不是件容易的事情。這需要對圖書分區比較熟悉,而且找到了相似書籍后,從中選擇也很麻煩,需要一本本翻閱書中內容。(4)圖書保護不易。傳統圖書館存儲和借閱的都是實體書籍,在保管、借閱過程中難免會造成圖書的破損、毀壞、丟失等問題,給圖書館帶來損失,存儲的安全性不高。

3云計算引入圖書館信息管理的優勢

(1)成本低。傳統的圖書館需要對實體圖書進行存儲、排放、維護,而使用云計算技術,一切過程都可電子化。首先,圖書資源都電子化,節省了空間;其次,查閱都網絡、可視化,只要網絡技術達到,就可快速地檢索、閱讀、下載,都是電子資源,不需要紙質形式,大大節約了人力、物力成本。(2)容量大。在當前互聯網環境下,應用云計算技術,圖書館的信息容量可以進一步擴展,不僅包含現有的專業技術領域的圖書資源,也可快速鏈接到相關應用領域,如社會文化、教育培訓、傳媒、咨詢、電子政務等,它具備一種信息中轉站的職能。這正是云計算海量存儲技術所起的作用。(3)容錯能力強。在存儲過程中,圖書館海量的存儲數據難免有數據丟失、轉移失敗、響應異常等故障發生,只要在云存儲軟件層中,增強計算數據的存儲容錯能力,就能使系統繼續執行海量的存儲指令,保障系統發揮最大效能。(4)存儲性能穩定。云計算的圖書數據是以數據化的形式存儲在網絡平臺或其他服務器中。云存儲指的不是一個特定的存儲設備,它是多個存儲設備與服務器的集合。正是由于云計算的不依賴于任何一個物質實體,不會因為一個存儲設備出故障而停止運行的獨特的存儲方式,所以,它的穩定性相對來講更為良好。

4云計算應用于圖書館數據管理的技術途徑

基于云計算獨特優良的數據存儲技術,將云計算引入圖書館的數據存儲管理,可大大提高圖書館的運行效能,可從以下幾個技術途徑實施。

4.1分布式和冗余存儲技術。分布式存儲是云計算中針對大量數據采用的主流存儲技術,它根據數據類型,通常分為塊存儲、對象存儲和文件存儲,例如HDFS/GPFS/GFS技術屬于文件存儲,Swift技術屬于對象存儲,Ceph支持以上三種存儲方式,稱為統一存儲。這些存儲技術,能夠對數據采用大規模集群算法,實現數據的快速、準確存放,同時能夠在硬件故障或擴展硬件設備時,做到盡可能小的數據遷移。例如Ceph技術,采用crush算法,將每個object得到的pgid進行篩選找出符合要求的OSD,將數據分布的查詢變成計算操作,使系統能夠平均分布數據和負載,解決了中心服務器性能上的技術瓶頸。再如Swift技術采用完全對稱、面向資源系統的架構設計,所有組件都可擴展,避免因單點失效而影響整個系統的可用性。冗余存儲技術是使用一組或多組附加驅動器存儲數據的副本,比如鏡像就是一種數據冗余技術。分布式存儲系統中的冗余機制可以調高數據的可用性和系統的可靠性。數據的可用性是指把同一數據存儲在多個不同節點上,即使個別節點數據丟失,剩余其他節點數據也可實現數據重構。系統的可靠性是通過數據的冗余和存儲節點的協作來保證。因此,分布式存儲可提高圖書館海量存儲數據的有序,冗余式存儲可提高存儲的可靠性。通過云計算,將圖書館所有數字資源存儲在“云”中,并由“云”來管理和調度,能夠快速有效地獲取資源。

4.2動態資源調度共享技術。雖然云計算是在傳統分布式計算、并行式計算等基礎上發展起來的,但它比傳統計算更復雜、更綜合,呈現動態、智能化特征。由于云計算中業務眾多,任務類型眾多,如果將所有用戶應用程序的調度都置于相同框架下,所產生的調度結果對于用戶來說通常并不是最優的。因此,需要從任務類型角度出發,選擇不同的調度策略。在調度過程中,由于任務的執行,會改變資源的消耗類型,因而任務類型也會隨之發生變化。比如用戶向圖書館系統請求圖書資源,系統會調度請求讀取磁盤分區的圖書資源,當圖書資源引用的有網絡資源,則會產生網絡資源調度請求。如果靜態進行資源分配和調度,往往會造成資源的不足或浪費;如果進行人工動態資源調整,又會有著明顯的滯后性。因此圖書館系統需要不斷地實時監控任務執行狀態,通過任務資源的消耗類型,動態地調整任務類型,合理配置虛擬機,均衡使用各種資源(CPU、內存、磁盤、I/O、網絡),避免出現單一資源瓶頸,提升虛擬機密度,消除熱點,提高業務處理能力,實現硬件資源最大化共享,最大化提升調度效率。云計算環境下,圖書館的各種資源借由一朵“云”結合起來,通過虛擬機內部的計算,實現調度內容的融合、信息共享,通過模糊匹配、分析計算,根據用戶指令輸出所需內容。它是云計算的核心技術,是動態的、智能化的。

4.3多用戶資源訪問技術。多用戶簡單來說是指一個單獨的資源可以為多個用戶服務。多用戶技術是指,在共用的數據中心內,以一個單一的系統架構為多個客戶端提供服務,甚至是定制化的服務,同時仍然保障用戶數據的隔離。圖書館資源往往需要滿足多用戶訪問,因此采用多用戶技術,對系統的數據和配置進行合理虛擬分區,使系統的每個用戶或者組織都能夠使用一個共同的系統資源,實現多用戶在同時訪問相同圖書資源時,保證圖書系統共性的部分被共享,個性的部分被單獨隔離,確保多用戶在同時訪問、閱讀或者同時下載時,系統的安全性與穩定性。通過在多個用戶之間的資源復用,運營管理維護資源,有效節省云計算圖書館開發應用的成本。而且,在用戶之間共享應用程序資源,可以實現當應用程序升級時,所有用戶同時升級。同時,因為多個用戶共享一份系統的核心代碼,當系統升級時,只需升級相同的核心代碼,簡捷省力。為了滿足多用戶對數據的操作,云計算的數據存儲必須具備高吞吐率和高傳輸率;同時云計算要求硬件資源與軟件資源能夠很好地被共享,需具備良好的伸縮性,因此多用戶技術在云計算圖書館的數據存儲系統開發中必不可少。

5結語

云計算技術是構建現代數字圖書館資源的重要技術支撐,也是網絡信息時代社會發展的新思路。在圖書館管理的各項環節中,應用云計算存儲技術可以有效提高管理能效,解決圖書館大部分功能難題。將大量圖書資源在云存儲環境中充分利用,會讓新型數字圖書館體系更符合現代人們對于文化知識、社會資訊、網絡信息等社會公共服務項目的需求,改變人們的生活方式。

作者:譚畔 袁慧 單位:武昌工學院

亚洲精品一二三区-久久