前言:尋找寫作靈感?中文期刊網用心挑選的檔案信息資源開發模式分析,希望能為您的閱讀和創作帶來靈感,歡迎大家閱讀并分享。
摘要:當前檔案工作中分布著模擬態、數字態、數據態三種形態的檔案信息資源,憑證價值、情報價值、文化價值對應著檔案信息資源開發與利用的三個層次。大數據環境下,要實現對檔案信息資源的有效開發不能只局限于滿足長久保存、實現檢索和利用的需求,必須要向數據化方向發展。政府部門、檔案館(公共部門)和市場主導的檔案信息資源開發模式各有優劣,平臺+數據挖掘模式、技術框架+用戶畫像兩種技術開發模式也各有側重。經分析,政府部門對檔案信息資源開發進行規劃、監督和規范,檔案館(公共部門)提供技術服務,協同市場開展檔案信息資源開發工作是比較優質、高效的檔案信息資源開發模式。
關鍵詞:大數據;檔案信息資源;開發模式
0引言
隨著現代信息技術的發展,檔案業務環境經歷了重大變革。檔案信息經歷了從模擬態到數字態的變化,目前正在向數據態的方向發展,在實際的檔案工作中,模擬態、數字態、數據態三種形態的檔案信息并存互補。大數據時代,不同型態的海量檔案信息未得到充分的挖掘、分析和利用,傳統的信息資源開發模式已經不適用于數據驅動與模型驅動并嚴重依賴業務規則和場景的數據態檔案信息,必須探索適應大數據環境的檔案信息資源開發的新模式。
1檔案信息的三種形態
檔案是人們在各項社會活動中形成的原始記錄,只要能反映社會活動真實面貌的存在都能作為檔案保存。檔案類型多樣且涉及不同的行業,傳統意義上將檔案按內容分為文書檔案、科技檔案、會計檔案等,或按載體分為紙質檔案、光盤檔案等。中國人民大學錢毅教授根據檔案管理對象的形成環境和與之匹配的技術體系將檔案分為三種形態:模擬態檔案:主要指以紙質為主的檔案資料,還包括其他各種載體和內容不可分離的縮微膠片檔案、簡牘檔案及實物檔案等。傳統的檔案管理方式就是對模擬態檔案的管理,其重點是通過分析檔案內容對檔案載體進行收集、整理、鑒定、保管。數字態檔案:指檔案信息由人們可以肉眼觀察和識別的模擬態轉變為計算機可以直接讀取的二進制的比特流,主要包括圖像文件、音頻音像文件、word文檔、CAD圖等類型的電子文件檔案資料,其特點是信息內容可以自由流動、與固定載體不再緊密聯系,依賴電子系統。對數字態檔案的管理更側重分析其內容、背景、結構信息,努力維護其內容的真實性、完整性、可靠性和可用性。數據態檔案:其實是數字態檔案的延伸,在數字態的基礎上,使其數據化,形成可重組、可分析、可關聯的概念集合,其形成依賴基于規則的業務系統或模型,如金融系統數據、政府系統數據等,本質是通過制定一系列參數和規則形成的數據組合。數據態檔案管理的重點是對數據、業務流程或模型的描述與關聯管理。
2檔案信息資源開發視角的檔案價值觀
檔案信息資源開發主體面對日益增長的檔案信息資源需求,通過各種技術手段對檔案資源進行開發并傳遞出去,主要目的在于充分發揮檔案的價值,促進用戶對檔案資源的有效利用。一般而言,檔案信息資源開發的不同程度對應著三個層次的檔案價值[2]。
2.1憑證價值,提供檔案副本
檔案資源開發利用最基本的層次。由于檔案的本質屬性是“原始記錄性”,所以檔案在社會活動中具有較高的法律效力,擁有無可比擬的憑證作用,是檔案應用最廣泛的價值之一。通過復制制作檔案副本,可以代替檔案原件解決一些工作以及生活中的問題。此種檔案資源開發利用方式多見于模擬態檔案,需要在檔案實體上蓋檔案部門印章方能生效。
2.2情報價值,信息聚類參考
檔案信息資源開發的中間層次。檔案信息資源開發主體通過分析社會需求、結合一定技術手段將檔案資源進行聚類整合,提煉出對生產生活、經濟運行和國家社會發展有用的情報信息,為政府決策和普通用戶的工作生活提供信息支持。主要方式有資料簡介、原文匯編,建立檢索系統、數據庫等。
2.3文化價值,文化挖掘和提煉
檔案信息資源開發的最高層次。由于檔案是社會實踐的原始記錄,涵蓋了不同年代的社會全貌,保存了某個地區或者國家的記憶,因此檔案具有一定的歷史文化價值。文化的影響和傳承離不開檔案,從浩繁的檔案資源中進行文化挖掘,是踐行黨和國家實現“文化自信”的重要舉措,也是檔案人必須要努力的方向。
3檔案信息資源開發的條件—數據化
數字態和數據態檔案都是計算機可以自動分析、理解與處置的檔案信息,通過對結構化的數據進行關聯分析、聚類分析,對非結構化的文本信息進行模塊提取,對業務系統采用面向不同主題、角度的多維分析等方式,實現對檔案信息的深度挖掘。相較于傳統載體檔案采用人工標引、編目、著錄、編研等進行檔案資源開發的方式,數字態和數據態的檔案資源開發方式顯然效率更高、效果更顯著。呂玉潔、向禹在《確定性需求驅動的檔案數字化加工監理模式構建與適用性分析》中建立了檔案數字化加工確定需求的模型,對我國當前檔案數字化加工的確定性需求進行總結。檔案數字化加工的第一層次需求是要滿足長久保存,第二層需求是實現檢索、利用,第三層需求是檔案數據化,第四層需求是展現關聯性[3]。目前國內許多綜合檔案館已完成對館內部分歷史檔案和現行檔案的數字化處理工作,滿足了檔案數字化加工的第一層和第二層需求,而對第三層檔案信息的數據化處理尚缺乏宏觀性的規劃,大多數檔案數字化后以檔案目錄數據庫和數字圖像的形式保存。與此同時,政府部門、企業在社會活動中形成越來越多的數據態檔案沒有得到有效的歸檔和保存,大眾對數據資源進行整合與挖掘的需求越來越強烈,如地質行業需要建立四維地質環境模型實現數據可視化以便更好地進行地質勘查和環境治理;人民群眾要求政府推行一站式辦理業務的服務;等。因此,如何建立檔案數據化發展模式,實現業務環節和檔案環節的無縫對接,以電子文件雙軌制向“單軌制”運行為契機,推動各行業的在線歸檔功能實現,使檔案館形成社會檔案大數據資源中心,實現對檔案數據資源的深度挖掘和充分利用,是檔案部門必須解決的問題。
4檔案信息資源開發模式分類
從檔案信息資源開發主體和開發技術角度,通過文獻調查和網絡查找的方式對檔案信息資源開發模式進行探討。
4.1從開發主體的角度來看
檔案信息資源開發主體可分為三種:政府部門、公共檔案部門和市場。(1)政府部門主導的檔案信息資源開發模式。指政府部門主導單位內部檔案信息資源開發的模式,政府部門作為檔案信息資源的生產者和使用者,是檔案信息資源開發的主力軍。政府部門占據了社會上大部分檔案信息資源,涵蓋行政公文、聲像資料等多種類型的檔案,涉及自然資源、氣象、農林等多行業檔案資料,通過深度開發檔案信息資源為政府決策提供信息支持,為民眾辦理業務提供快速高效的服務。政府部門主導的檔案信息資源開發模式的優勢:一是安全。政府部門具有較高的保密意識,涉密和非涉密檔案信息的處理有嚴格區分,保密制度健全,安全措施到位。二是快速。政府部門通過行政指令分派任務,能將檔案資源開發的工作在全國范圍內快速鋪陳開來,在短時間內聚集優質人力物力資源完成任務。該模式的劣勢:一是人員技術不足。政府部門工作人員主要從事行政管理方面的工作,不擅長做技術層面的工作。政府各單位部門之間存在著信息壁壘,各業務系統之間還未完全整合,單靠檔案室的工作人員顯然無法解決這些難題。二是政府各單位檔案部門的局限性。政府各單位的檔案部門主要以檔案室的形式存在,其保存的檔案信息最終要流向公共檔案館,其檔案資源開發的任務多是局部性、應急性、預警性的,不適合多角度全方位的深度挖掘[4]。(2)公共部門主導的檔案信息資源開發模式。主要是指公共綜合性檔案館、專門檔案館等公益性事業單位為主對館藏檔案資源進行開發的模式。檔案館的檔案信息資源一般是政府部門移交、其他單位匯交以及檔案館主動收集的資料,經過分類、鑒定、整理歸檔形成的。以地質資料檔案館為例,各省地質資料檔案館都保存了不同地區豐富多樣的地質資料,包括各種區調報告、礦產資源勘查成果資料、地質災害調查報告等。目前許多地質資料檔案館都搭建了地質資料信息共享服務平臺,供公眾查詢館藏地質資料目錄,單位和個人都可以按規定查詢所需檔案資料信息。同時,地質資料檔案館還要圍繞環境評價、高速公路、高鐵地鐵等政府項目進行檔案資源開發,及時提供信息支持。公共部門主導的檔案信息資源開發模式優勢是:①實用性強。檔案館的定位就是服務政府和公眾的信息中心,直接面向用戶,不僅能對現實需求迅速反應,還能通過用戶分析對未來的信息需求提前預判,及時提供所需檔案資源;專門性檔案館比如城建檔案館、地質資料檔案館等,保存了大量專業的技術資料,通過大數據挖掘技術能深層次開發檔案信息資源。②人才技術資源優勢。檔案館有專門的檔案信息技術人才,既懂檔案也懂現代信息技術,能有的放矢開發檔案資源,提供專業的信息咨詢。③安全優勢。檔案館是公益性組織,與政府部門緊密聯系,嚴格執行黨和國家的方針政策,安全保密度高。該模式劣勢為:許多檔案館保存的檔案內容比較單一,館際之間信息化水平不一,不利于檔案信息資源的綜合開發。(3)市場主導的信息資源開發模式。指企業根據市場需求自主開發檔案信息資源產品向政府和公眾提供有償的檔案信息服務,或通過招投標等方式接受政府或公共檔案館的委托,為其開發檔案信息資源的模式。該模式的優勢是企業技術力量強大,項目開發經驗豐富,靈活性強,快速高效。劣勢是:目前國家缺乏對企業檔案資源開發產品系統的監管和評估規范,有泄露國家機密信息的風險;企業對委托其開發的檔案資源產品所有權存在爭議等。
4.2從開發技術角度來看
從技術開發角度看,主要有平臺+數據挖掘、技術框架+用戶畫像兩種檔案資源開發模式。(1)平臺+數據挖掘模式。目前許多政府部門和檔案館都建立了信息共享平臺,供用戶查詢信息、辦理業務、咨詢等,該平臺既保存了許多數字檔案也產生許多數據檔案。隨著物聯網和移動互聯網技術的快速發展,滲透到人們生活的方方面面,數據檔案的數量將劇烈上升。未來將以大數據和云計算技術為依托,建立智能化平臺,例如智慧城市大腦,通過物聯網的承載網絡、廣域互聯網、局域網、移動通信網獲取數據檔案。運用大數據技術對平臺內的數據進行智能分析,通過數據關聯挖掘和提煉數據中隱藏的知識將變得十分便捷和高效。(2)技術框架+用戶畫像模式。該模式對用戶在網絡中的行為進行分析,通過可視化統計描述、多維度交叉分析、用戶關系圖譜等技術構建目標用戶模型。這種方式已廣泛應用到電子商務領域,通過用戶畫像判斷用戶需求實現精準推送。檔案行業要積極地轉變思維,通過信息共享平臺、微博、微信等渠道收集用戶的行為數據,在大數據時代扭轉公眾對檔案部門的“刻板印象”,及時地改進工作,為用戶提供檔案信息的精準服務[5]。
5結語
通過對比研究,我們認為,政府作為行政管理部門,為了進一步提高工作效率和管理水平,建設現代智慧城市,滿足公眾的信息需求,對于深度開發檔案信息資源有著迫切的需要。由于政府檔案部門的局限性,可以通過行政命令或購買服務的方式,借助綜合檔案館、高校檔案館等公益性事業單位提供優質的技術服務和專業技術人才,結合檔案相關企業進行檔案信息資源的開發。而綜合檔案館、高校檔案館、專門檔案館等公共部門有良好的科研環境和項目績效刺激,掌握了比較新的數據分析技術和檔案專業知識,結合市場上檔案相關企業成熟的技術團隊和豐富的項目經驗,能更好地應對不同類型的檔案數據資源開發。因此,政府部門負責履行公共管理職能,對檔案信息資源開發進行規劃、監督和規范,檔案館和市場協同開展檔案信息資源開發工作,提供信息服務,是比較優質、高效的檔案資源開發模式。
參考文獻:
[1]錢毅.從“數字化”到“數據化”———新技術環境下文件管理若干問題再認識[J].檔案學通訊,2018(4):42-45.
[2]向禹,楊萬歡.基于PSR模型和價值實現的檔案生態系統研究[J].資源信息與工程,2017(12):185-189.
[3]呂玉潔,吳湘華,向禹.確定性需求驅動的檔案數字化加工監理模式構建與適用性分析[J].檔案學研究,2018(5):107-112.
[4]李佳潞,王翠萍,戚阿陽.大數據環境下面向政府決策的信息資源開發模式研究———以吉林省為例[J].圖書館學研究,2018(17):52-56.
[5]韓麗華,魏明珠.大數據環境下信息資源管理模式創新研究[J].情報科學,2019(8):158-162.
作者:胡慧 向禹 單位:中南大學 湖南核工業地質局檔案館