區塊鏈技術在銀行電子檔案管理中應用

前言:尋找寫作靈感?中文期刊網用心挑選的區塊鏈技術在銀行電子檔案管理中應用,希望能為您的閱讀和創作帶來靈感,歡迎大家閱讀并分享。

區塊鏈技術在銀行電子檔案管理中應用

摘要:本文給出了利用這些新興技術解決銀行檔案管理的現實問題的方法:采用區塊鏈技術,保障了電子檔案的安全可信性;采用智能OCR技術和知識圖譜技術,實現了高級檢索功能并充分挖掘了檔案內蘊藏的價值,為客戶營銷和可疑用戶分析提供了幫助和支撐。

關鍵詞:會計檔案;電子檔案;可信度;區塊鏈;人工智能本文側重研究銀行進行電子檔案管理的方法以及面臨的挑戰和對策。

1銀行電子檔案管理功能框架

電子檔案管理功能框架包括檔案分類、實物檔案管理、電子檔案管理、系統管理四大部分。其中,實物檔案管理包括庫房管理、檔案入庫、檔案出庫、檔案借閱、檔案鑒定、檔案銷毀等功能。電子檔案管理部分包括電子檔案采集、檔案檢索、檔案調閱、電子文件存儲、電子檔案內容提取、檔案數據挖掘和知識圖譜分析、電子檔案信息安全可信管理等功能。本文所述的電子檔案系統所存儲的電子文件包括業務歸檔時的實物憑證電子影像,也包括業務辦理過程中的業務相關電子文件。相比常見電子檔案管理功能,該功能架構增加了安全可信管理、檔案內容提取、檔案數據挖掘和知識圖譜分析功能,以解決前述的檔案可信度低及檔案利用率低的問題;將在下面的章節中做詳細闡述。

2利用區塊鏈構建可信電子檔案

2.1區塊鏈與檔案管理。傳統的真實性認證方法采取基于非對稱密碼學的技術,通過公鑰基礎設施(PublicKeyInfrastructure,PKI)的方式對文檔的數字簽名等信息加以認證。[1]這種操作離不開可信賴的第三方機構,即認證中心(CertificateAuthority,CA)的支持。認證中心是一個高度集中化的管理機構,它通過對申請者進行全面驗證之后為其提供數字證書,從而將其納入中心的認證范圍。多年以來,PKI/CA的解決方案已發展得較為成熟,也為檔案的真實可信提供了一定的保障,然而其過度依賴于第三方機構,并且缺乏統一性標準等問題尚需解決。在電子檔案管理方面,區塊鏈得到了一定的關注和研究,[2][3]區塊鏈技術中固有的可溯源、難以篡改等特性,使得其中的文件本身具有很高的安全保證和可信任度,不用再依賴于外部的認證機構,也無需考慮認證標準的具體細節。另外,區塊鏈可以將多份文檔的真實性進行關聯,對任何一個的修改都會影響到其后續的文檔,使得篡改難度大大增加。

2.2區塊鏈技術平臺。目前區塊鏈企業級應用主流平臺朝著聯盟鏈的方向發展,支持智能合約和多種共識算法。國內對區塊鏈技術平臺的研究尚處于起步階段,已有平臺大多集中在金融行業領域。區塊鏈技術本身也存在一些應用挑戰。其一,數據冗余問題。在利用去中心化特性的場景中,區塊鏈技術提高了數據的并發查詢訪問效率,但存在數據冗余的問題,需要根據具體應用進行冗余調整。其二,共識效率不高。在利用不易篡改特性的場景中,區塊鏈技術可以在去中心化的基礎上提升數據安全級別,但存在共識過程計算量大引起的效率不高等問題,需要尋求安全和效率的最佳折中點。

2.3基于區塊鏈的銀行檔案數據處理、查詢與檢索。在區塊鏈數據處理方面。當前區塊鏈平臺的吞吐量TPS(TransactionsPerSecond,每秒事務數)偏低,基于工作量證明(PoW)機制的比特幣為7TPS,以太坊為30TPS,基于實用拜占庭容錯(PBFT)算法的HyperledgerFabric為2000TPS。事務確認時間方面。不同的區塊鏈平臺存在較大差異。Fabric事務確認時間短,適合銀行電子檔案管理企業級應用。基于區塊鏈的檔案管理系統可提供智能合約和IPFS(InterplanetaryFileSystem)接口,區塊鏈存儲電子檔案的摘要信息,實現檔案的存證,并增強數據保護,IPFS文件系統存有電子檔案的原始信息,并通過分布式哈希表保障數據安全性。[4]在區塊鏈數據查詢、檢索技術方面。銀行電子檔案管理等區塊鏈應用中,需查詢的關鍵字包括區塊的哈希值、數據哈希值和應用相關關鍵詞,使用倒排索引、大數據等技術可提高數據查詢效率,縮短查詢結果響應時間。[5]基于批注的方法進行數據溯源,通過構建三元組<s,d,i>,其中s表示數據項源,d表示目標數據,i表示中間數據,通過三元組傳遞,支持數據溯源。[6]在區塊鏈數據驗證技術方面。銀行電子檔案管理等金融行業的應用場景中,鏈上記錄數據的時候,需校驗其合規性、正確性。驗證是否有正確的數字簽名,能否使用所輸入的數字資產,是不是資產的擁有者在參與事務等。通過對每筆事務輸出進行數字簽名,在輸出該筆數字資產時,需要提交相應的簽名信息。應建立可信賴的銀行電子檔案存儲庫,綜合應用區塊鏈、可恢復性證明和開放檔案信息系統等新技術,實現銀行電子檔案記錄保存、記錄存儲、數據管理、訪問記錄、傳播存證、遷移存據和數據溯源等應用。

2.4基于區塊鏈技術的銀行檔案管理系統。銀行檔案的使用具有一定的范圍,一般不會對社會廣泛公開,因此公有鏈的使用場景較少;對于僅限于銀行內部的檔案管理,可以采用私有鏈技術;而對于需要與外部企業或機構交流與共享的檔案,則一般以聯盟鏈為主。在數據管理的方式上,雖然區塊鏈本身就是一個分布式的存儲賬本,可以將電子檔案數據都放在鏈上進行保存,但采取這種方式往往效率不高,對于鏈上的運行速度和區塊容量都有著較大的挑戰。另外,這種做法使得區塊鏈與原有的檔案管理系統沖突較大,對業務和技術架構需要做大量改動,而且難以保證穩定性和日常運維。因此,可行做法是采用區塊鏈和其它存儲技術融合的方式,對于檔案的元數據、文件摘要、關鍵性記錄、數字簽名、Hash值等重要信息上鏈,而基礎數據和輔助數據則通過與區塊鏈相關聯的鏈下服務來完成?;趨^塊鏈的銀行檔案管理系統,對電子檔案生成摘要,并將其存儲于區塊鏈分布式賬本中,通過檢索其GUID、數據哈希值、元數據、時間戳等信息,比對其生成的摘要信息與鏈上存儲的摘要信息是否一致,驗證其一致完整性和原始出處。將原始數據哈希值存儲在區塊鏈上,對原始數據的任何改變,都會導致其哈希值的變化,因此在與其鏈上哈希值比較時,就能發現其與原始記錄的不一致,判別其新記錄文件與原始檔案相異,實現對電子記錄真實性、完整性、可靠性的識別。利用智能合約對上鏈的電子檔案數據進行合規性驗證,只有通過驗證的數據才能存儲到區塊鏈上。在電子檔案查詢、檢索環節,利用智能合約做出檔案一致性判斷?;谌ブ行幕植际狡脚_的電子檔案管理,提升了電子檔案的系統安全性、完整性和智能化。在生成電子文件時,同步生成電子文件的摘要信息,將這些摘要信息加上電子文件的元數據上鏈到區塊鏈系統中。如果電子文件被篡改、偽造,那么其對應的文件摘要信息就會發生變化,與區塊鏈系統中保存的原始文件摘要信息就不一致,從而能被識別出來。由于區塊鏈中的數據是不可篡改的,從而保證了電子檔案系統中數據的高度安全、高度可信性。

3利用人工智能技術構建智慧電子檔案

3.1新一代智能OCR技術提升檔案數據提取能力。電子檔案的另一大特點就在于可以利用先進的技術和算法對其內容進行提取和分析,以便于檢索和利用,基于圖像識別的OCR技術就是其中一個代表。以中國銀行憑證影像綜合應用系統中的OCR識別為例,利用基于人工智能技術的OCR引擎實現了各類常見憑證內容的識別,例如身份證的識別率達到99%以上,銀行卡、存單、駕駛證、行駛證等票據的識別率均在95%以上,為信息的進一步利用提供了良好的基礎。

3.2機器學習和知識圖譜提升檔案數據再利用能力。構建基于檔案的知識圖譜能有效進行檔案知識推理,是實現檔案智能檢索的關鍵技術和主要路徑之一?;诰幯腥藛T的檔案利用,通過對檔案信息資源的深入挖掘,實現對檔案信息資源的智能檢索,提高了檔案檢索的查全率和查準率;同時基于數據挖掘技術,支持對檢索結果中的知識圖譜展示以及檔案信息的自動聚類,為利用者提供了便捷、高效的檔案利用服務。

4結論與展望

銀行的電子檔案越來越多,然而電子檔案的可信度卻難以保障,特別是《會計檔案管理辦法》允許單位在滿足一定條件時只保存電子文件而不需要對應的實物檔案,就更需要采用科學的管理機制和技術手段來保障電子檔案的可信度。本文采用區塊鏈技術,特別是文件摘要和元數據上鏈的辦法,提供了一條解決之道。此外,利用人工智能圖像識別技術將沉睡的檔案里面的內容提取出來,再借助知識圖譜等技術手段,挖掘檔案和檔案之間的關系,為客戶營銷和可疑用戶分析提供了支撐。

作者:熊志正 單位:中國人民大學信息資源管理學院

亚洲精品一二三区-久久