信息系統可靠性典型架構研究

前言:尋找寫作靈感?中文期刊網用心挑選的信息系統可靠性典型架構研究,希望能為您的閱讀和創作帶來靈感,歡迎大家閱讀并分享。

信息系統可靠性典型架構研究

摘要:隨著云計算技術和各類應用的蓬勃發展,企業的信息系統云化成為必然趨勢,如何在云環境下保障信息系統可靠性成為業界關注焦點。文章基于互聯網可靠性技術與信息系統一二次劃分的思路,形成雙活容災云架構,并詳細介紹了存儲和計算架構設計。云平臺環境下信息系統高可靠架構設計方案,有效解決目前云平臺資源調節和高可用性等方面存在的問題,對其他云環境下的信息系統架構可靠性提升具有普遍參考意義。

關鍵詞:信息系統可靠性;云平臺;雙活容災云

0引言

云計算通常通過互聯網提供動態可擴展的資源,按需響應服務按用戶使用量進行付費[1-2]。企業的信息系統云化成為必然趨勢,通過信息系統云化,可實現按需彈性服務,減少運維成本[3]。信息系統上云后,如何在云環境下保障信息系統可靠性成為業界關注焦點[4]。國家電網公司(簡稱“國網公司”)對于云計算整體規劃為“三朵云”,即生產控制云、企業管理云、公共服務云[5],由一體化“國網云”平臺(簡稱“云平臺”)及其支撐的各類業務應用組成。云平臺能實現IT資源的統一管理,有力促進業務集成融合。因為自主研發的產品在功能性、穩定可靠性上沒有市面上已有的云虛擬產品成熟。當前國網公司中關于云平臺可靠性的措施還處于初級階段,存在內存、CPU資源耗盡時,需要人工手動調整資源利用率,服務器與操作系統中集群內存用量居高不下,無法支持HA等問題,缺乏體系化保障措施和系統架構設計[6-7]。文章借助云平臺基礎能力,整合網絡、存儲、運行環境等多個環節的資源,基于云計算的雙活數據中心架構和信息系統一二次劃分的思路,構建云平臺下信息系統可靠性架構。

1基于云計算的雙活數據中心架構

傳統的數據中心架構一般設計為一個主數據中心和一個備份數據中心,只有當主數據中心出現問題停止服務時,備份數據中心才發揮作用開始運轉,在切換時有一段空白時間內,兩個數據中心都未處于工作狀態,該情況可能會使在空白時間內的信息系統產生的數據丟失[8-9]。近年來,隨著信息技術的飛速發展和用戶對可靠性需求增強,數據中心多采用雙活架構,兩個數據中心同時運行工作互為備份,共同承擔工作任務。在高速網絡技術,虛擬化技術與云計算技術支持下,可以較為迅速的將一個數據中心遷移至另一個數據中心,可以認為在進行數據中心遷移時幾乎沒有空白時間,丟失數據遠少于采用傳統數據中心備份方案時的丟失數據量[10-11]?;谠朴嬎愕碾p活數據中心架構如圖1所示。該雙活數據中心架構中,采用云計算架構構建計算系統,把數據中心物理服務器的各硬件資源進行虛擬化[12],按需生成多個虛擬服務器來支撐不同的應用服務,大幅提升服務器資源的利用率。同時采用云計算架構使得上層應用服務能夠分布在多個物理服務器中運行,保證在某一臺物理服務器出現異常故障時,該臺服務器上運行的應用服務能夠及時遷移至其他仍能夠正常工作的物理服務器中,提高了數據中心計算系統的可靠性,即使其中一個數據中心的計算系統中的全部計算資源都出現問題,該數據中心所承載的運算任務仍然能夠通過使用另一個計算中心的計算資源的方式繼續運行。

2信息系統一二次劃分

目前信息系統架構較為復雜,生產作業系統和信息支撐系統混合部署,功能耦合,存在故障互擾和同時失效問題。電力系統通過一二次設備的劃分、專業管理以及故障隔離分段保護等措施,支撐了電網高可靠運行[13-14]。借鑒電力系統可靠性設計,將信息系統按一次二次系統劃分。信息一次系統由信息系統中負責信息采集、傳輸、處理、存儲和輸出的設備及軟件構成,其工作對象為信息內容,包括對信息進行加工處理,轉運分配等。信息二次系統由保障信息一次系統可靠運行的相關設備及軟件構成,具備故障診斷、故障恢復和應急處理等方面的能力。

3云平臺下信息系統可靠性架構

基于信息系統一二次劃分的思路和基于云計算的雙活數據中心架構,構建云平臺下信息系統可靠性架構。主要是將信息系統中的二次系統,如資源調度監控系統,下沉到云平臺環境中,云平臺環境下高可靠架構模塊圖如圖2所示?;谠骗h境的技術架構,按照應用架構評估和應用雙活的設計原則,采用PAAS層提供的負載均衡、分布式緩存、消息處理、分布式存儲等服務,將可靠性保障的關鍵技術下沉至云平臺,形成雙活云災備方案,降低應用可靠性保障的復雜度和投資成本。兩個數據中心同時為用戶提供服務,一旦某個數據中心的應用系統出現狀況,另外的數據中心能夠持續為用戶提供服務,從而提高服務可靠性[15]。在技術實現方面,應用組件支持跨數據中心的分布式部署,可以同時提供對外服務,通過負載均衡實現應用組件級多活。存儲和計算架構的詳細設計下文進行介紹。

3.1存儲架構設計

該架構在兩個數據中心分別部署相應的存儲陣列、虛擬存儲網關、存儲主機等設施以及對應的光纖交換機,根據雙活數據中心架構中的兩個數據中心的物理距離,采用光纖直連或密集波分復用設備(DWDM)連接兩個數據中心,實現心跳、存儲域網絡業務的匯聚與遠距離數據傳輸。兩個數據中心中的虛擬存儲網關組成跨站點的雙活集群,共同負責兩數據中心的存儲陣列,形成跨數據中心的存儲資源池,該集群負責管理存儲系統與上層應用的交互。上層應用服務向存儲系統的訪問請求由兩個數據中心的虛擬存儲網關所組成的集群共同處理,當其中一個數據中心的虛擬存儲網關出現故障時,另一個數據中心的虛擬存儲網關可以立即接管所有來自上層應用服務的存儲/讀取請求。通過虛擬網關鏡像卷技術,實現兩個數據中心存儲系統相互備份。將兩個數據中心的虛擬存儲網關組成雙活集群的優點為,可以實現存儲數據的跨數據中心訪問。若兩個數據中心的虛擬存儲網關未組成雙活虛擬存儲網關集群,則每一臺虛擬存儲網關設備在處理來自上層應用服務對于存儲系統的訪問請求時,只能夠返回存儲于該數據中心的存儲陣列中的數據,若上層應用服務所請求的數據并未存儲在該數據中心的存儲陣列中,則該虛擬存儲網關無法向上層應用服務返回其需要的數據,上層應用服務需要再次向另一個數據中心的虛擬存儲網關請求數據,增大了數據中心承載的通信壓力。若采用該構架的高可靠存儲系統方案,則虛擬存儲網關組成的集群系統可以直接讀取兩個數據中心中的任意一個存儲陣列中的數據,也即應用服務可以向數據中心A的虛擬存儲網關設備請求任意數據而無需關心該數據實際是存儲于數據中心A還是數據中心B,即使數據存儲于數據中心B,位于數據中心A的虛擬網關存儲設備可以直接進行跨站點讀取,取得數據中心B中存儲的數據,依然能夠向上層應用服務返回其需要的數據。該架構可以保證當某一個數據中心的存儲系統中的虛擬存儲網關設備或存儲陣列設備出現異常故障時,該數據中心中的存儲系統不會完全癱瘓,仍能夠使用另一個數據中心中的虛擬存儲網關設備完成對本地存儲陣列中的數據的讀取與寫入,或者使用另一個數據中心中的數據備份繼續完成當前該數據中心計算系統中正在執行的工作任務,使得該數據中心所承載的業務不受影響。

3.2計算系統設計

在該架構中,為了使用虛擬化平臺技術實現數據中心對多個應用服務的支持,系統使用配置管理數據庫來進行對各個應用服務的軟硬件資源需求進行管理。利用虛擬化技術重構數據中心的計算資源,并按照具體應用服務的說明建立應用服務的運行環境,在虛擬化平臺中模擬運行應用服務,并在運行過程中進行資源監控,從而獲取應用服務運行時的具體軟硬件資源需求,將獲取的數據進行歸檔從而構建CMDB。該架構基于共享存儲,將多臺位于不同地點,具有高性能CPU與大容量內存的計算機組成VMwarevSphere分布式集群系統。集群系統通過vSphereHA功能,保證當集群中的某一主機或多臺主機故障時,將故障主機上正在運行的應用服務業務即刻切換至仍正常工作的主機上,保證信息系統持續可靠平穩運行,保障應用服務業務的中斷時間處于最少狀態,無數據丟失。集群系統采用VMwareDRS功能實現跨數據中心的分布式資源調度與負載均衡,充分利用兩個數據中心的資源。

4結束語

文章基于互聯網可靠性技術與信息系統一二次劃分的思路,形成基于國網云平臺的信息系統可靠性架構設計。該架構有效提升國網云平臺信息系統的可靠性,有效解決目前云平臺資源調節和高可用性等方面存在的問題,對于其他云環境下的信息系統架構可靠性提升具有普遍參考意義。

作者:郭晶 程卓 王勇 田攀 單位:四川中電啟明星信息技術有限公司

亚洲精品一二三区-久久