大數據量解決方案范例6篇

前言:中文期刊網精心挑選了大數據量解決方案范文供你參考和學習,希望我們的參考范文能激發你的文章創作靈感,歡迎閱讀。

大數據量解決方案范文1

滿足用戶的個性化需求

中橋咨詢的一份大數據調查報告顯示,大部分中國用戶還處于“系統整合”階段,需要對來自企業內外部的大量數據進行收集和整理。

“為什么現在用戶對大數據解決方案求賢若渴?”高國輝自問自答,“因為傳統的技術和解決方案已經無法解決用戶當前遇到的諸多應用難題,比如實時交易數據的處理和分析等。金融行業提出‘小核心、大’,電信運營商積極構建雙活的數據中心都是從各自的實際需求出發,以應對大數據帶來的新挑戰。美國的某電信運營商就采用戴爾的SharePlex技術構建了雙活的數據中心?!?/p>

其實,無論企業的數據量有多大,數據是結構化還是非結構化,戴爾都可以提供具有針對性的解決方案。Spansion是一家知名的制造企業,它希望通過升級現有的數據庫來更好地支持其關鍵統計流程,從而達到提升業績的目標。為此,它采用了戴爾的SharePlex技術對原有的Oracle數據庫進行升級,不僅安全地完成了數據庫的遷移,而且節省了大量資金。

“諸如此類的例子還有許多。”高國輝介紹說,“不同的用戶,在大數據方面的需求不同,而且對價格的敏感度不同,這就決定了用戶在選擇大數據解決方案時有其‘個性化’的需求。比如,許多互聯網企業十分熱衷采用基于Hadoop的解決方案,就是考慮到經濟性的問題。戴爾的優勢就在于,可以為不同的用戶提供適合其需求的大數據解決方案?!?/p>

戴爾軟件事業部已成為戴爾企業級端到端解決方案的核心組成部分。具體到軟件解決方案本身,戴爾也強調端到端,比如戴爾軟件可以提供從移動辦公管理到信息數據管理再到數據中心和云計算的全面軟件解決方案。其中,信息數據管理軟件就與大數據直接相關,它包括數據庫管理、應用系統及數據集成,以及大數據分析等產品。

全面的軟件解決方案

上文提到的SharePlex以及Boomi等就是用戶比較喜歡的戴爾軟件產品。高國輝舉例說,無論是結構化數據還是非結構化數據,無論數據在本地還是云端,通過Booming都可以實現整合和統一管理?!霸诖髷祿矫?,我們強調的是如何幫助客戶實現簡化。比如,通過戴爾Toad軟件,可以連接不同類型的數據庫,借助Boomi還可以將本地的數據庫與云中的數據相結合,然后通過戴爾的商業智能套件進行分析和展示,甚至還可以基于戴爾Kitenga軟件進行深度數據挖掘?!备邍x補充說。

大數據量解決方案范文2

IBM全球高級副總裁、系統與科技部(STG)總經理RodAdkins認為,當前全球IT領域有了令人振奮的發展趨勢和挑戰,現在每天有大量數據和信息生成,這為大數據分析提供了機會;數據中心的挑戰也為IT提供了新機會,比如云計算,能降低數據中心成本;IBM希望通過智慧的運算,實現智慧的地球的愿景。

英特爾亞太研發有限公司總經理、軟件與服務事業部中國區總經理何京翔認為,大數據本身其實是信息革命的一個新引領。在未來幾年隨著物聯網的發展,可能會有2100億個RFID或者集群,在我們的環境之中,如果未來的移動互聯、物聯網如果變成現實,我們的生活會被傳感器、會被數據采集裝置所擁抱,這時候數據量將更大。這些數據量僅僅是數據,并不能解決問題,它要從數據變成信息、變成智能、變成商業價值,這才能夠體現出真正的大數據的價值。

VMware全球高級副總裁范承工認為,在過去三年當中,看到大數據的發展從無到有,市場上大家說大數據的趨勢,三年前可能還沒有人說這個詞,現在已經如火如荼。然而,現在除了數據本身發生了改變,云計算也使數據變得更加分散,在這樣的趨勢下,傳統數據庫對于海量數據的需求、快的需求、開發者數據多樣化的需求難以滿足,使各種各樣的解決方案大行其道。

EMC的大數據和存儲專家、EMC資深產品經理李君鵬認為,大數據本身就是一個問題集,云技術是目前解決大數據問題集最重要有效的手段。云計算提供了基礎架構平臺,大數據應用在這個平臺上運行。目前公認處理大數據集最有效手段的分布式處理,也是云計算思想的一種具體體現。

對于大數據給云計算帶來的影響,Teradata技術總監StephenBrobst表示,公有云架構對數據倉庫沒有影響,因為企業的CIO不會無緣無故把財務數據或者客戶數據放到云上,那樣很危險。然而,私有云架構確實有影響:第一,通過私有云,可以鞏固數據集市,減少利用率不足的問題;第二,可以通過靈敏的方式將數據集成,實現業務價值。

其實云計算與大數據的不同之處主要在于應用的不同,主要在兩個方面:

大數據量解決方案范文3

EMC Isilon:橫向擴展 性能突出

大數據存儲不是一類單獨的產品,它有很多實現方式。EMC Isilon存儲事業部總經理楊蘭江概括說,大數據存儲應該具有以下一些特性:海量數據存儲能力,可輕松管理PB級乃至數十PB的存儲容量;具有全局命名空間,所有應用可以看到統一的文件系統視圖;支持標準接口,應用無需修改可直接運行,并提供API接口進行面向對象的管理;讀寫性能優異,聚合帶寬高達數GB乃至數十GB;易于管理維護,無需中斷業務即可輕松實現動態擴展;基于開放架構,可以運行于任何開放架構的硬件之上;具有多級數據冗余,支持硬件與軟件冗余保護,數據具有高可靠性;采用多級存儲備份,可靈活支持SSD、SAS、SATA和磁帶庫的統一管理。

通過與中國用戶的接觸,楊蘭江認為,當前中國用戶最迫切需要了解的是大數據存儲有哪些分類,而在大數據應用方面面臨的最大障礙就是如何在眾多平臺中找到適合自己的解決方案。

EMC針對不同的應用需求可以提供不同的解決方案:對于能源、媒體、生命科學、醫療影像、GIS、視頻監控、HPC應用、某些歸檔應用等,EMC會首推以Isilon存儲為核心的大數據存儲解決方案;對于虛擬化以及具有很多小文件的應用,EMC將首推以VNX、XtremIO為核心的大數據存儲解決方案;對于大數據分析一類的應用需求,EMC會綜合考慮客戶的具體需求,推薦Pivotal、Isilon等一體化的解決方案。在此,具體介紹一下EMC用于大數據的橫向擴展NAS解決方案——EMC Isilon,其設計目標是簡化對大數據存儲基礎架構的管理,為大數據提供靈活的可擴展平臺,進一步提高大數據存儲的效率,降低成本。

EMC Isilon存儲解決方案主要包括三部分:EMC Isilon平臺節點和加速器,可從單個文件系統進行大數據存儲,從而服務于 I/O 密集型應用程序、存儲和近線歸檔;EMC Isilon基礎架構軟件是一個強大的工具,可幫助用戶在大數據環境中保護數據、控制成本并優化存儲資源和系統性能;EMC Isilon OneFS操作系統可在集群中跨節點智能地整合文件系統、卷管理器和數據保護功能。

楊蘭江表示,企業用戶選擇EMC Isilon的理由可以歸納為以下幾點。第一,簡化管理,增強易用性。與傳統NAS相比,無論未來存儲容量、性能增加到何種程度,EMC Isilon的安裝、管理和擴展都會保持其簡單性。第二,強大的可擴展性。EMC Isilon可以滿足非結構化數據的存儲和分析需求,單個文件系統和卷中每個集群的容量為18TB~15PB。第三,更高的處理效率,更低的成本。EMC Isilon在單個共享存儲池中的利用率超過80%,而EMC Isilon SmartPools軟件可進一步優化資源,提供自動存儲分層,保證存儲的高性能、經濟性。第四,靈活的互操作性。EMC Isilon支持眾多行業標準,簡化工作流。它還提供了API可以向客戶和ISV提供OneFS控制接口,提供Isilon集群的自動化、協調和資源調配能力。

EMC Isilon大數據存儲解決方案已經在醫療、制造、高校和科研機構中有了許多成功應用。

方案點評

EMC Isilon是一個強大但簡單的橫向擴展NAS方案,適用于希望投資數據管理而不是單純存儲的企業。當初,EMC將收購來的分布式數據倉庫軟件廠商Greenplum的軟件與Isilon存儲組合成了EMC最早的大數據解決方案。用戶既可以分開選擇Greenplum軟件或Isilon存儲,也可以選擇由Greenplum軟件和Isilon存儲組成的一體機解決方案?,F在,Greenplum軟件雖然已歸Pivotal公司,但EMC是Pivotal的經銷商與合作伙伴,Greenplum與Isilon存儲的組合方案并不會因此受到影響。

HDS UCP:統一平臺 應用優化

HDS中國區解決方案與專業服務事業部總監陳戈認為,大數據存儲應該是一個解決方案:“大數據解決方案是由基礎架構的各部件組成的,包含數據存儲、計算和分析,而存儲是此架構中的一部分?!?/p>

大數據的存儲類型與傳統的存儲類型有一定區別:在大數據存儲中,更多的應用是一次寫、多次讀,讀得更多是大數據存儲的一個特點,而在傳統的數據存儲中,讀寫是隨機的,由于每個應用不同,其讀寫的比例也是隨機的;大數據存儲需要具有橫向的可擴展性,并可支持多種接口、多種數據訪問協議,便于不同數據進入這個大數據平臺。

談到中國用戶在大數據存儲應用中最迫切的需求是什么,陳戈認為,中國用戶最迫切的需求是如何逐步實現大數據應用,即用戶從現有的模式如何過渡到大數據,如何更好地利用大數據進行經營分析。

大數據的經典定義可以歸納為四個“V”,但企業不可能一步到位實現四個“V”,這需要一個循序漸進的過程。海量的、多種類型的數據是一次性全部載入到大數據中,還是通過現有的平臺進行數據初選,再導入到大數據平臺中,是兩種不同的實現途徑?!跋韧ㄟ^現有平臺進行數據初選,再導入到大數據平臺,這種方式更適合于客戶逐漸實現大數據,可以縮短用戶實現大數據應用的時間?!标惛瓯硎荆按髷祿饕欠墙Y構化數據。用戶可以使用基于對象數據存儲的HCP,利用其獨特的元數據采集和智能工具,對非結構化文件數據進行管理,實現智能的自動化,這有助于對數據進行深度分析,幫助客戶從單一系統中存儲、共享、同步、保護、保存、分析和檢索文件數據,減少垃圾數據,進而為大數據分析建立一個良好的基礎?!?/p>

談到用戶在大數據應用中遇到的主要障礙,陳戈表示,一方面,應用軟件本身的智能程度是否能滿足行業應用需求,應用軟件是否已經成型,大數據人才是否具備等,是讓大數據應用落地的關鍵;另一方面,如何抽取數據,放在大數據平臺中進行相應的計算是另一個關鍵問題。

HDS可為所有數據提供單一、可擴展的虛擬化集成平臺。HDS推出了“三步”云戰略,從基礎架構、內容和信息三個層面幫助客戶解決目前所遇到的問題。具體來看,通過“基礎架構云”,HDS可以幫助客戶進行虛擬化和集成管理,實現數據中心的整合;在第二層的“內容云”當中,HDS可以按需提供內容,更可以不受應用限制地進行數據搜索和集成;在第三層的“信息云”中,針對所有數據類型,HDS在其存儲平臺中融入了分析功能,使客戶可以從數據信息中獲取洞察力。

HDS提供的UCP for SAP HANA集成了基于大量數據集的創新和內存分析技術,并提供實時的洞察力,從而使當前的信息驅動型企業可以加快其商業決策的速度。陳戈介紹說,UCP for SAP HANA解決方案結合了HDS刀片服務器技術、企業級存儲系統和業內領先的網絡組件,在這樣一個集成的、高性能的硬件平臺上可以快速交付SAP下一代內存計算技術。全球已有超過200家客戶在使用HDS和SAP的大數據解決方案。

方案點評

其實,HDS的“三步”云戰略也可以看成是其大數據戰略。HDS借助以UCP為核心的大數據平臺,可以幫助企業用戶構建從基礎架構到內容歸檔和搜索,直至信息提取和分析的全面、高效的大數據解決方案。HDS的“信息云”直接與大數據相關。UCP是一個集成了計算、存儲與網絡的一體化平臺,它既可以提供像一體機一樣的整合性、簡單性,又可以提供靈活的選擇,連接第三方的設備組件。HDS還通過與包括SAP在內的眾多大數據分析類的合作伙伴合作,針對行業定制優質的大數據解決方案。

HP StoreAll :快速部署 極速搜索

中國惠普有限公司企業集團存儲產品部存儲架構師張楠向記者表示,大數據存儲是一套解決方案,應該能夠對大數據的Volume、Velocity、Variety和Value四個方面提供全面的支持。

第一,大數據存儲要支持海量級的數據存儲,比如具有PB級的存儲能力。第二,大數據存儲要支持更高的存儲速度,支持10Gb甚至更高的網絡連接。第三,大數據存儲要支持數據的多樣性,如圖片、文本、視頻、音頻等。第四,大數據最重要的是價值的體現,而為了實現這一點,存儲本身應該具備快速、智能的數據檢索能力?!霸诖鎯Φ淖畹讓犹峁┳钪苯印⒖旖莸臄祿z索。這一過程簡單說就是,將上層的數據挖掘工作下移,充分利用存儲強大的處理能力和數據識別能力。”張楠舉例說,“比如,在秒級的單位內對數據進行極速的搜索, 從幾千萬甚至上億個文件中找到目標數據。”

另外,模糊查詢能力也是大數據存儲不可缺少的功能。智能的模糊查詢將為大數據平臺提供更加便捷的存儲服務能力,使得存儲更像一臺智能的高速計算設備。

目前,很多中國用戶在存儲廠商的引導下,片面追求存儲的大容量和高性能,而忽略了大數據存儲本身應該提供的其他額外屬性。中國用戶在實施大數據的過程中經常遇到的障礙有以下兩方面:第一,無法將存儲與大數據平臺進行對接;第二,無法充分利用大數據存儲的價值,也很難將其運用到實際的業務中。張楠表示,究其原因,主要在于有些大數據存儲產品沒有開放的接口協議,或沒有針對用戶的大數據場景進行特別優化,也沒有用戶容易接受的易用的管理方式等。

惠普在大數據方面可以提供軟硬結合的解決方案?;萜赵谑召廇utonomy公司之后,將其軟件與惠普的硬件平臺進行了整合, 形成了一套完整的大數據解決方案。張楠介紹說,在存儲方面,惠普擁有像StoreAll這樣的大數據存儲平臺。借助HP StoreAll硬件平臺,用戶除了可以實現海量數據的存儲和高速數據訪問以外,還能實現高級的數據檢索功能,對特殊文件進行快速定位。同時,結合HP Autonomy軟件的特性,惠普還引入了模糊查詢、智能語義庫等概念,可以幫助企業用戶通過存儲底層為上層業務帶來所需的大數據業務價值。

如今,閃存不僅在大數據領域,而且在Tier 1存儲市場同樣占據著十分重要的地位。對于大數據平臺來說,閃存可用來提升存儲的存取速度,降低I/O的響應時間等。針對那些I/O壓力十分明確的大數據平臺, SSD可以發揮其效果, 提升存儲的整體性能。但是,SSD并不是萬能的。因為大部分的數據都是非結構化的,而非結構化數據對I/O的響應要求遠遠沒有對帶寬的需求大,所以,讓用戶花數倍的價格購買SSD存儲在目前來看還是比較困難的。從目前情況看,引入閃存的大數據解決方案還不是很普遍。

方案點評

惠普在大數據方面收購了兩個軟件公司Vertica與Autonomy,然后將它們的軟件與原有的硬件平臺進行整合,針對結構化和非結構化的數據都可以提供針對性的解決方案?;萜赵趯⒋髷祿浖c存儲硬件結合上也進行了嘗試,其中一個成功的例子就是HP StoreAll大數據存儲平臺。HP StoreAll具有以下特點:橫向擴展,最大可以擴展到16TB;集成HP Autonomy搜索引擎,可以快速搜索,實現實時大數據的價值;內置對OpenStack的支持,可快速部署;支持文件和對象類型的數據存儲。

NetApp:統一架構 無限擴展

如今,企業若想獲得成功,就必須想方設法應對具有前所未有的復雜性、高性能的海量數據,并盡可能地管理這些數據,從中發掘更大的商業價值。

對于國內用戶來說,無論企業的規模和數據量大小如何,運用大數據的關鍵在于,企業是否把大數據作為一個真正的工具,去體現企業的差異化,從而提升競爭力。隨著越來越智慧的企業信息化的發展,IT不再是束縛企業發展的瓶頸,而是真正地融入了企業自身的業務中。越來越多的公司將大數據成功地運用于企業的商業模式。例如,在歐美,很多企業已經著手將大量資源投放在大數據領域。反觀國內,在金融領域,有為數不少的企業通過大數據的分析工具來分析金融的走勢,實現風險管理,進行信用卡的追蹤等。此外,像零售、制造、電信等行業也已在嘗試利用大數據分析工具為企業營銷和決策提供支撐。

無論企業現在是否正在使用大數據工具,企業都應全面地考慮自身未來發展的需求,選擇一個廠家的平臺與之共同發展,這可以有效避免因數據和應用遷移帶來的麻煩。

在大數據方面,NetApp能夠幫助企業實現數據管理,應對業務挑戰的極限,將以數據為導向的洞察轉化為有效行動。若想將數據轉化為商機,僅僅提升管理能力是不夠的,需要徹底轉變數據和業務之間的聯系模式。NetApp可以幫助企業用戶持續管理數據,迅速把握意料之外的新商機,永久保存所有數據,并在靈活、開放的存儲平臺之上打造屬于企業自己的大數據解決方案。

NetApp提供了可高效處理、分析、管理和訪問大規模數據的大數據解決方案。NetApp的解決方案組合可劃分為分析、帶寬和內容三個主要用例,這被稱之為大數據的“ABC”基本要素。

具體來看,分析(Analysis)是指針對極大數據集的高效分析。NetApp分析解決方案就是幫助用戶深入了解和利用數字世界,將數據轉化為高質量的信息,以及提供關于業務的更深入見解,從而幫助企業做出更好的決策。

帶寬(Bandwidth)是指適用于數據密集型工作負載的性能。此類解決方案著重于為速度非常快的工作負載提供更高的性能。高帶寬應用包括高性能計算(能以極快的速度執行復雜的分析)、用于監控和任務規劃的高性能視頻流、媒體和娛樂領域中的視頻剪輯和播放。

內容(Content)是指無限的安全數據存儲。此類解決方案著重于滿足可擴展的安全數據存儲需求。內容解決方案必須支持存儲的無限擴展能力,以便企業可以根據需要存儲任意多的數據,并能在需要時找到所需的數據。

NetApp致力于通過一系列解決方案來提供高性能的運算和大數據的應用。2013年11月,NetApp再次更新了E系列家族產品,推出E2700和E5500。該系列產品采用可輕松擴展的設計,適用于要求99.999%的可靠性且穩定、高性能的工作負載。

用戶在采購大數據存儲產品時,需要注意以下五個方面的問題:大數據存儲必須具有向上擴展與向外擴展的能力;架構必須是針對工作負載進行優化的,具有實時處理能力;具有整合的數據保護功能;保證7×24小時運行不中斷,可在線進行容量擴展,實施數據遷移等;可以實現服務的自動化。

方案點評

NetApp的技術優勢集中體現在其統一存儲平臺上,從入門級產品到企業級產品,全部基于同一個體系架構和操作系統,不僅部署和使用方便,而且升級和擴展非常簡單。當初,NetApp收購LSI Engenio,其中一個重要的原因就是為了大數據。2013年,NetApp不斷更新E系列產品線,推出E2700和E5500等。E5500可以支持高IOPS混合工作負載和數據庫、高性能文件系統和帶寬密集型流等應用,可確保數據的高可用性、完整性和安全性。

曙光XData:高度集成 貼近行業

關于大數據存儲,目前業界沒有一個通用的定義。曙光信息產業股份有限公司總裁助理兼存儲產品線產品總監惠潤海從曙光大數據平臺和解決方案角度,概括出大數據存儲的主要特征。

首先,大數據存儲必須支持全類型數據, 包括結構化、半結構化和非結構數據,實現統一數據支持。

其次,存儲性能上,一方面,大數據存儲要支持海量數據,并且要在保證數據可靠性的基礎之上,實現容量與性能的線性擴展;另一方面,為了實現大數據的價值,批處理和實時處理兩種措施都需要高性能的數據訪問獲取能力。

最后,在系統達到一定規模之后,系統的易用性和可管理性也是不可或缺的。

從應用角度來說,目前中國用戶在大數據存儲應用中最迫切的需求,是如何真正實現用戶數據的價值,如何驅動業務發展,實現決策和運營?!皬南到y構建層面說,要實現數據高性價比的存儲和管理,同時滿足數據服務的相關需求?!被轁櫤1硎?。

針對用戶對大數據存儲的需求, 曙光推出了像大數據一體機這樣的全類型數據分析型產品,同時還基于該產品構建了基于行業的解決方案,以幫助用戶實現大數據落地。

“除此之外, 我們還提供了大數據統一數據中心解決方案, 涵蓋了像主攻事物處理的DS900、DS800,以及針對文件存儲的Parastor等存儲產品。我們基于這些存儲產品構建了大數據運營管理平臺?!被轁櫤=榻B說,“曙光的優勢不僅在于可以提供全面的產品支撐,更重要的是能夠提供數據生命周期過程服務支持。目前,我們提供的免費維保期限為5年?!?/p>

曙光開發了針對不同行業和應用場景的大數據存儲解決方案。以金融行業為例,目前國內四大行的應用系統每年產生的非結構化數據量已達到PB級,結構化數據也以百TB計。面對如此大量的數據,如何存儲、管理、利用和盤活它們呢?惠潤海認為,只有通過商業智能和高級分析應用解決方案才能將數據的價值最大程度地發揮出來。

針對金融行業用戶的需求,曙光開發的XData大數據解決方案利用優化的大數據處理技術,對文件管理、歷史數據查詢和數據分析類應用等進行深入研究,為數據爆炸式增長帶來的海量數據存儲及分析應用提供高可靠的解決方案。

曙光金融行業XData大數據解決方案采用曙光自主研發的SN-MPP并行數據庫,同時結合大數據處理事實標準Hadoop,并充分考慮了多方面的數據收集,加入ETL工具和連接驅動器,提供了類SQL的接口,還和現有金融業務系統進行對接。

針對金融行業歷史數據,XData大數據解決方案在方案設計上主要考慮了數據的安全性、歷史數據高效導入、快速訪問與分析報表。曙光金融行業大數據解決方案立足于基礎平臺建設,同時切實貼合金融行業用戶需求,提供了優質的軟硬一體化解決方案,為用戶一攬子解決了部署、業務移植開發等技術難題,幫助用戶跨過應用門檻。

大數據量解決方案范文4

在大數據方面,Alpine與EMC、IBM、Oracle等廠商在交通、金融、電信、零售等領域保持著密切的合作關系。EMC雖然是Alpine的股東之一,不過也鼓勵Alpine與EMC之外的其他大數據廠商合作,以中立的第三方的姿態為客戶和廣泛的合作伙伴提供大數據方面的支持和服務。

榮之聯在云計算方面擁有比較多的成功經驗,尤其是在生物云、動漫云等方面已經是國內的佼佼者。

舉例來說,榮之聯幫助華大基因構建了生物云,存儲容量達到20PB,計算能力達到200萬億次。由于生物學方面的數據量非常龐大,而且大多數是非結構化的數據,在過去一年中,榮之聯一直探索如何在生物領域提高數據處理和分析的性能,降低復雜度。在選擇與Alpine合作之前,榮之聯曾經對Alpine進行了大約一年的考察。榮之聯的高層也親赴美國Alpine總部參觀,同時走訪了很多Alpine在美國的用戶。榮之聯總經理張彤表示:“與Alpine合作,榮之聯可以更好地在生物學領域深耕大數據市場。雙方的合作是戰略性的,對于擴大雙方在中國大數據市場上的份額十分有益?!?/p>

Alpine首席執行官Anderson Wong表示:“榮之聯一直專注于數據中心市場,擁有良好的技術基礎和客戶基礎,并在全國擁有近20個分支機構。這有利于Alpine迅速打開中國市場,為客戶提供良好的本地化服務?!?/p>

IDC的報告顯示,全球信息總量每兩年就會翻一番,到2020年,全球信息總量將達到25ZB。處理復雜的海量數據需要有與之對應的創新性的解決方案。

Anderson Wong介紹說:“在美國,目前有大約150萬名IT經理需要直接使用大數據分析的結果?!迸c已經存在了30多年的傳統商業智能(BI)解決方案相比,Alpine的大數據分析解決方案是一個涉及整個數據處理流程的智能化的解決方案,可以對不斷變化的信息進行實時分析,從而為商業決策提供更好的支持。

在大數據領域,一體機的理念越來越流行。Anderson Wong對大數據一體機方案表示認可。他表示:“提高大數據應用的計算能力、存儲能力,還是要依靠優化的集成化硬件。在大數據領域,一體機的應用是未來的一個趨勢。舉例來說,Oracle公司10%的數據庫用戶已將應用平臺轉到了Exadata一體機上?!?/p>

Anderson Wong表示:“Alpine與榮之聯合作,一方面,可以拓展在中國的業務市場,另一方面也可以把榮之聯在生物云、動漫云等云計算方面的技術和成功經驗帶到美國去,可謂一舉兩得?!?/p>

在美國,許多大型零售商、銀行等在使用傳統的數據倉庫產品的基礎上,同時還選擇了Alpine的大數據產品。這是因為用戶現在越來越需要能夠對數據進行實時處理的、界面友好且方便使用的數據分析產品。

大數據量解決方案范文5

云計算、大數據浪潮的一個表現是,IT市場從“以計算為中心”向“以數據為中心”轉變。以IDC的2012年第三季度市場分析數據為例,外部存儲市場增長3.3%,服務器市場卻下降4%。這是因為,云計算讓廉價的X86服務器可以擔當重任,“計算”的門檻便降低了。

“數據”方面的情況則是,數據量飛速增長。最近,IDC了2012數字宇宙研究報告,報告調高了對數字宇宙增長速度的預測。2010年,IDC預測到2020年,數字宇宙的規模為35ZB。在最新的報告中,這一數字變為40ZB。

2013年,我們還將看到,云計算、大數據浪潮正在引發IT廠商格局的巨變。思科公司董事長錢伯斯最近做出預言,微軟、IBM、惠普、SAP、甲骨文和思科等科技巨頭,5年內將有兩家或3家不在名單之列。同時,EMC、VMware進一步提出軟件定義數據中心的理念,將云計算的變革推向深入。

在IT產業中,EMC公司的規模并不算很大。2012年銷售收入預測為216億美元~217.5億美元,而它在IT業界的地位超過了很多規模大的公司。EMC之所以能夠引領云計算、大數據潮流,是因為公司決策層能夠敏銳地洞悉行業技術趨勢,從產品、技術和解決方案上提前布局。

最近,EMC公司全球11位高管從技術的角度,對2013年全球技術趨勢進行了預測。這11位高管分別來自信息安全、信息智能、企業存儲、閃存產品、備份恢復、大數據分析等部門。他們認為云基礎架構和大數據分析處理的最新需求趨勢是:

由于軟件智能、跨域基礎架構管理軟件包以及對象存儲開放接口技術的廣泛采用,混合云模式將變成現實;

大數據存儲將催生新型應用,IT創新和變化的速度加快;

提供單點式工具的大數據初創公司前景不樂觀,客戶需要集成式解決方案;

信息安全需要基于大數據分析的深度防御戰略;

企業級存儲將更多采用行業標準組件、企業級閃存和領先的驅動器技術;

閃存將成為常態產品,相變存儲器將迎來投資熱潮;

統一存儲方面,從服務器、網絡到存儲,將普遍采用閃存技術;

“重復數據刪除技術+磁盤備份”的模式將進一步替代磁帶備份,備份恢復朝著“IT即服務”方向發展;

企業內容管理方面,基于云服務模式、以內容為中心的解決方案將達到質變點;

由于人們越來越多地采用云和大數據,企業在IT改造中,人、流程和技術的重要性凸顯。

大數據量解決方案范文6

圖書館面臨的數據問題

正如數字圖書館、Library2.0、云計算等技術出現之初,圖書情報界出現很多質疑聲音一樣,圖書情報領域研究大數據的嘗試也不可避免地遇到質疑。為了推動圖書情報領域里的大數據技術與提升知識服務能力、降低知識服務成本,有必要對大數據時代,圖書館所面臨的問題及機遇進行探究。

在思想觀念上,相較于圖書館所擁有的不斷增長的數據量而言,能夠分析的數據比例在不斷降低。如何充分把握大數據所帶來的技術優勢與數據分析方法,有效提高圖書館能夠分析的數據比例,加強知識服務的智能輔助決策能力則十分重要。

從圖書情報領域數據分析和應用現狀來看,現在的圖書館人員在面對一些“可能是機會的數據”時,并沒有清醒的認識,缺乏將數據轉換成知識的思想意識及非結構化數據持久化處理及深度分析的技術及解決方案。

除此之外,最終的問題應該回到圖書館相關人員如何認識、管理和分析其所擁有的各種結構化、半結構化以及非結構化數據,如何建立軟硬件一體化集成的大數據綜合解決方案,數據及知識獲取、存儲、組織、分析以及決策的大數據解決方案等則愈發關鍵。

圖書館大數據應用優勢

圖書館對于大數據而言,通常存在三種角色:大數據的使用者或受益者、大數據的提供者或開發者及大數據的運營者或維護者??梢粤私獾剑斍皫缀跛写髷祿夹g及產生的相關服務都可以在圖書情報領域得到應用,特別是能夠帶來一些難能可貴的新型知識服務幫助。例如,可以幫助圖書館建立各類知識服務及業務建設的風險模型。即圖書館的各類風險評估模型:數字圖書館信息安全風險評估模型、信息資源采購及應用評估風險模型、圖書出版的收益與風險模型、知識產權風險評估模型等,都可以通過大數據分析、預測及智能輔助決策技術建立具有自身機構特色的、科學的及實用的風險模型。

另外,圖書館用戶流失分析及價值分析也涉及到大數據的應用。OCLC 的《Research Libraries,Risks,and Systemic Change》研究報告指出,價值質疑、技術障礙、人員隊伍無法適應未來挑戰等一系列重大問題已經嚴重困擾著圖書館、高校教職工,并逐步弱化了圖書館的存在價值,造成用戶流失異常嚴重。大數據技術不僅可以通過數據了解用戶、行為、意愿、業務需求、知識應用能力及知識服務需求等需要,更可以利用數據對用戶的科研創新合作過程及合作交互型知識服務過程將要發生的事件進行分析和預測,從而應對圖書館未來所面對的生存危機有所預警。

大數據可以幫助圖書館建立新型知識服務引擎。技術引擎是圖書館信息服務的技術核心,如何利用大數據技術構建圖書館的新型知識服務引擎,將會是未來幾年內圖書情報領域信息技術研究的主要內容。新型知識服務引擎包括資源及學術搜索引擎、資源及服務推薦引擎、知識服務社區實體( 包括用戶及資源) 行為智能分析引擎、用戶知識需求預測引擎及多維度信息資源獲取、組織、分析及決策引擎等。

例如美國 Hiptype公司用大數據分析技術來分析電子書讀者閱讀習慣和喜好,這也是國內外圖書情報領域首例利用大數據技術構建知識服務社區實體( 包括用戶及資源) 行為智能分析引擎??梢酝ㄟ^分析資源( 包括軟硬件資源、網絡資源、信息資源、服務資源及知識資源等) 的狀況來預測可能的故障,或對于資源突然的波動可以幫助圖書館制定應對策略。例如網絡攻擊、風暴、垃圾資源過濾、軟硬件資源故障、信息服務需求障礙及知識資源波動等。大數據可以幫助建立更加靈活的、智能的網絡化信息資源智能組合方式。圖書館可以靈活、方便地從已有結構化及非結構化數據資源中抓取有用的知識、關系、模式、癥狀用于新的知識服務方式。眾所周知,傳感器數據也是未來大數據的主要來源之一,對圖書館自然環境、人文環境及技術環境數據多維度大數據的智能分析及智能輔助決策,進而實現機構管理、發展及服務的預測、優化和監管。

圖書館未來服務方向

大數據伴隨著云計算、移動互聯網、物聯網等信息技術的成熟而迅速發展,并且越來越受到業界和學術界的關注,相較于過去幾十年數字圖書館的研究與發展,大數據技術在未來幾年將會給云圖書館帶來革命性、持續性和創造性的變化,會對我們所熟知的知識服務能力和知識服務機制產生重大的顛覆和創新,也對現有的技術和方法提出更高的要求,而這一切可能會超出我們正常期待的范圍。

業界普遍認為,未來幾年,在大數據獲取、存儲、組織、分析和決策過程中,對應的體系架構、計算模型、數據模型、智能輔助決策模型、性能優化模型及知識服務模型等基礎理論方面,將會出現更多的研究成果。毫無疑問,大數據技術是圖書情報領域無法逃避的未來技術發展形態,也為圖書館實現知識服務模式的轉變、知識管理模式的突破、合作交互型知識、創新模式的完善、知識服務流程的動態監測等業務需求提供了新的思路與解決方案。

目前,盡管大數據技術的研究還處于起步階段,依然還面臨著許多問題和爭議,但隨著市場的發展和信息技術的不斷成熟,圍繞大數據的問題將逐漸得到解決??梢哉f,大數據技術是云圖書館在未來一段時間內的亟待完善和解決的關鍵問題之一,該領域的相關問題也會成為圖書情報領域研究的重點內容之一。大數據技術的發展、成熟與應用更需要業界的共同努力。

相關鏈接

目前大數據還存在幾大核心問題亟待研究解決。

第一,關系數據庫和MapReduce技術有機融合的研究。如何依據不同的大數據處理業務需求,設計同時具備兩種技術優勢的技術架構,在對關系數據庫更深層次了解的基礎上,深入分析MapReduce編程模型內在的局限性和并行計算模型。

第二,對結構化數據和非結構化數據更加復雜的或更大規模的分析。大規模社會計算、大規模社交網絡、時間序列分析、大規模圖分析及更細粒度的仿真等技術仍不夠成熟,需要花費更多時間、精力去探討。

第三,大數據獲取、存儲、組織、分析和決策操作的可視化接口。如何較好地實現大數據處理的各個階段的可視化、智能化、及個性化的展示和操作,尤其是多維數據操作及決策結果評估的可視化的智能展示。

亚洲精品一二三区-久久