前言:中文期刊網精心挑選了大數據時代數據的特點范文供你參考和學習,希望我們的參考范文能激發你的文章創作靈感,歡迎閱讀。
大數據時代數據的特點范文1
【關鍵詞】大數據;信息安全;新特點;新要求
大數據是當今社會科技發展以及產業化發展的融合體,隨著國際化進程的加劇,數據信息的數量、發展規模和流通速度都發生巨大變化,特別是與國際信息的聯接與交互,對我國的外交、經濟、軍事、政治、文化等都產生深遠影響,同時也給我國傳統的信息安全管理帶來了新的挑戰,分析大數據時代的發展趨勢對于探討其特點和要求有重要意義。
一、大數據時展趨勢探討
大數據屬于數據集合,其特點主要表現為:類型多、容量大、應用便利、存取便捷,其發展速度快且管理方法科學已經成為新一代最重要的信息技術。大數據背景下逐漸形成萬物互聯的發展趨勢,這種模式促進了全球經濟的發展,也使新的國際經濟模式發展趨于網絡化、數據化、智能化、共享化、便捷化、互聯化,信息安全也隨之進入到大數據時代。近年來,發達國家相繼推出與大數據相關的國家發展戰略,大數據已經成為經濟發展和轉型的新動力,并為國家發展帶來了新的機遇和挑戰。外國的大數據國家發展戰略為我國發展大數據戰略提供了借鑒經驗,在2014年我國正式提出大數據行動綱領,2016年“十三五”期間,國家將發展大數據作為未來發展戰略,更加明確其經濟意義和戰略意義。在大數據時代背景下,我國的信息安全管理工作也迎來了新的發展機遇,數據實現了線上線下、軟件硬件、人與萬物、政府與行業間的融合、分享、跨越以及滲透,實現了數據間的有效聯接。但是伴隨機遇而來的是挑戰,大數據給信息安全帶來發展的同時也使信息安全管理工作變得更為綜合性、動態性、交織性、復雜性,使人們不得不對信息安全管理工作樹立新的認知。
二、基于大數據時代背景下的信息安全新特點分析
大數據的特點與風險特點極為相像,大數據在發展過程中,給人們帶來便利、驅動、轉型、發現的同時,也給信息安全管理帶來了風險和威脅,并且使信息安全在新形勢下呈現出新的特點。與信息安全傳統模式相比,大數據時代的信息安全其性質、內容、形態、空間、時間都發生一定變化,并且處于重構階段,使信息安全管理呈現出綜合安全、規模安全、跨域安全、泛在安全、隱形安全等特點。1.綜合安全基于大數據背景下,信息安全使協同、整合、互聯、交叉、共生、跨界、雙贏、互動等發展成為大熱詞匯,大量數據信息正在向民生管理、城市建設、產業發展以及行政事務的方向發展,我國的信息安全也呈現出綜合安全的新特點,如何堅持國家的綜合安全觀念,保證我國的人民安全、政治安全、經濟安全、社會安全、文化安全、軍事安全,并依托國際安全,形成具有中國特色的國家信息安全道路,成為我國目前探索綜合安全發展的重點。2.規模安全萬物互聯是大數據時代的主要特征,促使其信息傳播呈現出新的形態,實現了物與物之間的聯接、物與人之間的聯接、人與物之間的聯接以及人與人之間的聯接。隨著互聯網信息技術的發展,中國的網民數量急劇增加,截止到2015年我國的網民數量已經接近7億,其網絡活動的軌跡均被抓取并記錄,數據概念已經滲透到各個領域和各個行業,為人類生產和生活提供數據參考。同時巨量的數據信息在數據中心的匯聚,使數據規?;L險加劇,并時刻威脅著個人的信息安全,例如:黑客盜取個人信息資料等。3.跨域安全隨著經濟全球化的發展,信息、人才、知識等都實現了跨區域傳遞和流通,這些新興模式使我國的數據資料實現了國家間的互連互通,在增加信息交互便捷的同時信息安全的威脅也相應增加。針對跨境信息風險問題,需要國家及時建立跨境數據檢測體系,控制和管理好國家的跨境數據傳導,以實現國家信息安全。4.泛在安全在大數據發展中,由于網絡的便利性使得信息資料可以快速的滲透到各個領域內,且實現了跨國家、跨行業、跨部門,并體現出即時性特點,信息流快速且隱蔽流動,滲透面積強且影響廣泛。筆者認為計算機信息管理已經從靜態管理模式轉變為動態管理模式,并且管理時間要求也更為嚴格。5.隱性安全基于大數據背景下的信息安全主要表現有以下幾點:其一,數據信息呈現出泛濫和冗余的特點,造成“臟數據”過量,導致有價值的信息被淹沒,需要加強數據管理和控制,才能保證有價值信息能夠被及時挖掘,保證其價值發揮。其二,跨境互聯使信息質量產生變化,在進行信息管理中需要進行深度挖掘,以便實現深度分析。其三,移動信息技術改變了傳統的點對面的傳播方式,實現了點對點以及圈對圈的新型傳播,其隱蔽性良好同時也帶來了新的信息安全挑戰。其四,基于大數據視角下的新型線上業務中,存在不法分子線上犯罪現象,由于線上犯罪隱蔽性強,危害性也就更大。
三、基于大數據時代背景下的信息安全新要求分析
(一)管理模式新要求
基于大數據背景下的信息安全管理,要求國家在創新要求的驅動下明確總體安全的理念。在體制上,改變單打獨斗的方式形成新的協同作戰方式;在技術上,改變以往核心技術依賴于進口的局面,加大科技研發力度,實現核心技術自我開發能力;在機制上,將靜態管理手段轉變為動態管理方式;在方法上,改變經驗為主的管理方法形成預防、應對、彌補的管理線路;在傳遞方式上,改變傳統的垂直傳遞方法,形成扁平式傳遞路徑;在人才選拔上,改變了傳統的選拔機制,更注重人才的綜合素質、專業能力、創新能力。
(二)管理路徑新要求
大數據的發展是一把雙刃劍,在給人們帶來信息便利的同時還帶來了眾多的虛假信息以及信息垃圾。為了有效的利用大數據,需要加大數據管控能力,特別是需要進行分布式進行數據觀察,以達到數據信息的合理利用。大數據在發展過程中還存在不完善之處,經常有不法分子利用網絡進行謠言傳播以及煽動是非,造成網民認知混亂,對數據分析缺乏理性。因此,在信息管理工作中要注意科學進行信息管理,做好信息去偽存真工作,還原良好的大數據環境。
(三)管理政策新要求
根據大數據發展特點以及信息安全發展規律,國家機關要及時的進行數據法制化管理,保證我國的數據信息發展可以有法可依,有章可循。采取統一管理方法,在信息開放的環境下實現有效管理,改變以往信息網絡各自為政的現象,通過整合優化實現數據信息價值的擴大,以確保將信息風險降到最低,在網絡信息快速發展的今天,通過有效的法律保障,將個人信息風險最大限度降低,既保證信息流動自由,又保證建立完善的法律保障體系。
四、結語
大數據時代數據的特點范文2
關鍵詞:大數據時代;計算機;信息處理技術
引言
在網絡化技術的不斷普及中,計算機用戶群體的數量也隨之不斷的增加,這種情況的出現導致計算機在運行的過程中不斷的產生大量的數據,促使大數據時代的到來。面對這一發展環境,計算機信息處理技術的發展也顯得越來越重要,并向計算機的數據處理能力提出了更高的要求,此時,要想讓計算機信息處理技術的發展更好的滿足大數據時代的信息處理要求,還需加強對計算機信息處理技術能力的研究,在不斷的探索和創新中提升技術水平,促使大數據時代的計算機信息處理技術能夠得到更高層次的發展。
1 大數據時代和計算機信息處理技術的相關概念
1.1 大數據時代的相關概念
從大數據的概念出發,所謂大數據就是指數據量非常龐大的數據,它不僅局限在數據信息量的巨大上,還表現在數據信息的復雜化、重復化,以及產生信息的多樣化中?,F如今,社會虛擬數據化正處于一個快速而不斷發展的階段,在這種社會環境下,大數據的產生是必然的,并顯示著比傳統計算更多的優勢,如低廉的成本、高比率的資源利用率、較快的運算速度等,并在這種龐大的大數據量中顯示著各種數據之間復雜的關系。社會生活和生產中,面對各種活動所產生的數據,通過大數據能有效的做好記錄與存檔,極大的方便了人們在生活和生產中對龐大信息數據的檢索和應用。同時,大數據還具有超前的洞察能力和決策能力,數據處理能力是傳統數據軟件所不能企及的,對人們的生活習慣產生變革性的影響。
1.2 計算機信息處理技術的相關概念
自計算機在人們的生活和工作中得以應用之后,計算機信息處理技術就在現代辦公和企業管理中呈現著一個非常重要的角色,通過計算機信息處理技術,它將數據傳輸、信息的分析、處理和使用等各種技術結合在一起,極大的便利了數量信息的管理效率。同時,計算機信息處理技術所涉及的領域也比較多。在技術的應用中,它以計算機技術為核心,將傳感、微電子、網絡工程、通信工程等各種先進的科學技術都進行了綜合應用,促使員工在專業社會的協助下,能夠將人、軟件、硬件進行有機結合,不僅促進著人們工作安排的合理性,還促使著人們辦公效率的提升。
2 大數據時代下的計算機信息處理技術分析
2.1 信息的采集與加工技術
大數據來源豐富多樣,需要挖掘、分析和存儲的數據量異常龐大,要提升計算機信息數據處理的高效性和可用性,需加大對計算機信息采集和加工技術的研究。傳統的數據處理方式是以處理器為中心的,這種數據處理方式已經不適用大數據處理,需采取以數據為中心的模式,采取新的處理軟件和處理技術,來減少數據處理中因數據移動所帶來的開銷。
大數據時代計算機信息采集和加工過程中,數據處理速度的提升至關重要,這一需求的實現可通過MapReduce技術。MapReduce是一種并行處理技術,將大量數據處理任務并行分配到多臺連接的服務器進行處理,擴展性強,尤其適合非結構化復雜數據的混合海量處理。作為一套軟件框架,MapReduce以先分后和的數據處理方式為工作原理,分為Map映射和Reduce化簡兩階段,Map將海量數據進行分割,交由多臺服務器并行處理;Reduce將各處理結果進行匯總,得到最終效果。在對海量數據信息進行分隔、任務分解和結果匯總中,實現著海量數據信息的并行處理。
大數據時代,計算機信息采集和加工技術中新方法的應用是多方面的,并體現在不同的信息處理需求中。(1)系統日志采集方法:很多互聯網企業用如Hadoop的Chukwa,Cloudera的Flume,Facebook的Scribe等這些分布式架構工具對系統日志進行采集,每秒采集傳輸速率達百MB。(2)網絡數據采集方法:這種數據采集方法主要應用在非結構化數據的采集中,以網絡數據采集的模式而言,它主要是通過網絡爬蟲和網站公開API的方式,從網站中將數據、文字、圖片、音頻、視頻等多種文件或附件等非結構化數據轉換成結構化數據并存儲在一個統一的本地數據文件中。(3)其他數據采取方法:一般情況下,企業生產經營中的數據和學科研究重點數據,在保密性的要求上比較高,針對這類數據的處理和加工,可采取企業或研究機構合作的方式,采取特定的系統接口展開信息數據的采集和加工。
2.2 信息的存儲技術
計算機網絡信息中,不僅有很多數據文字信息,還有視頻、圖片等大量信息,數據種類在網絡的高度普及中呈現著一種日益豐富、數量急劇增加的趨勢,而這一趨勢的展現更是讓數據的存儲更加凸顯。一般情況下,針對一些大眾化的存儲需求,常規計算機就能滿足,但針對大數據時代的龐大數量,計算機的存儲能力還需更強。大數據存儲中,若采取常規數據存儲技術這會導致資源消耗問題的發生,因此,還需從大數據的基本特點出發,采取最新的存儲手段,以保證大數據信息存儲中的真實性、可靠性和快捷性,而在這些需求的支配下,云技術應運而生。就這一技術而言,它能夠存儲運行多種信息數據,并且能夠在功能齊全服務器的幫助下對數據信息進行有效的處理,有效解決了原有信息存儲技術運行低下、速度緩慢的問題,還能將所得數據信息結構映射到使用者中,明顯提升著數據存儲的效率。
2.3 信息安全技術
在大數據的到來中,人們不僅感受到了計算機信息處理技術給人們生活和工作所帶來的便捷性,還提升了人們對數據信息安全重要性的認知,就大數據時代信息安全性和可靠性的提升而言,其可以通過以下幾個方面展開。(1)建立計算機信息安全體系,加大資金投入,注重對專業技術人才的培養力度,以人才為支撐,為計算機安全體系的發展奠定堅實的技術基礎。(2)加大計算機信息安全技術產品研究和開發力度,面對傳統信息安全技術無法更好滿足大數據時代數據安全需求的情況,相關行業需要加大研究力度,尋找更好的解決方案,盡快改善信息數據運行中所存在的安全問題,有效避免數據信息受到威脅。(3)加強對重要數據的檢測程度,面對大數據時代數據量較為龐大這一突出性的特點,為了更好的提升數據安全系數,實現對每一個數據的檢測,需加強對重點數據信息的檢測力度,全面保證數據信息的安全性,促使大數據時代計算機信息安全技術的不斷發展和進步。
3 結束語
綜上所述,大數據時代的到來給計算機信息處理技術帶來機遇的同時也迎來了挑戰,而隨著計算機信息處理技術在社會中應用廣泛性的提升,其技術的創新也被賦予了新的時代使命。在未來的發展中,面對大數據時代數據信息量的龐大和快速變化性,要想更好的滿足用戶的需求,適應適合的發展需求,還需加強對計算機信息處理技術未來發展前景和需求的研究,不斷的完善不足之處,這樣才能促進計算機信息處理技術應用層次的更高提升。
參考文獻
[1]于沙.分析大數據時代計算機信息處理技術[J].電子測試,2015,1(12):20-21.
大數據時代數據的特點范文3
4月22日,以“大數據重構企業智慧”為主題的浪潮2014新財年企業信息化戰略會在北京召開。浪潮集團執行總裁王興山詳細介紹了浪潮新財年企業信息化戰略――發展2大平臺軟件、提升5大應用產品、深化10個優勢行業、推動100家大企業云落地、聚合1000家合作伙伴,以新思維、新工具、新方法幫助企業用戶用大數據重構企業智慧,推動企業轉型升級。
“大數據正在重構企業智慧,推動企業轉型升級。大數據時代下的企業信息化架構強調云計算、大數據、社交網絡和移動應用,企業正在用新技術不斷顛覆傳統企業的運營模式,幫助企業實現差異化創新。”王興山認為,“在變革時代,需求和技術驅動著中國管理軟件產業的快速發展。與此同時,國產化的春天也給管理軟件產業帶來了巨大的發展機遇?!?/p>
為此浪潮推出了全新的企業信息化新戰略。一是,發揮技術優勢,加強平臺研發投入,重點發展企業云應用平臺GSP+和大數據服務平臺IOP。二是,面向管理創新和新IT融合需求,圍繞管理會計、財務共享服務、電子采購、數據商業分析、移動應用5大熱點領域,提升浪潮GS、HCM、CRM、BA、PS全線管理軟件產品。三是,推動浪潮解決方案在軍工、建筑、制藥、儲備、快消品、裝備制造、采掘、船舶、化工、交通10大行業的深度應用,實施100家企業數據整合業務,全面推動企業管理升級。四是,基于浪潮第四代數據中心平臺,按照浪潮企業云落地路線圖,重點發展企業托管云與大數據整合服務,同時發展以CRM、SRM、HCM、數據分析服務為重點的公有云服務,2014年推動100家企業云落地。最后,進一步加強區域本地化建設,浪潮計劃2014重點發展1000家合作伙伴,提升面向客戶的本地化、專業化服務能力建設。
“浪潮通過自建數據中心、軟件平臺為客戶提供大數據解決方案,企業用戶可以利用浪潮企業云平臺(GSP+)重構傳統應用,實現應用集成及與電商、社交平臺對接;在浪潮BA基礎上利用大數據平臺實現數據整合,建立創新應用;再建立自主商城,借助社交商務實現全渠道協同。”王興山在接受采訪時說。
大數據時代數據的特點范文4
從流程中心論到數據中心論
完善數據管理和服務產品家族
張建設:構建安全可信的信息消費環境是促進信息消費、推進工業化和信息化深度融合的重要舉措。作為國產數據庫的骨干企業,人大金倉為兩化融合做了哪些具體工作?
任永杰:我認為,信息消費包括信息系統和信息安全兩個層面。無論在哪個層面,數據庫管理系統都是基礎,因為任何一個信息系統都需要架構在數據管理系統之上。而人大金倉從一開始就定位于數據領域,雖然企業規模較小,產品卻是核心關鍵產品。
這兩年,人大金倉取得的成績還是很突出的。金倉數據庫產品有在國家電網、金審二期等的關鍵業務應用,有在政府、國防領域的規?;瘧?,還有在銀行、電信、保險等重點行業的新突破。我們曾經統計過,人大金倉產品在各個領域的銷售量已超過35萬套。
張建設:人大金倉的產品和解決方案得到了政府、國防、金融、電信和電力等重點行業的認可,這些行業也是率先涉足大數據、云計算的行業,他們的需求對人大金倉提出了哪些新的挑戰?
任永杰:在與這些行業合作的過程中,我們關注到它們在云計算、大數據方面的新需求,對我們的產品和服務也提出了新的要求。為此,我們確立了致力成為數據管理和服務提供者的經營策略。
面向大數據,我們整合了包括HDFS、Hbase、Map/Reduce、Zookeeper、Hive等核心項目在內的Hadoop技術,提供超大規模并行計算集群能力,能夠輕松構建PB級海量數據管理平臺。
面向云計算,我們采用SOA架構,能夠快速幫助企業構建私有云。同時,我們能夠提供包括資源管理、質量管理、生命周期管理、安全認證管理等在內的云服務。面向OLTP+OLAP混合型應用場景,我們可以為新一代數據中心提供云服務支持。
此外,我們還可以提供支持物聯網業務的高性能數據存儲與管理、數據獲取與洞察服務。
張建設:大數據被視為連接虛擬世界和現實世界的橋梁,云計算被視為大數據落地的重要業務模式。人大金倉在大數據、云計算領域有哪些具體舉措?
任永杰:從應用的角度講,過去依賴流程來做管理和決策,未來將依賴跨部門、跨領域的數據來做決策。原來的數據中心可能有幾臺、幾十臺主機,云計算時代數據中心將有成千上萬臺主機,而且有海量的數據需要管理。為此,人大金倉規劃并研發了集數據存儲與管理、數據分析與集成、數據展現與移動化于一體的產品家族,能夠為客戶提供一站式的大數據產品、解決方案和服務。
我們研發了下一代數據庫,計劃今年年底推出具體的產品和服務。下一代數據庫具有高度可擴展性、高可用和高性能的特點,既能處理結構化數據,也能處理半結構化、非結構化數據。
從差異化競爭到平臺制勝
呼吁構建軟件產業生態圈
張建設:就技術發展史而言,技術層面的馮·諾依曼計算機和關系型數據庫,對應著科學層面的圖靈模型和關系模型,云計算和大數據又將給科學和應用帶來哪些影響呢?
任永杰:我認為,關系型數據庫一直沒有解決或者沒有很好地解決的問題就是分布式計算,這也是我們下一代數據庫要解決的難題。
在這方面,我們很自信,無論概念如何層出不窮,一脈相承的一直是關系型數據庫。在過去的30年中,出現過諸如對象數據庫、對象關系型數據庫等技術,但是關系型數據庫一直是主流。因為關系型數據庫有完善的理論基礎和廣泛的產業技術,而且是一項不斷創新和發展的科學。
張建設:對于中小企業來說,您覺得有多大機會應用到大數據?
任永杰:單個中小企業其實自身不具備管理和使用大數據的能力。因為不管是數據采集、分析還是洞察,都需要很大的資源投入。當然,中小企業可以利用第三方的大數據服務。
張建設:就目前來看,真正力推云計算和大數據的是Oracle、IBM、EMC等,對于國產數據庫企業來說,大數據帶來的機遇和挑戰是什么?
任永杰:現階段來看,大數據給予國內軟件企業的機會很少。當然,大數據有可能會帶來應用層面的顛覆性創新,我們的企業應該有很多機會。
在云計算和大數據領域,幾家國外大型廠商走的都是垂直整合的路線,提供的是一體化平臺和一體化解決方案。而我們的企業通常專注于某一項產品和技術,缺乏競爭力。擁有單個產品和工具,可以為客戶提供特色服務,可能構成企業一定的差異化優勢。但是,在平臺競爭的時代,差異化優勢是微不足道的。因此,我們建議產業鏈上下游企業、價值鏈關聯企業加強合作,以開源、開放的方式,打造一個多方參與的數據管理平臺。目前,我們在數據存儲管理方面就積極主動地開放我們的技術,希望更多的企業一起合作,形成合力。
張建設:這是不是意味著人大金倉將推進同行之間的合作和聯盟?
任永杰:聯合、聯盟和合作將是毫無疑問的選擇,我們甚至去尋找資本層面的合作機會。未來以產業生態圈的方式為客戶提供服務,共同努力解決社會問題。在這其中,人大金倉就是要做數據管理和服務提供商。
從受制于人到自主可控
我們需要堅定的決心、信心和耐心
張建設:在“棱鏡門”事件之后,人們對信息安全、自主可控提出了更高的要求,甚至個別企業和用戶提出了“去思科化運動”。您如何看待這一現象?您覺得人大金倉的責任和使命是什么?
任永杰:“棱鏡門”事件只不過是證實了我們過去的猜測和擔憂。接下來我們該怎么辦呢?首先,我們必須把信息安全、信息的自主可控放在一個非常重要的位置,要從國家戰略層面考慮信息安全。其次,所有企業都應該認識到自身的責任和使命。作為企業的經營者,我們要反問自己,如果不采用這些國外的產品和技術,我們還有沒有別的選擇?第三,也是最重要的,信息化是不可逆的。任何一個新產品和新技術都是在既有產品和技術上發展起來的,任何一套信息化應用系統的升級和更新,都不可避免地建構在現有信息化基礎之上。
我們的KingbaseES產品就提供了強大的數據遷移工具,針對Oracle、DB2、SQLServer、Sybase等為代表的國際主流數據庫產品,在服務器、結構、工具等各組件中全面改進了兼容性,屏蔽了KingbaseES與這些產品之間的差異。這樣的設計減少了現有應用和新應用開發的成本,降低了數據庫系統管理員、應用開發人員等學習和使用KingbaseES的難度。
張建設:作為一家具有央企背景的國產數據庫企業負責人,對于如何擺脫受制于人的現狀,如何實現自主可控的技術創新,您有什么見解?
任永杰:十余年來,人大金倉一直堅持自主創新之路,一直把技術研發放在首要位置。特別是,在牽頭承擔“核高基”重大科技專項的過程中,我們的研發團隊得到了鍛煉,研發能力得到了提升,技術積累更加深厚。擺脫受制于人的困境,必須發展自主可控技術。
首先,我們要有堅定的決心。我們必須做自主研發,也要堅決地支持自主研發的產品。這是我們必然的選擇,必須將它上升到企業和用戶的核心觀念層面。
其次,我們要有堅定的信心。我曾經看到一組數據,我們軟件行業綜合排名前50名的企業累計研發經費還不及IBM一家。在這種情況下,我們不僅要比別的企業更加努力,而且要用好開源這個龐大的資源,群策群力,發揮協同效應。
最后,我們還需要足夠的耐心。無論是技術積累和產品成熟度,還是品牌影響力,我們還有很大差距。我們需要以足夠的耐心鼓勵技術研發,對認可的研發方向要堅定不移地做下去,建議行業主管部門和重點用戶,以足夠的耐心支持和采用自主研發的產品。特別是在一些重大專項上,建議行業部門給予持續的、配套的支持,避免計劃和規劃過多的變動。
大數據時代數據的特點范文5
[關鍵詞]大數據;圖書館;數據處理
doi:10.3969/j.issn.1673 - 0194.2015.18.142
[中圖分類號]G250.7 [文獻標識碼]A [文章編號]1673-0194(2015)18-0-01
1 大數據概述
作為當前的熱門話題之一,大數據(Big Data)已逐步成為國家和政府層面的發展戰略。這一概念最初是2011年由美國麥肯錫咨詢公司提出,認為當前數據已經在各個行業進行滲透,發展為重要的生產因素,預示著將來迎來新一波生產率增長和消費者盈余。此后,大量學者對大數據進行定義,但至今未能達成統一。當前各界對大數據的共識是:大數據的“大”不僅僅強調海量,事實上,其屬性還包括復雜化、多樣化、具體價值化。在此基礎上,互聯網數據中心將大數據的特性概括為種類多、流量大、容量大、價值高四個方面。從這個意義上講,可將其中隱藏的大數據理念概括為:大數據時代信息界主要業務是深層分析數據及挖掘價值、數據形態多樣化且極具價值、數據處理會促使新的產業形成。
大數據在各領域的發展中有著重要價值,就圖書館而言,當前如何采取積極采取措施在制定圖書館發展策略、拓展業務轉型等方面充分利用大數據技術,已成為圖書館行業層面的戰略課題。另外,大數據還會帶來思維范式的變革,便于圖書館行業對當下和未來進行掌控。圖書館利用大數據的思維看待數據資源,能更為準確地察覺讀者信息需求變化,協助圖書館改變管理模式,提升服務質量。
2 大數據時代背景下圖書館發展面臨的機遇
2.1 豐富了圖書館的信息資源
大數據時代,數字出版業務應用越來越廣泛,網絡信息越來越豐富,電子資源呈現快速增長趨勢,這都極大豐富了圖書館的信息資源。根據相關調查研究顯示,國家圖書館數字資源發展到2012年為止,總量已達到813.5 TB,且呈現持續攀升趨勢,當前全球信息總量平均每3年便翻一番,而其中以數據形式儲存的信息占90%。從這個意義上來看,不管是在種類還是數量上,數字資源都逐漸超越了紙質館藏資源。一方面對館藏資源廣度和深度進行拓展,另一方面,還從視覺、聽覺、感官等多個方面來賦予讀者豐富的感受。
2.2 提升了圖書館數據采集、分析、處理技術
大數據時代伴隨著各種先進網絡技術的提升,其在圖書館中越來越廣泛的應用,極大便利了圖書館的數據采集、分析、處理等。比如二維碼技術、無線射頻識別技術等,便于圖書館對數據信息進行采集、處理,深化拓展自身服務,提升服務水平。
2.3 便捷了圖書館的信息服務
在大數據時代背景下,其所帶來的大規模數據處理、數據分析及資源整合等,都促使圖書館信息服務模式面臨前所未有的變革。圖書館的數據基礎有著種類多、速度快、容量大、價值高等特點,可在圖書館內部構件新型的信息服務引擎。一方面更加便捷讀者進行信息檢索,幫助其更為變快速方便地查詢到自己需要的文獻資料,提升資源搜索和利用效率。另一方面,還能從技術層面提供深入開發的條件。
2.4 增加了圖書館讀者體驗
大數據時代,圖書館能利用數據自動歸納和分析讀者信息,更好進行用戶研究及交互數據利用,完善讀者跟蹤服務、科研專業服務、知識關聯服務等,提升服務質量,開展個性化服務,使讀者感受到個性化體驗,促使圖書館從以往的以資源為核心,轉變為以讀者為核心。
3 大數據時代背景下圖書館發展面臨的挑戰
3.1 增加了數據處理難度
大數據時代數據呈現出種類多、速度快、容量大、價值高等特點,且隨著多樣化的數據生成方式的形成,數據類型也越來越復雜。相關研究顯示,當前非結構化數據已超過80%,相較于傳統的結構化數據而言,其無用信息量增加,組織相對凌亂,因此,圖書館面臨的一大問題就是如何從大數據中采集分析并向讀者推送有潛在價值的數據。而這一問題實現的關鍵,是強大的軟硬件支持。部分圖書館資金匱乏,并未構建能適應大數據的軟硬件設施,技術落后,數據查詢及分析能力低,不能滿足要求。因此,新時期,圖書館必須加強軟硬件基礎設施建設,提升技術水平和數據處理效率。
3.2 增加了網絡構架要求
多數圖書館仍采用傳統的垂直網絡架構,即由讀者端向服務器發出檢索或查詢請求,由服務器將相關結果直接發送給讀者。這種架構雖然取得了一定成效,但在應對大數據時代種類更多、容量更大的數據資源時就顯得力不從心,逐漸被水平的橫向請求取代。一旦讀者發揮相關服務請求,各個服務器之間快速進行信息傳遞與交換,及時將數據處理結果返回給讀者。因此大數據時代背景下,傳統垂直網絡結構已不能滿足需求,這就要求圖書館加強網絡構架的革新和改進,建立新型知識服務引擎,形成更為靈活、智能、交互的信息資源組合方式,提升圖書館服務質量。
3.3 增加了專業人才需求
大數據對專業人才的要求更高。但是當前全球的大數據人才均處于緊缺狀態,我國尤為嚴重?,F階段,我國多數圖書館工作人員在理論認識和技術實踐上都存在很多問題,阻礙了圖書館的進一步發展。因此,新時期,圖書館必須重視對大數據專業人才的培養和引進,加強對現有館員的大數據知識宣傳及教育培訓,夯實人才基礎,積極應對大數據帶來的挑戰。
4 結 語
大數據時代不僅給圖書館行業帶來發展的機遇,還帶來一系列挑戰。新時期,圖書館必須積極迎接機遇,應對挑戰,加強基礎設施、專業人才等方面建設,提升圖書館管理服務水平,提升核心競爭力。
大數據時代數據的特點范文6
關鍵詞:大數據時代;大數據;統計學;
一、大數據與統計學
(一)大數據與統計學關系密切
簡單來說,我們可以分為兩個方面來理解大數據:若“大數據”作為形容詞,則描述的是大數據時代數據的特點;若“大數據”作為名詞,則體現的是數據科學研究的對象。對大數據的定義有非常多,不同領域不同專業對大數據的界定都會有些許不同。通俗地說:大數據是目前人類所有可抓取、可記錄、可存儲的信號集合。這個包含了一切信號的集合將非常非常之龐大、多樣、繁雜,并且還在不停地、迅速地增加?,F代互聯網和信息技術的飛速發展,使得人類開始有能力收集、儲存、分析、處理這些從前無能為力的數據,從中挖掘出有用的信息促進社會的發展。邁爾•舍恩伯格說:大數據發展的核心動力就是人類測量、記錄和分析世界的渴望。而統計學正好是收集、整理、分析、解釋數據并從數據中得出結論的科學。由此可見大數據與統計學關系密切,將大數據與統計學結合發展潛力無窮。
(二)大數據時代下的非結構化數據與結構化數據需整合
對接統計研究可根據自身的目的收集總體數據或樣本數據,但如果總體太過龐大,以過去的技術方法來收集總體數據成本會很高,受于限制統計研究更多收集得是樣本數據。如今,人類已經開始能夠在合適的成本下獲得大數據,大數據的廣博給統計研究帶來了新的發展方向。我們需要著重研究的一個方向就是如何將結構化數據和非結構化數據對接。大數據的核心是數據,統計學的研究對象也是數據,但是它們獲得的數據性質有所不同:大數據收集的多是半結構化和非結構化的數據,通俗地理解,先獲得數據,再整理結構(如聲音、圖片、視頻等信息);傳統統計學收集則主要是結構化數據,先定好結構,再根據目標結構收集數據(如數字、符號等信息)。拿非結構化數據和結構化數據來說:大數據時代使得我們有更多可以分析利用的數據,使得統計研究不僅可以在有更多的結構化數據的情形下進行;對于一些領域的研究工作還可以設法將非結構化數據和結構化的數據結合起來分析。如何實現非結構化數據與結構化數據的結合?首先,完善非結構化數據的整合,然后我們可以用結構化數據做數量說明,非結構化數據加強描述;或是提高數據處理技術,實現結構化數據與非結構化數據的互相轉化,選擇能更好說明問題的數據形式作為后續分析基礎。這都是值得再深入思考研究的新問題,而且這不僅僅是大數據和統計研究的事,同時需要計算機技術的一同創新發展。統計研究的范圍在大數據時代越來越大,能用數據說明的問題越來越多。
(三)大數據時代下的相關分析與因果分析發展并重
《大數據時代》一書中表示:大數據時代的一個顯著變化是:相關分析比因果分析更重要。我的看法是:大數據時代下,市場確實會對相關分析有著更強的關注度,但這并不意味著因果分析的重要性會有褪色。統計學中既有相關分析,也有因果分析,要對它們有合理的了解,首先需要明確的是相關關系和因果關系之間的聯系,簡單說:有相關關系不一定有因果關系,有因果關系則一定有相關關系。大數據時代,相關關系變得比以前更加為人所關注的原因:一方面,在很多領域的應用里,相關分析比因果分析更簡單可行;另一方面,因為相關關系足以體現事物之間的一定聯系,在商業效益上更為經濟有效。因此在商業利潤的推動下,相關關系也會更加受到青睞。但是我們不能就此否定因果關系的重要性,因果關系是對數據更加深度地分析:相關關系讓我們知道了“是什么”,因果關系是讓我們知道了“為什么”。倘若只是在商業經濟上的利用和成本考慮,“是什么”在很多時候就以足夠;但如果是在科學研究領域,“知其然而不知其所以然”就遠遠不夠了。結合現實發展需要,可在分析確定相關關系后,根據情況研究因果關系,若能夠得出因果關系,那肯定是更具價值和意義的。探求“為什么”始終是人類探索世界的動力,因果分析是人類永恒的使命。
二、結語
大數據時代的到來幾乎對每個領域都有著不可忽視的影響。大數據與統計學關系密切,大數據的出現對統計學的意義是非凡的,我們應把握住大數據時代和統計學的可結合點。其一,完善非結構化數據的整合,深入研究如何實現非現結構化與結構化數據的對接,都需要我們思維上的創新、數據處理技術上的提高。其二,在注重相關分析的同時,不能丟掉對因果分析的研究,應合理并重,實現大數據的進一步利用,真正挖掘出數據的價值。對于以數據為研究對象的統計學科,大數據時代就是統計學變革創新的時代,統計研究工作人員也應把握機會思考創新,為統計學增添新的生命力。
參考文獻:
[1]朱建平,張悅涵.大數據時代對傳統統計學變革的思考[J].統計研究,2016(02):3-9.
[2]朱建平,章貴軍,劉曉葳.大數據時代下數據分析理念的辨析[J].統計研究,2014(02):10-19.