前言:中文期刊網精心挑選了數據治理范文供你參考和學習,希望我們的參考范文能激發你的文章創作靈感,歡迎閱讀。
數據治理范文1
Ron Ben Natan 博士是IBM Guardium公司副總裁兼首席技術官,一位軍人出身、有著20多年數據安全領域從業經驗的專家。2009年隨著IBM收購Guardium而進入IBM。大數據是這位安全專家新近重點關注的領域。自然,作為安全專家,Ron Ben Natan博士的視角還是落在大數據的安全、審計等與數據治理相關的問題上。
在Ron Ben Natan看來,隨著大數據熱的持續升溫,大數據的應用開始從互聯網企業向金融、電信、制造等傳統企業滲透,安全和審計需求正在逐步顯示出來,如何在充分挖掘大數據潛在價值的同時確保企業信息的安全與合規開始引起業界的關注。
大數據的安全隱患
大數據為數據分析開啟了一個新的世界。以Hadoop為代表的大數據處理平臺利用開源軟件結合通用服務器實現了商業智能,大大降低了商業分析的門檻,從而惠及了更多普通的中小企業。然而,由于大數據是一種數據集中存儲的方式,這種集中存儲也給企業的信息安全帶來更高的風險。
“總結過去有關數據安全的事件,90%以上都與數據庫相關。應該說,把好了數據庫的安全關,大部分數據安全的問題也就基本解決了。如今,大數據面臨的安全風險與數據庫是非常相似的?!盧on Ben Natan說。
Ron Ben Natan解釋說,目前來看,大數據的安全問題還不是特別突出。原因在于早期的大數據用戶主要是互聯網公司,比如谷歌、亞馬遜以及一些電子商務網站,其應用側重于對用戶上網后的點擊行為進行分析,用于了解用戶對品牌的偏好、挖掘新的商業機會等,其安全問題還不突出。不過,隨著大數據的用戶向更多行業和領域進行擴展,比如,在金融和電信領域,一些大數據應用就涉及用戶的隱私,此時,安全問題就會顯現出來。
“即使在互聯網公司,也不能說大數據的安全就不重要。實際上,如果社交網站把用戶的一些網頁瀏覽行為等信息泄露出去,也可能帶來非常不好的結果,至少會引發用戶對它的不滿和不信任,最終可能導致客戶的流失?!盧on Ben Natan說,比如,Facebook現在有超過10億用戶,它如果出現安全漏洞,可能影響這10多億的用戶,其影響是很大的,因此,這類互聯網公司對數據安全也有很高要求。
來自合規的推動力
就大數據的安全而言,除了確保數據本身的安全這個需求外,合規也是一個重要的推動力,尤其是對一些上市公司而言。
“一些用戶常常只是重視數據本身的安全需求,而較少注意到合規。其實,不少法律、法規都會對數據安全有著嚴格的規定,保證合規也是確保信息安全的重要手段?!盧on Ben Natan表示。
Ron Ben Natan認為,合規和安全本身追求的目標本質上是一樣的?!盀槭裁次覀儠贫ǚ伞⒎ㄒ帉Π踩M行監管,就是因為過去曾出現過數據泄露。比如,過去幾乎所有數據的泄露都是發生在數據庫,所以相關部門制定了很多法律法規來專門針對數據庫的安全?!?/p>
Ron Ben Natan表示,大部分的法律法規提出的各種合規要求不只是確保數據安全,還會要求監控對數據庫的訪問行為,這一點對像APT(高級持續威脅)這樣的攻擊行為非常關鍵。如果不監控數據的訪問行為,數據可能泄露很長時間了都不知道。比如,APT攻擊發生后,數據非法訪問就可能會持續很長的時間。
借鑒數據庫的最佳實踐
目前,大數據相關技術還處于發展過程之中,因此,大數據的安全技術也在繼續演進,好在過去幾十年來,人們在數據庫安全方面積累了非常豐富的經驗,這些寶貴的最佳實踐完全可以復用到大數據的安全方面,這也正是Guardium將業務從傳統數據庫領域拓展到大數據的重要原因。
Ron Ben Natan介紹說,Guardium從10年前成立以來在數據庫安全方面積累了豐富的經驗,也有著很多的相關產品。通過這些產品可以實現從用戶、應用服務器到數據庫的全程跟蹤即可記錄,實現對數據的全方位準確監控(來自網絡的訪問和本地登錄訪問),確保企業對 SOX、PCI等法律的合規。這些行為不依賴于數據庫的日志,對數據庫服務器性能影響極低,大大優于數據庫本身的審計產品。因此,擁有非常多的用戶。
“此前,Guardium專注在數據庫的安全,如今我們延伸到大數據,為大數據的軟件環境提供。這個過程中,我們把過去在數據庫方面學到的經驗和教訓,應用到大數據的環境里面?!?Ron Ben Natan表示。
實際正如Ron Ben Natan所言,Guardium已經把這些經驗復制到大數據解決方案中。比如,在其大數據安全解決方案中同樣首先要保護敏感數據,監控特權的用戶,包括授權用戶、管理員等。
數據治理范文2
數據治理體系概述
具備高度信息化管理能力,是國內銀行向“以客戶為中心”轉型的要求,是銀行業務決策、客戶營銷、內控管理向精細化發展的要求,是發揮風險管理技術應用價值、共享全行風險管理經驗、全面提升風險管理能力的要求。隨著信息科技的日益發展,銀行多年來為實現業務自動化處理建設了龐雜的IT應用系統,存儲在這些應用系統中的海量數據為銀行實現信息化管理提供了堅實的基礎。比如非零售信貸風險中的違約率計算、財務分析等,零售信用風險中的催收打分卡、申請打分卡等,市場風險計量、操作風險事件識別等,高級風險技術中的經濟資本計量、風險調整后資本收益率(RAROC)計算等相關指標考量,都需要銀行對客戶、客戶集團、交易、合同、市場信息、產品、財務甚至IT系統操作信息等3~7年的數據積累以及整合與應用。如何為精細化管理提供高效、高質的數據支持,數據治理由此成為商業銀行面臨的重要課題。
商業銀行數據治理的內容,主要包括建立數據治理機制、數據管理制度及流程,以及數據標準制定等。數據治理的最終目的是提升數據質量,通過有效的數據整合、數據應用與數據服務使企業真正具備業務信息化管理能力。其中數據應用與數據服務包括面向財務管理、風險管理、績效考核、客戶營銷四個方面的支持。
構建全面的數據治理體系,需從組織架構、管理流程和操作規范、IT應用技術、績效考核支持四個緯度,對企業數據模型、數據架構(包括數據倉庫、數據應用)、數據管理(包括數據質量、數據標準、元數據管理、數據安全等)、數據生命周期等各方面進行全面的梳理、建設并且持續改進。可以簡單概括為:明確數據治理主體、建立數據質量標準、加強數據生命周期的全過程管理。
銀行數據治理實踐探索
數據治理歷程與規劃
自2005年始,光大銀行用六年完成了企業級基礎數據平臺(即數據倉庫EDW)的建設,并整合了核心系統、對公信貸系統(CECM)、個貸系統、網銀系統、國際結算系統等41個源業務系統數據,在有效整合全行數據的同時完成了銀監會非現場稽核報表(1104)、人行大集中、信用卡BI、電子銀行BI、信用風險集市、風險加權資產(RWA)、資產負債等19個數據集市和應用的建設。
伴隨數據倉庫和數據應用的建設,光大銀行制定了數據標準的五年規劃并展開實施,秉承定義、執行、監督檢查三者并重的原則,先后完成了客戶、產品、渠道、交易、關鍵統計指標、內部機構以及風險主題數據標準的定義。2009年基于客戶數標準,推進全行對私統一客戶管理系統(ECIF)的建設。2010年基于風險新資本協議相關數據標準推進了RWA數據集市建設。2011年完成了全行渠道類型數據標準在各交易系統中的落地改造。鑒于數據標準實施的難度,未來光大將持續落實數據標準實施規劃,做好數據標準系統落地以及監督評價工作,并結合數據質量管理、數據應用與數據服務的要求準備下一個實施周期的規劃。
數據治理組織與規范
為保障全行數據治理相關工作推進,光大銀行從下到上由幾個層面的組織構成:第一層面由數據使用相關各業務部門組成,它們負責本條線的數據標準制定和數據質量管理,例如風險管理部設立了數據管理崗,專門負責數據管理相關工作;第二層面是由計財部、科技部組成,它們是銀行IT戰略委員會下設數據標準小組的牽頭管理部門,負責數據標準實施的管理和組織推動,以及數據質量的綜合管理;第三層面是審計部,負責數據管理、數據應用、數據服務過程的審計、監督、評價;更高層面是董事會和行領導的關注,審計委員會和風險管理委員會的明確了相關職責。
隨著數據倉庫以及數據標準的實施,光大銀行逐步制定了數據治理相關管理規范,最終落實在數據標準和數據質量的績效考核指標上。只有合理制定數據治理相關考核指標并切實推進到業務基層,才有可能從數據產生開始實現對數據的真正治理。例如光大銀行已經制定的風險數據補錄質量考核指標、對公客戶信息準確性考核指標等。
數據治理應用與管理
一般包括數據倉庫、數據應用、數據服務、數據管理(包括企業元數據管理、數據標準、數據質量管理等)等技術平臺的建設和應用。光大銀行在建設數據治理相關應用過程中,充分結合數據標準的落地,使數據在整合、應用以及管理過程中實現統一標準管理(見圖)。
數據治理助力風險管理
數據治理機制使風險管理有數據可依,也使高級風險技術發揮真正價值。首先,風險數據集市支持RWA的整合計算。風險數據集市是建立在數據倉庫基礎上面向全行風險管理主題的數據集合,是全行風險管理數據分析、業務決策的重要數據基礎。同時,整合數據支持風險偏好評估管理。銀行風險偏好計算評估是內部資本充足評估流程(ICAAP)的重要組成部分,風險管理通過風險限額、準入管理等方式對業務發展進行控制和調節,資本管理通過經濟資本分配以及績效考核等手段在各業務線、產品對資源進行最優配置。數據倉庫以及風險數據集市為風險偏好計算評估提供了高效、準確、整合的信用風險、市場風險、操作風險以及計劃財務的數據支持。
關于數據治理的思考
如何評估銀行的數據治理能力,目前可以通過信息導向架構進行初步衡量。該架構包括數據文化、數據管理能力、數據應用建設能力三個方面,其中數據文化是衡量銀行從組織層面是否具備信息化管理能力,也是數據治理體系實施是否成熟、是否成功的重要衡量標準。
培養業務管理信息化
銀行高層管理人員應適應業務精細化管理的要求,培養依靠數據信息進行業務管理決策的意識和習慣;中層業務經理要養成用數據信息分析業務、分析客戶,依靠數據信息進行業務創新思考的習慣,并具備基本數據分析的能力;基層業務人員要培養信息收集的習慣,應具備在日常業務操作中保證收集信息的數據質量和數據安全的意識;同時,人力資源和績效考核部門需通過制定信息管理培訓計劃以及涉及信息管理績效考核指標與相關獎勵機制(如信息收集、數據質量提高等都需要通過績效和獎勵來激勵一線員工執行),幫助和促進信息化管理文化在銀行各級機構層面的落實。
建立數據治理長效機制
管理層應對數據治理予以高度重視,在梳理并完善企業數據體系架構的基礎上制訂長效機制,確定適合銀行文化、高效的數據治理管理組織架構。采用虛擬組織與實體部門相結合的管理模式,有利于數據治理過程中的橫向協調和縱向有效落實;定期重檢數據治理相關制度、流程、規范;規劃與評價并重,合理規劃是復雜的數據治理過程有序進行的必要保證,定期評價回顧規劃落實,根據評價結果及時調整規劃策略是數據治理真正發揮價值效能的必要手段。
堅持信息科技建設創新
將先進的科學技術快速應用于數據管理與數據服務中。例如,研究并建設集數據服務、數據管理、數據分析共享社區為一體的開放式數據服務平臺,為實現全行業務信息化管理提供應用支持。
數據治理范文3
關鍵詞:大數據;稅收治理;隱私保護
一、引言
稅收工作是關乎國計民生的大事,其科學性和合理性直接影響著國家發展、社會穩定和民生保障。信息化時代背景下的稅收治理工作充分發揮大數據等信息化技術的優勢,提高了稅收治理宏觀控制的同時卻忽視了對納稅人隱私的保護。以我國新個稅法為例,其體現了稅收政策與時俱進、以人為本的理念,但也出現了納稅人隱私暴露等問題。根據我國現狀,對大數據下稅收治理的隱私保護問題進行分析研究,成為社會各界討論的焦點。
二、納稅人隱私權概述與理解
所謂的隱私權,是法律賦予公民所享有的私人信息以及生活中受法律保護的,使公民不會受到非法侵擾的權益,公民隱私權的一個重要前提是必須與公共利益無關。隱私權是法律賦予公民的一種相對獨立的人格,其主要包括了公民隱私的保護權益、使用權益、支配權益和救濟權益。納稅人隱私權是法律賦予納稅人所享有的上述內容,稅收機關在依法采集和保存納稅人隱私信息的同時,有義務對納稅人隱私信息進行依法保護和管理。通常情況下納稅人隱私權是針對自然人而言,而法人納稅人的信息歸為商業機密范疇內,對于法人納稅人中涉及的企業股東、法人代表、管理層等自然人的隱私信息同樣屬于納稅人隱私權的范疇。
三、大數據下稅收治理的隱私保護現狀
在我國目前的稅收治理體系中,納稅人的證件號碼、工作單位、家庭住址等個人信息以及家庭成員信息等內容均應在稅收機關對納稅人隱私保護的體系范圍之內,當然除此之外的財產信息也都屬于納稅人的隱私。但是比較復雜的一個問題是在對于隱私權利邊界的確定上,很難給予一個明確的定義,隱私保護的主要目的是為了保護納稅人的個人權益不受侵害,尊重納稅人的人身自由。因隱私權的邊界確定問題,致使大數據下的納稅人隱私保護方面問題比較突出。1.稅收機關定位不清晰,納稅人隱私保護權責關系模糊。我國稅收政策經歷多次調整,每一次調整都是在與時俱進、以人文本的基礎上對稅收政策的變革和創新,但經歷多次改革和創新的稅收政策始終沒有在稅收征管方式上有所變化。稅收機關工作過程中對于自身的定位模糊不清,致使民眾和社會經濟體依法依規納稅的主動性和積極性受到了影響。大數據下的稅收工作為了提升納稅人的主動性和積極性,在獲取納稅人的納稅信息后會對信息內部的邏輯性進行分析,確定和發現規律,以便于稅務機關工作的開展。同時,這些納稅信息會在財政、人力資源等部門以及行業內進行流動和分享,以保證稅收的公開透明。從隱私保護的角度出發,這種情況無疑使得納稅人隱私存在很大的泄露風險,或者說這種行為本身就是對納稅人隱私保護不到位的體現。隨著全社會對隱私權保護重視程度的不斷提高,一些地區的稅收機關已經認識到該問題,但由于對納稅人隱私保護的權責關系不明確,致使各部門之間存在相互推諉扯皮的現象。2.法制建設滯后,稅法中對納稅人隱私權的保護存在空白。我國現行的稅收政策中,稅種是由相關部門所制定。從法律體系上看,某一個部門制定的稅種其法律地位有待商榷。而隨著建設步伐的不斷加速,我國的社會主義經濟市場發展十分迅速,市場經濟呈現欣欣向榮的景象;市場經濟的快速發展也使得其多樣性和復雜性有了明顯提升,而與之相關的稅法卻并沒有做出與時俱進的調整。所以就目前的情況看,我國的稅法建設已經滯后于社會經濟發展。稅法建設的滯后性增加了稅收治理過程中的不確定性,使得稅收治理的風險性也隨之增加。大數據技術在稅收治理中的積極作用毋庸置疑,但是大數據技術也對稅收數據提出了較高的要求。以稅收數據的采集和共享為例,數據的流動和共享勢必會增加數據丟失、盜取的風險,而我國目前的稅法并沒有對大數據下稅務數據管理在權責上進行明確的規定,這使得納稅人的隱私保護受到了很大威脅。我國稅法中在納稅人隱私權保護上存在空白,稅法建設和完善還有很大的提升空間。加強稅法建設的與時俱進、提高稅法建設的社會發展導向是大勢所趨。3.稅收治理格局停滯不前,隱私權保護參與度較低。我國稅收治理格局中,稅收治理的主體是稅收機關和納稅人,協稅護稅組織由財政、審計機關組成。就目前的情況看,我國的協稅護稅組織建設存在一些問題。例如,協稅護稅組織成員缺少社會組織和民眾的參與;審計、財政等部門對于協稅護稅的意識和工作定位不明確;協稅護稅組織內部管理制度不健全等。目前的協稅護稅組織主要來源于政府的財政和審計機關,其在稅收治理的專業性上存在一定不足,加之協稅護稅意識不高,其在提高納稅人依法納稅意識、監督審查納稅人依法納稅情況、稅收數據和信息管理與監督等方面發揮的發用非常有限。納稅護稅組織建設上的一系列問題,使得其作用發揮有限,有的地區甚至形同虛構,納稅護稅流于形式。稅收治理格局發展停滯不前,使得納稅人參與稅收治理的機會寥寥無幾,而且納稅人對稅收治理的認知度并不高,對于納稅治理中的納稅人隱私保護更是知之甚少。4.信息技術自身發展不足,納稅人隱私管理存在風險。以大數據為代表的信息技術的應用很大程度上提高了稅收治理的現代化,保證了稅收的質量和效率,但是其帶來的風險和問題同樣不可小覷。稅收治理中的大數據、云計算等信息技術的運用都是依托互聯網,而在互聯網下的納稅人信息的采集和共享有可能受到網絡病毒的攻擊,互聯網下的納稅人信息存儲也可能受到黑客的惡意竊取,從而導致納稅人隱私泄露。加強大數據技術應用的同時,提高其安全性和穩定性成為大數據下稅收治理工作可持續發展的重要方向。
四、大數據下稅收治理的隱私保護應對舉措
大數據下的稅收治理實現了數據治稅,工作人員通過大數據技術能夠快速準確地采集納稅人的相關數據后對納稅信息和數據進行分類、分析和計算,并利用互聯網和移動通訊實現數據的流通和共享。在數據流通和共享的基礎上,稅務系統還可以實現納稅人管理、稅務申報和支付,進一步凸顯了信息化技術對稅收治理在效率和質量上的重要性。1.加快稅務行政職能的改變,進一步明確納稅人的責任。納稅人作為稅收治理的主體之一,也屬于協稅護稅的主體。稅收部門有責任保障納稅人對稅收治理過程中的知情權,在稅收治理過程中的相關工作要保持公平公正、公開透明的辦事原則,加強對依法依規納稅的宣傳和推廣,建立納稅人誠信納稅系統,并同其他誠信體系進行關聯,以此來促進良好納稅環境的建立。政府職能轉變下,稅收部門的職能也要做出相應的改變,以呼應政府職能轉變。大數據下的稅收治理可以對納稅人的歷史納稅信息以及納稅時間進行有效的管理。鑒于此,稅務部門需要進一步健全納稅人管理,學習社會其他組織的管理經驗。例如,建立納稅征信系統并與銀行等第三方的征信系統連接,將存在偷稅漏稅行為的納稅人列入失信名單;將法律規定的納稅期間進行劃分,不同的納稅期內采取一定的優惠政策;對于未能按時納稅的納稅人,通過納稅系統,將其信息提交給執法機關,由執法機關依法對其進行處罰等。稅收機關職能的轉變要以規范納稅人的行為,提高納稅人依法依歸納稅的積極性和主動性為目標,保證稅收政策的有力貫徹與執行。2.健全和完善稅法體系,提高稅收治理的法制性建設。納稅人隱私保護同樣屬于稅收治理的范圍內,健全和完善稅法體系,進一步明確納稅人隱私邊界問題,并對納稅人隱私保護制定相應的法規制度是提高納稅人隱私權保護力度,提高稅收治理法執建設的關鍵舉措。稅法中對納稅人隱私保護上的空白,使得納稅部門在對納稅人隱私信息保護中缺少相應的法律依據,通過健全和完善稅法,使得稅務部門對于納稅人隱私信息保護能夠有法可依、執法必嚴、違法必究。大數據技術為稅收治理質量和效率提升帶來了便利,但大數據下的稅收治理同樣要在法律規定范圍內開展,健全和完善稅法體系,同樣有利于大數據在稅收治理中的作用發揮。例如,稅法中應對稅收系統的安全性建設作為明確的規定,對保存納稅人信息的數據庫在安全等級、風險抵抗能力上進行要求,利用法律的約束性提升稅收系統的安全性。3.強化稅收治理的監管,提高納稅人隱私保護力度。大數據下的稅收治理中對納稅人隱私權的保護,除了要通過法律體系的建設來提升外,還要在稅收治理的監管上提高保護力度。稅收部門作為稅收治理的主體,要加強自身對納稅人隱私權保護的力度,建立納稅人隱私權保護制度,對納稅人隱私保護進行細化,明確隱私內容、懲罰措施以及法律責任;對于內部分工作人員惡性泄露、販賣納稅人隱私信息的情況,要加大處罰力度;稅收部門應該積極地開展社會公眾監管,建立網絡維權和電話維權,鼓勵民眾通過互聯網和電話熱線對惡意泄露納稅人信息的行為進行舉報。在加強對稅收治理監管的同時,稅收部門要培養和提升工作人員對納稅人隱私保護的意識,通過講座和培訓,提升工作人員對隱私權保護的認知和理解,加強其對保護納稅人隱私信息的重視程度。4.大力發展第三方協稅護稅組織,提升稅收治理質量。第三方協稅護稅組織的成立和加入,對于提升稅收治理的質量,防范稅收治理中存在的風險具有積極作用。第三方協稅護稅組織同財政、審計部門雖然同屬于協稅護稅組織,但因為自身性質的不同,其可以有效地開展內部監督,促進各方主動履行職責。在納稅人隱私保護上,第三方協稅護稅組織處于社會組織的位置上,對于稅收治理中的納稅人隱私保護中存在的問題看得更全面、更清楚,對于其產生的原因以及治理措施會有更加獨立的見解。雖然第三方協稅護稅組織的加入對稅收治理具有積極的影響,但必須加強對其管理,以使得其作用能夠得到充分的發揮。政府要建立嚴格的協稅護稅組織準入機制,完善對協稅護稅組織的管理制度、行業標準,規范其行為準則;同時政府要加大對協稅護稅組織的監管力度,建立獎懲措施,引導其正確履行自身職能。5.加強信息化新技術的應用,提高稅收治理中隱私安全性。大數據下的稅收治理工作需要完善的稅收系統作為支撐,完善的稅收系統不僅具備納稅人管理、稅費繳納和支付、稅務信息采集與處理等功能,還要具備強大的安全管理功能。加強對現階段稅收系統的建設,要借助大數據技術在數據采集、匯總、分析上的優勢,對稅務治理中存在的風險進行有效防控。同時,要完善納稅人信息數據庫的建設,加強數據庫安全方面的投入和對納稅人信息安全性的管理。數據庫安全管理中,需要對納稅人隱私邊界進一步的明確,制定納稅人信息查閱制度,明確哪些人可以查看納稅人信息,能夠查看哪些納稅人的信息,能夠查看納稅人的哪些信息;納稅人信息查閱制度要對信息管理部門的工作職責進行明確,提高管理部門對納稅人信息安全性的重視程度。
參考文獻
1.湯火箭,宋遠軍.大數據時代個人所得稅征管中第三方涉稅信息共享制度研究.稅務研究,2020(01).
2.金元浦.論大數據時代個人隱私數據的泄露與保護.同濟大學學報(社會科學版),2020(03).
3.馬偉杰.對實施大數據治稅的幾點思考.中國稅務,2019(12).
數據治理范文4
《綱要》體現了國家層面對大數據發展的頂層設計和統籌布局,為我國大數據的應用提供了行動指南,最終目的就是利用大數據提升全民數據意識、發展數據文化、釋放數據紅利、打造數據優勢。相較以往,此次發展的目標更明確,內容更全面。《綱要》對大數據的定義是,以容量大、類型多、存取速度快、應用價值高為主要特征的數據集合,正快速發展為對數量巨大、來源分散、格式多樣的數據進行采集、存儲和關聯分析,從中發現新知識、創造新價值、提升新能力的新一代信息技術和服務業態。大數據不等同于海量數據的集合,而是可被利用的海量數據集合。同時,大數據應具有以下特征:
第一,大數據可以創造價值。根據已有的數據發現聯系是大數據能夠創造價值的基礎。2012年達沃斯論壇的報告《大數據 大影響》宣稱,數據已經成為一種新的經濟資產類別,就像貨幣或黃金一樣,叫數據資產,它的價值賽過黃金。當前,大數據已經在政府公共服務、醫療服務、零售制造等各個方面得到廣泛應用,而且產生了巨大的社會價值和產業空間。
第二,大數據推動數據共享開放。大數據時代政府需和各個社會組織、社會主體合理共享,在共享最新數據的基礎之上,發揮各自的發展優勢,深度挖掘數據的價值。數據的共享開放可以讓政府少管一些事情,節省很多的人力,同時也能解決大部分公共事務信息不對稱問題。
第三,大數據可以預測未來。大數據是以分析大量數據的相關性為基礎進行預測,這是大數據不同于海量數據的最重要的特征。在掌握數據的情況下,才能做出科學的預測,才能做出正確的預判。當前,大數據可以對人們的需求、災害、犯罪的發生等問題進行分析預測,有了大數據作為支撐,各類商業服務和社會服務將更為精準有效。
二、大數據對社會治理環境的影響
隨著互聯網、云計算、大數據的發展,政府面臨的社會環境將會更加復雜,社會治理方法也會更加多樣。社會治理環境的變化主要集中在:①政府所處的社會環境將更加開放,并且將更為深刻地遭遇到互聯網、大數據等方面的影響和沖擊;②社會治理的方法將更加統一高效,大數據將在治理過程中發揮決定性作用,而政府權力將會進一步收回,交由社會組織配置;③社會環境的變化將更加全面和系統,政府將在更加民主、法制、開放的社會環境下進行治理。
互聯網技術的發展突破了時間和空間的限制,催生了大數據的生成。大數據對社會治理發展趨勢的影響主要集中在治理環境和治理方法這兩個方面,并表現出以下幾個特征:
其一,大數據使社會治理環境變得空前開放和自由,社會治理環境的改變要求政府必須樹立開放的社會治理理念。首先,在大數據時代,人們查詢數據的途徑已經不再只依賴官方網站,這樣就倒逼著政府必須實現真正的開放和透明。其次,在大數據時代,公民發表自己的觀點和評論非常簡單且易于搜集,過去帶有較強政治性的參與逐漸演變成了一種普遍性的公民參與,這種參與會為政府的下一個決策進行引導。最后,大數據拓展了社會治理的范圍,并使社會治理更為精準化。由于信息的雙向交流,大眾的廣泛參與,社會管理模式從以往的方格化演變為網絡化,從而使政策制定更為人性化。政府要掌握、整合和協同各種類型的基層數據,建立服務型政府。
其二,大數據有助于形成統一高效多樣的社會治理方法,使社會管理領域的公共政策實現精細化和科學化。首先,大數據時代對政府理念的影響是包容,大數據里的數據類型非常多,而且來自方方面面,政府需要將這些數據整合起來,去包容和協同。其次,大數據時代最大的轉變是放棄對因果關系的渴求,而關注相關關系。換句話說,現在只需知道“是什么”,而不需要知道“為什么”。再次,大數據時代似的政府決策更加科學和高效。大數據促使社會治理更加及時,因為大數據有助于政府實時甚至預先了解發生的問題,做到預測社會需求,預判社會問題,防患于未然。同時,大數據會實現社會治理的高效和節約,可以極大地節約相關部門和公民本人的時間及精力。大數據還促使社會治理方式的多樣化,比如讓更多人群進行自我管理的自組織模式。最后,在大數據時代下,社會治理將面臨著更大的約束,尤其是社會治理現代化問題。為確保社會治理現代化,既要構建一個真正的電子政務平臺和應用體系,又要應用社會治理的新模式――云治理。云治理只是一個手段,最終要走向全面治理和微治理。
三、大數據時代下的社會治理風險對策
在大數據時代,社會治理模式、治理方法都在發生改變,社??治理的主體也更為多元化,大數據在產生積極影響的同時,也面臨一些挑戰。首先是數據安全挑戰。在大數據里,人們的活動都能被看到和記錄,人們已經沒有隱私了,因此信息的安全性和保密性非常重要。其次是大數據的技術性風險,這類風險不是人為可以控制的。政府應盡快適應大數據帶來的新的治理環境,轉變角色定位,制定有助于大數據發展的制度規則,引導其在社會治理過程中產生積極影響。
第一,建立統一的元數據標準體系。這是政府實現對大數據合理運用的基礎。標準體系應包含大數據生成、發展及的數據標準格式,便于數據的無縫隙統籌整合,使原本散落在各部門的數據信息整合起來,打破“信息孤島”狀態。
第二,建立防范風險的制度。這是政府實現對大數據合理規制的保障。大數據時代下,挖掘商業價值和保護個人隱私的矛盾日益凸顯,技術性風險也不再是人為可控的。因此,建立數據資源的應用規則,界定數據資源的歸屬,限制數據資源的使用范圍,用制度將技術風險約束在一定范圍內,確保信息的安全性和保密性。
第三,調整社會治理結構。這是政府適應大數據時代下社會治理環境的前提。大數據時代使社會治理主體更加多元化,各主體在共享最新數據的基礎上,發揮各自的優勢。政府可依托互聯網技術,發展眾包、眾籌等方式的自我管理的自組織模式,參與公共服務;鼓勵社會組織承接城市公共服務;引入第三方機構對社會服務方案進行設計與評估,凝聚大眾智慧,形成內外結合、各主體協同治理的新格局,讓政府的治理結構有效地嵌入到社會治理網格化結構中。
四、大數據時代下社會治理研究的趨勢
在互聯網、大數據、云計算的影響下,社會治理的環境發生了重大的改變?;ヂ摼W技術和大數據的發展為社會發展帶來便利的同時,也對傳統的治理方式提出挑戰。這些變化對社會組織的發展和社會治理理論的研究提供了一系列新的主題,構成了前所未有的研究機遇。
首先,在構建社會治理的新模式上,云治理應該是未來研究的一個方向。運用云治理的手段要弄清楚三個問題:一是要梳理云治理的概念體系,它的前提是什么、它成不成立;二是要分析云治理的價值選擇,它是否真正符合人們的價值理念,是否符合現在社會發展、社會需要的方向;三是要研究云治理的現實應用,它能在哪些方面應用,怎么應用。
數據治理范文5
【關鍵詞】大數據 互聯網 社會研究方法 社會治理模式
【中圖分類號】D035 【文獻標識碼】A
互聯網革命引發的社會研究方法革命和社會治理思維變革
社會解釋與社會治理實踐是社會治理的兩個密不可分的重要方面。正確的社會解釋是有效社會治理的必要條件和理論基礎,而社會治理則是社會解釋所產生的現實成果。社會解釋的任務需要通過社會研究來完成,它的使命是發現和認識社會運行的本質與規律,并在此基礎上總結以往社會治理的經驗與教訓,為當下的社會治理提供有效的理論指導與最佳的方法及路徑選擇。
然而,我們不得不承認,與對自然界和物質世界的研究相比,我們人類對自身行為與社會運行規律的研究,總體上說還處于比較低的水平。這是因為,人類社會是一個復雜的巨型系統,它比世界上任何其他系統都更加復雜和迷離,其規律也難以完全為社會所知曉和掌握。
同時,社會科學研究方法帶有明顯的時代特征,它受到一定社會主導性思維方式和科學技術水平的影響。從前工業社會、工業社會、后工業社會,再到當代的所謂信息社會或大數據社會,社會科學研究方法在不斷更新和發展,研究范式不斷更新,研究技術手段不斷進步。但是,我們不難發現,大數據時代與以往最大區別在于,人類社會被計算機和互聯網納入到了一個具有無限空間和行為可能性的體系之中,任何人離開這個體系都將無法生存。處于這個體系中的人與組織,最重要的生存和發展技能是信息處理能力。對此,人類社會已經形成了高度一致的共識,這就是“社會的信息處理范式”(information processing paradigm of society)。在已經形成“信息處理社會范式”的大數據時代,社會科學研究最有效、最符合時代要求的范式只能是“社會科學的計算范式”(computational paradigm of social science)。于是,計算社會科學(computional socail science)與計算社會學(computional sociology)應運而生。
2014年8月,美國社會學界舉辦了“新計算社會學研討會(New computational sociology conference)”,與會者來自哈佛、MIT、斯坦福等名校。這次學術會議的一個顯著特點是跨學科的學術研討,既有社會學、經濟學、政治學、心理學等社會科學的專家,也有來自計算機科學、生命科學、信息科學等學科的學者,谷歌(Google)和臉書(Facebook)的技術專家也參加了這次會議。
“新計算社會學”在社會學研究的各個方面、各個環節進行了全面創新,除了大數據的獲取與分析之外,還在質性研究與定量研究的融合、互聯網社會實驗、計算機社會模擬、新型社會計算工具的研發等方面展開探索。
“新計算社會學”試圖創造性地運用互聯網和大數據所提供的新方法、新技術、新工具,克服既有社會學研究的局限,以達到對人類行為與社會運行規律的真實認知與科學解釋。
大數據帶來的不僅僅是研究方法的革命,更是對社會治理思維的沖擊,就如我們不能把數學僅僅看成一個計算工具,而應認識到它是一種思維方式―通過把握事物的量的關系來認識事物的本質和聯系;同樣,我們不能僅僅把互聯網和大數據看作是一個新工具,僅僅是對傳統研究方法和測量方法的突破,而更應該意識到它將帶給我們的是一種新的思維方法。
讓數據成為知識
盡管互聯網與大數據的作用如此之大,但使其真正發揮效力卻絕非易事。大數據真正“落地”必須具備三個條件,一是數據準備;二是“硬實力”,即計算能力強大的服務器集群;三是“軟實力”,即先進、高效的大數據處理技術。
互聯網、移動互聯網、物聯網已經生成了海量數據,并且還在加速增長之中,數據準備已經不是問題。我國政府正積極推動云計算平臺的建設,許多企業正在就此展開戰略布局,云計算技術可以充分調動互聯網上的計算機資源,使普通用戶能夠以相對低廉的價格獲得強大的計算能力,對于用戶來說,分析、處理大數據的計算機資源已經初步具備,并且將越來越強大和完善,就目前情況而言,硬件資源的能力也已經不是問題。
大數據運用的短板是“軟實力”,我們首先遇到的難題是數據的挖掘(Data mining)?;ヂ摼W上生成的大數據是“自然數據”,它不會按照研究者的意愿而有序、有條理、有邏輯地排列。它是海量的、模糊的、隨機的、有噪聲的。要運用大數據,必須先使數據成為知識,否則這些數據就與一堆垃圾無異;對海量數據的處理自然不是人能夠完成的,必須借助計算機高速、強大的運算能力,也就是借助于計算機數據挖掘。
數據挖掘是通過分析,從海量數據中尋找其規律,設計適合的計算機算法,從而自動搜索隱藏于其中的有價值的、潛在有用的信息和知識的過程,是數據庫知識發現(Knowledge-Discovery in Databases)中的一個步驟。在大數據時代,數據挖掘是最關鍵的工作。
由于問題不同,所需數據也就不同,而不同的數據有不同的種類和結構,必須根據具體的情況來設計計算機算法。例如:互聯網輿情挖掘,以微博、博客、論壇等為挖掘對象,主要是通過文本分析、自然語言理解等技術來搜集、分析數據;而在電子商務中,則以電商交易平臺中的瀏覽、交易等行為蹤跡為主要挖掘對象。前者是對某一政策的社會反應進行調查,后者是對人們的購物行為進行分析。
當前數據挖掘應用主要集中在電信、零售、銀行、電力、醫藥等方面,雖然看似廣泛,但實際上還遠遠沒有普及。在社會研究和治理方面,需要挖掘的大多數都是非結構性數據,其難度很大,以美國為代表的西方國家一直在大力開發這類挖掘工具,我國的這項工作起步不久,亟待深入和提高。
政府機構、一般企業、社會團體和個人用戶大多不具備從大數據中發現知識的專業技能,要使大數據真正服務于社會,這是必須解決的難題。我們對此必須高度重視,否則很可能會出現這樣一種情況―各種數據已經可以有償或無償地獲取,大大小小的云計算平臺已經星羅棋布,但是用戶卻不知道如何利用這些條件獲取自己想要的東西。目前的情況是:數據量在高速增長之中,云計算平臺正在緊鑼密鼓地建設,而另外一個條件的準備卻行動緩慢,即將成為發展的瓶頸。三者的發展已經不平衡,很可能造成資源的閑置和浪費。
互聯網對社會生態的改變和對社會治理模式的沖擊
互聯網使信息的傳遞徹底突破了空間限制,不僅傳播信息的速度快,并且可傳播信息量越來越大,傳遞的成本還越來越低廉,此外,互聯網的信息傳播模式越來越表現出實時互動性的優勢:傳統的公眾信息傳播媒體(如報紙、廣播、電視等)很多是單向的,只能是一方向另一方傳遞信息,另一方被動接受,而互聯網具有信息交互性。
由于互聯網的這些特點和優勢,它正在改變社會生態,這主要表現在以下幾個方面:一是人類社會從信息匱乏轉變為信息爆炸;二是信息壟斷正在被打破,互聯網的存在使人為的信息封閉越來越困難,甚至在很多情況下成為不可能,三是人類社會的整體性正在加強,互聯網把世界連成了一體,對任何一個局部來說,它與整體和其他局部的聯系越來越密切,已經無法排除其他局部對自身的影響;四是“蟻聚效應”,互聯網使普通人獲得了更多的參與公共事務的機會,個人力量因“網民聚合”而增強。以往,單個普通人的言論和行為對社會的影響一般是微不足道的,現在卻可能通過“網民聚合”發揮出過去不敢想象的力量;五是“蝶翅效應”,在互聯網上,一件局部的微不足道的小事可能成為公眾事件,一則利用公眾心理精心編造的謠言可能引發一輪洶涌的輿情;六是“眾籌效應”,通過互聯網,政府、社會組織甚至一個普通人都可能調動社會力量,獲得社會的某種支持和幫助。
互聯網對社會生態的改變,在很多方面給我們帶來了發展的機遇。在政治領域,互聯網和大數據正在改變傳統的政治生態,“網絡政治”已經顯出雛形;互聯網帶來了公眾監督力的提升,這對社會治理有不可低估的積極意義,公眾監督能力如果得到充分發揮,可以在很大程度上分擔政府自身監督的任務,克服自身監督的不足之處。同時,大數據可以使政府變得更有智慧,通過數據的分析,能夠使政府有一雙“慧眼”,準確地認識社會問題;利用互聯網這一高速信息傳播平臺,可以使公共管理信息的、傳播更為及時、高效;互聯網的交互性也使政府能夠快速獲悉民眾對政策的反應,民意、民情調查的準確性可以大大提高。政府利用互聯網的“眾籌效應”,可以集思廣益,擇善而從。
在經濟領域,互聯網和大數據已經成為一種強大的經濟資源,并且催生出新的經濟形態。從經濟學的觀點看:降低交易成本的行為將提升競爭力,亦即高交易成本的營銷模式將被低交易成本的營銷模式所取代,在過去的10年中,電子商務的出現和發展印證了這一原理?;ヂ摼W和大數據幫助企業更為科學、更為高效的分析市場、匯集資源、制定計劃,改變原有的營銷模式,其中尤為受到企業的重視的是預測市場需求和降低交易成本。
在教育領域,人們對“云課堂”已經不再陌生,“云上課題”更為充分地發揮了有限的教育資源的作用,并使適配式教育成為可能。
在醫療領域,從疾病預防、疫情監測到藥品管理、醫務監督,從醫療專家系統到線上預診服務,互聯網和大數據已經取得了豐碩成果,并且其應用面還在持續擴大。互聯網和大數據技術不僅幫助我們降低醫療成本,提高醫療效率;并且還有望在治理醫療腐敗、緩解醫患糾紛這些棘手而又迫切需要解決的問題上大有作為。
當然,任何新生事物的到來,在帶給人類美好的饋贈的同時,也會不同程度地帶來麻煩?;ヂ摼W和大數據一方面為我們提供了以前不可能具有的條件和能力,另一方面也給我們帶來了前所未有的問題。傳統的社會治理思維已經難以適應互聯網帶來的迅速而劇烈的變化,因此必須在很多方面及時作出調整。當前最迫在眉睫的主要有數據安全問題和網絡污染問題。
一是數據安全。與互聯網和大數據如影隨形而至的是數據安全問題,一些數據(個人隱私數據、關系國家安全的數據等)如果被惡意利用,將會對社會產生不同程度的危害,嚴重的甚至會危及國家安全,這是必須予以高度重視的問題。涂子沛在《大數據》一書中曾提及美國警察濫用個人隱私數據的真實事例:
密歇根州的一些警察,利用警務數據庫“獵艷”:他們在街上邂逅漂亮的女性之后,就跟蹤她們,記下她們的車牌號碼,然后通過查詢數據庫,獲得該女性的住址等個人信息,再人為制造進一步接觸的機會。此外,還有警察利用數據庫查詢政治對手和上司的信息,對相關人員實施威脅。在2001年前后的5年間,涉嫌濫用警務數據庫的警察共有90名之多。特拉華州還有政府官員將公民的個人信息泄露、出賣給賭博公司,幫助他們追債、開發新的顧客。
1995年,歐盟頒布《關于涉及個人數據處理的個人保護以及此類數據自由流動的指令》,2014年,歐洲法院裁定普通用戶的個人隱私擁有“被遺忘權”,要求谷歌公司按照當事人的要求刪除涉及個人隱私的數據。
據剛剛出現的數據交易業稱,我國數據的獲取在一定程度上還處于“法無禁止皆可為”的狀態。雖然這有助于推動互聯網和大數據的發展,但其中潛藏著巨大的隱患。我們應該意識到問題的嚴重性和緊迫性,對數據獲取和使用的權限應進行全面深入地研究,制定、完善相關的法律法規,盡早將數據獲取和使用納入正常、良性的運行軌道。
數據安全不僅關系到個人隱私、企業商業機密,還可能直接影響國家安全。一些看似尋常的數據,如果由專業人員進行匯集分析,可以獲得一些極為重要的情報。因此,一些公司的“過度追蹤行為”引起了各界高度關注。
2014年,我國成立“中央網絡安全和信息化領導小組”,這表明我國政府深刻意識到互聯網發展對國家、安全、發展利益提出的挑戰,深刻意識到數據安全對于國家安全的重要性,已經把數據安全提升至了國家安全的戰略高度。
二是網絡污染。由于互聯網強大的傳播能力,不可避免地出現了信息污染,大量虛假信息泛濫成災,治理、控制網絡污染成為信息管理的新難題。
互聯網上的言論是復雜多樣的,既有民意的期盼,也有不負責任的流言;既有真知灼見,也有無稽之談;既有對現實問題理性冷靜的思考,也有非理性的情緒發泄。這些言論會不同程度地對公眾產生積極或消極的影響。此外,某些境外勢力把互聯網作為謀求其文化霸權的工具,有組織、有策劃地“引導輿論”,欺騙公眾,以達到某種政治目的,試圖破壞我國的社會穩定。因此,互聯網也是意識形態、價值觀念交鋒的戰場,我們對此必須有高度的警覺,要充分認識、研究互聯網輿論戰場的規律,沉著應戰。
面對互聯網帶來的這一挑戰,政府方面應先準確辨別言論的性質和動機,然后根據具體的情況積極應對。各級官員應不斷從互聯網上傾聽公眾的聲音,推動社會治理的進步,凡事先行一步,臨變快速反應,避免在“倒逼”下被動應付。近些年來的一些網絡事件表明,大多數嚴重后果是因反應不及時和應對失誤所造成。
數據治理范文6
數據治理和傳統信息處理模式的根本區別
傳統信息處理模式幾乎完全依賴人類的現有經驗進行信息處理,對于人類經驗并沒有覆蓋的領域,就只能利用窮舉的方法來進行處理。而窮舉的方法,只適用于條件簡單的小范圍領域,例如下象棋,棋盤很小,棋子的可選落點很有限,因此能夠使用窮舉來完成。而對于圍棋這種19X19的自由落點,其走法的窮舉將超越整個宇宙的質子總數。因此,傳統的信息處理無法應對這種應用,直到機器學習成熟,才能夠實現擊敗人類冠軍的AlphaGo而機器學習,則是數據治理中的一個重要環節,機器擊敗了人類冠軍,其實是數據治理對于依賴人類經驗的信息處理模式的超越和替代。因此,我們可以明顯的看出,數據治理和傳統信息處理模式的根本區別:
傳統信息處理:依賴人類現有經驗并進行有限演化,形成信息處理邏輯并通過編程實現輸入和輸出。
數據治理:僅僅依賴數據本身,通過數據本身的特征,自適應的演化處理邏輯,自適應的實現輸入和輸出(輸入輸出也是數據處理邏輯之一)。
這兩種模式的直接結果就是:傳統信息處理只能在人現有的經驗基礎上做得更快更準確;數據治理則可以向人提供全新的“經驗”。
旅游領域中的人工智能探索
在旅游領域,存在著海量的數據,這些數據多數是人工錄入,處理邏輯多數是統計和簡單分析,這種級別的信息處理僅僅能應對簡單事件。而游客、管理人員、從業人員的近乎開放型的咨詢和事務辦理,則是一種可能性遠遠超過圍棋數量的大自由維度信息處理。因此,旅游行業的咨詢、非常規事務辦理始終無法脫離人的主觀處理。而人主觀處理的最大問題就是,因為責任心不同、經驗不同、工作態度不同,其處理結果天差地別。
基于上述考量,浙江省旅游信息中心有限公司對浙江省旅游數據的綜合管理和應用制定了高起點高標準的要求,從建立之初就要求是在真正的數據治理體系之上,以便人工智能應用能夠快速落地,服務全省旅游管理者、從業者和游客。在考察了國內眾多人工智能領域公司之后,選擇了廈門杜若科技公司的研發團隊對浙江省旅游度假區信息的數據治理進行試點。廈門杜若的研發總監唐娜博士(曾是大數據和人工智能領域公認的世界級公司的首席技術經理)和她的團隊已經初步形成并發展了完全自主知識產權的基于人工智能的數據治理產品線,覆蓋了數據治理全生命周期的所有必要環。該公司目前已經申請數據治理體系相關發明專利58項,已獲得授權24項,實審中26項,申請實用新型專利37項,獲得授權26項。浙江省旅游信息中心對浙江省旅游數據治理的試點首先從《浙江省旅游度假區信息管理系統》入手,將系統中結構化的數據,以無障礙大數據采集的技術實現解構,形成自由格式的大數據,在這些數據基礎上,通過開放式的訓練,完成初步數據治理。
治理的初步結果可實現:形成基于自然語言的數據管理,對于《浙江省旅游度假區信息管理系統》中有記錄的所有數據,各級管理人員均可以自然語言對話的方式進行任意查詢(界面類似微信的一問一答),數據治理系統會根據各級人員的權限和身份,以及過往查詢的歷史和習慣進行針對性的回答。簡單地說,就讓人工智能系統認識你,并且記住你的各種習慣和特點,針對和你交流的全部經歷來回答你的提問,并且會將它與所有人交流的經驗也作為數據進行治理,從而,使用它的人群越大、人群種類越復雜,它就越聰明,就像人的閱歷越豐富,交流的時候溝通越暢通。
同時,逐步形成自學習的數據治理模式,對于《浙江省旅游度假區信息管理系統》中的所有數據,任何人除了查詢之外的應用模式,可以用文字以自然語言對話的方式“教會”人工智能系統,例如對哪幾個指標進行怎樣的加工處理和比對,某些指標達到多少時應當做什么樣的事情來主動應對等等。隨著系統學習的應用模式越來越多,系統將可以逐步區分《浙江省旅游度假區信息管理系統》中記錄的哪些數據存在不合理(例如假數據),哪些景區或者度假區有多大的概率出現什么樣的事件等等。