前言:中文期刊網精心挑選了數據統計分析范文供你參考和學習,希望我們的參考范文能激發你的文章創作靈感,歡迎閱讀。
數據統計分析范文1
隨著市場競爭的日益激烈,倡導所有的企業“以用戶為中心、以市場為導向、以效益為目標”,企業的發展都面臨著前所未有的挑戰,要想在競爭中立于不敗之地,就有必要不斷增強企業的精確化管理和精確化營銷。報表廣泛應用于各行各業,不僅是整理和分析數據的有效的手段之一,也是企業單位決策的重要依據,在企業單位中有著重要的地位,也是信息化的最重要的組成部分。但是由于報表的種類繁多、形式復雜多變,給計算機的實現帶來一定的麻煩。為了適應不斷變化的格式,需要重新改寫程序,通常需要為每一格式的報表定制編程,使得成本很高并且不具有靈活性。所以企業單位中數據統計分析報表系統的設計一直是研究開發人員的重點研究的問題。
報表情況概述
(一)報表的定義理解。報表,就是將內容信息(一般是數據、文字、圖片等)以某種形式組織起來,并將組織結果呈現出來的文件。只要是做數據的呈現,無論數據存在于文本文件內、Excel文件或者是在數據庫之內,只要可以將它呈現出來,打印輸出格式化的數據信息,就是一份報表。報表作為一種信息組織和分析的有利手段,在各行各業都應用廣泛,是信息瀏覽、分析、打印的有利工具,也是企業信息系統重要組成部分之一。
(二)報表的分類。按格式可以分為靜態格式和動態格式。靜態格式報表是由政府等管理組織制定的,格式固定而且復雜,格式與數據來源在開發時就已經固定,在使用時不需要改動,通過開發環境的自帶報表組件、應用程序、第三方控件實現,比如財務報表等。動態格式報表數據量較大,數據和格式需要經常變動,用戶需要自由定義,所以要有變通性和通用性,比如統計報表等。
(三)報表的構成。無論是靜態的還是動態的報表都是由表頭區、標題區、表體區及表尾區四個區域組成的。
(四)報表的內容。報表的內容包括兩個方面,一個是靜態不變的框架結構,即表頭區、標題區、及表尾區,這些結構在一段時間內是不會改變的。另外一個是動態的數據,指將數據庫內容,經過計算、查詢及綜合動態的操作,寫入到表格中的相應位置。
數據統計分析報表的重要性
向企業的領導和決策部門提供高質量的、準確的、及時的數據統計分析報表是企業數據管理部門的職能。提供高水平的數據統計分析報表是數據經過深加工的最終產品,是統計數據、分析研究的有機結合,為企業領導和決策部門提供優質的服務,是他們分析經濟運行態勢,制定宏觀決策和長遠規劃必不可少的重要依據。在計算機輔助技術迅速發展,世界市場動態多變,競爭日益激烈的世界經濟環境下,企業的生存環境發生著巨大的變化,各種新概念新模式不斷涌現,企業開始朝著全球化、敏捷化、智能化、信息化和個性化的方向發展。
傳統數據統計分析報表中存在的問題
常規的數據統計分析報表主要通過紙質報表、Excel報表及專門定制的軟件來呈現。而紙質的報表是最為常見的,大多企業的生產自動化的程度不高,計算機的應用不夠廣泛,工作人員接受創新事物的能力差等原因,所以大多的企業采用的是紙質的報表,數據的統計部門,根據需求手繪制定報表的格式,下發到其他的部門或者是生產的車間內,由部門的負責人或者是車間的管理人員按照要求填寫所要的數據或者其他的指標性文字,再返回到數據統計部門。
Excel報表是在紙質報表上的一大進步,簡化了紙質報表的很多程序。統計部門可以根據數據的要求在計算機上繪制電子表格,定義要求。通過網絡下發到各部門和車間。數據的計算工作可以通過在計算機上引入公式完成。但是這種報表的統計分析工作還得通過統計人員手動匯總計算,統計分析形成最終的報表。
還有就是專門定制的軟件,這樣的軟件并不是通用于所有的部門的,他們有著許多使用的局限性,例如制造企業的管理和設計軟件能實現各生產部門的數據統計分析、形成制造業通用的報表,而不能靈活的完成其他形式的報表。
數據統計分析報表系統的設計
數據統計分析報表的設計最關鍵的環節就是報表的模板和報表的輸出,下面就Excel報表模板及利用DDE通信、ACCESS數據庫、OLE幾種報表的輸出方式探討了數據統計分析報表系統的設計。
(一)利用Excel制定報表模板。通過運用Excel的制表功能,制定出不同的報表模板,不管是檢定結果還是鑒定證書等樣式的報表,每個報表的模板可以按照不同的數據需求,制定不同的結構,有報表格式、表頭、表尾、框架等固定的部分。在制表的過程中由于計算機的智能會自動完成一些簡單的合并、對齊、字號、字體等工作。但是對于某些非常復雜的表格編程,上述的自動化程序不起太大的作用,這時我們可以在制表之前就對表格的格式及公式定義做一些設定。這樣,不僅減輕了編程與維護的工作量,還提高工作的效率。
(二)利用DDE通信來實現報表輸出。Excel是辦公必備的軟件,也是人們最常用的表格、計算及統計的軟件,它不僅查詢、瀏覽的功能強大,而且其中內置的運算函數十分豐富,使用非常便捷。Excel在報表中應用,應用人員得心應手。動態數據交換是Windows平臺中能夠彼此進行交換數據與發送指令,是完整的通信協議之一。DDE方式的應用,使計算機中的各種程序通過動態數據交換的方式和MCGS來進行數據交換,是實現利用計算機中的資源對MCGS的功能進行擴充的方式,通過動態數據交換使程序讀取MCGS數據庫的數據,再依據要求把所讀取的數據在Excel中顯示出來,完成報表的輸出。
(三)利用ACCESS數據庫來實現報表輸出。報表的制作通常是通過報表設計器或利用第三方的Activex的報表控件來實現。但是這兩種方法都存在著這樣那樣不足:報表設計器只適用于制作一些不帶有表格的報表,同時它必須與vB所提供的設計器進行結合使用,異常的麻煩;而利用第三方的Activex的報表控件來實現的,雖然相對簡便,可以通過套用應用于多種的報表格式中,但是實用性較差,在實際應用中某些功能難以滿足實際項目的要求。然而利用ACCESS數據庫能解決上述的問題,利用MCGS數據庫的訪問功能,把采集到的現場數據輸Access的數據庫中,然后通過MCGS內部函數來調用已有程序,把Access數據庫中的數據輸入到的Excel的報表中,從而實現報表輸出。
(四)利用OLE實現報表輸出。它是一種對象連接和嵌入技術,是一種集成應用程序,是一種能夠讓用戶共享各種不同程序的信息資源的技術。OLE技術可以將聲音、圖像、文字、影像結合于一體的。MCGS組態軟件其本身的OLE功能可幫助用戶在數據統計程序中十分方便地操作并讀取組態軟件所采集到的實時數據,從而制成報表。
數據統計分析范文2
【關鍵詞】:污水處理;檢測數據;統計分析
中圖分類號:P628+.1文獻標識碼:A
在污水處理廠中,常常需要對檢測數據進行統計分析,主要應用了統計學中的方差分析、回歸分析等方法來研究和分析水質和數據之間的關系,以此確定檢測數據的有效性。在污水處理廠中主要對PH值、COD、氨氮、硝氮、亞硝氮、總磷等進行檢測,確定其數據的有效性和水質之間的關系。
一、污水處理廠中的相關處理方法簡介
對于污水處理廠來說水質就是是水與水中雜質共同表現的綜合特征,其中水中雜質的尺度就被稱之為水質指標。在污水處理中常常需要考慮多種監測指標,簡單可以分為物理指標、化學指標、生物指標。同時也可以按照檢測過程進行分類,可以分為運行前監測指標、運行中監測指標、出水監測指標,這些分類方法可以按照不同的需要進行恰當的分類。
在我國污水處理廠要進行四級處理的方法,即初級處理、一級處理、二級處理和三級處理的方式。其中一級處理主要是水中的懸浮固體物、浮油或重油、膠狀物等進行分離,可以使用水質水量調節、上浮、自然沉淀、隔油等方法來實現[1]。二級處理主要是去除膠狀污染物和可進行生物降解的有機溶解物,減少水的CDD和BOD,常用生物化學的方法。對于環境標準要求高而且水質污染比較嚴重的情況,或者BOD和CDD比值非常小(小于0.2~0.25),則用三級處理的方法。三級處理是去除生物難降解的有機污染物和溶解在廢水中的無機污染物,常用化學氧化和活性炭吸附的方法,也可以使用膜分離技術或離子交換等方法。針對不同的污水可以根據具體情況,選擇不同組合的處理方法[2]。
二、對檢測數據常用的統計方法分析
化學需氧量(COD)的測定是污水處理廠主要的監測項目,對COD的測定可以掌握構筑物的實際情況,通過對COD的數據分析,可以隨時調整構筑物的運行情況,以保證污水處理的效果。對污水廠出水來說,COD也是是必須監測的項目,其出水的水質應當達到國家的相關標準。污水中的CODCr由可以進行降解所需要的氧氣含量CODB和不可以進行降解的有機物所需要的氧氣含量CODNB組成,在可以用以下式子所組成[3]:
CODCr=CODB+CODNB (1)
假設m= CODB/BOD5,(1)式可以表示為
CODCr=m BOD5+CODNB(2)
或者 BOD5=1/m CODCr-1/m CODNB (3)
當實驗條件相同,水質一定時,m和CODNB為某個常數,可以通過最小二乘方法將檢測到的CODCr、BOD5數據進行回歸處理。在置信度為95%的情況下,r的取值氛圍為r0.05n-2≤r≤1,(2)式子所確定的方程才有意義。當r接近1的時候,其線性相關程度也越高,其中回歸方程的置信區間為BOD5=1/m CODCr-1/m CODNB±2S,式子S表示剩余標準差,可以用下式來計算
通過此式可以確定在測量氛圍的每個CODCr都有95%的BOD5值落在置信帶內。
在污水處理廠中常常得到大量的檢測數據,如果對所得到的一組數據進行分析時會經常發現某個數據和其它數據之間的差距比較大,這些數據被稱為離群數據。在污水處理廠中通常要判斷檢測的數據是否滿足排放的保證,以及不同的方法和工作人員對檢測結果的影響,常常需要對數據進行離群值檢驗,然后才能進行其它的判斷。在離群值檢驗中又常常分為兩種情況,如標準差未知和已知的情況。
在大部分的情況下,標準差都是未知的,需要對檢驗組中的數據進行分析來判斷離群值數據是否進行保留,常用的有統計學中的Q檢驗法、極差法、t檢驗法、格拉布斯法等方法。在標準偏差已知的情況下,可以用一些公式來進行檢驗[4],
其中Xd表示被檢驗數據的離群值,表示測定值的算術平均值,σ表示有不含異常值的其它實驗測定值。如果計算所得到了T值大于表中的臨界值,則Xd應當作為異常值而舍去。
t檢驗法是檢測污水排放是否達標中的一項重要的數學方法,通過對檢測數據進行分析,判斷檢測結果是否小于標準值。建設現在有小于20個檢測數據,它們分別為x1、x2、x3……一共n個這樣的數據,其中不包含離群值。可以用以下方法判斷其是否小于標準值[5]:
首先應當計算其算術平均值和標準偏差,
;;
其次選擇經驗顯著水平α,通過查表可以得到自由度為n-1時的t1-α;
然后計算;
最后如果(X-C)>μ,則可以判斷其檢測結果大于標準值。
三、結束語
當不考慮人為因素對檢測數據的影響,那么檢測數據就能夠恰當的表現了環境狀況的變化,常常出現以下幾種檢測結果:(1)如果算術平均值低于標準值,但是S值比較大,說明了環境質量不容樂觀,可以采用顯著檢驗的方法進一步分析,判斷其數據是否達標;(2)如果算術平均值低于標準值,S值非常小,說明水質質量比較穩定,超標的概率不是很大;(3)如果算術平均值高于標準值,S值非常大,說明水質質量不夠穩定,而且其中有很多不確定因素,可以采用顯著檢驗的方法進一步分析,判斷其數據是否達標;(4)如果算術平均值高于標準值,S值非常小,說明水質質量不夠穩定,而且超標。
【參考文獻】:
[1]趙玉林,徐蕾.污水處理廠檢測數據統計分析的研究[J].環境科學與管理,2009,34(12):25-30.
[2]趙玉林,徐蕾.污水處理廠檢測數據統計分析的研究[J].新疆環境保護,2009,31(02):11-16.
[3]陳傳星,康孝友.城市污水處理在線監測管理系統的研究與應用[J].中國高新技術企業,2009,(14):4-6.
數據統計分析范文3
為了進一步了解館藏圖書的利用情況,現從社科類、自科類及綜合類的角度對2008年—2012年5年數據進行結構劃分,其中社科類包含《中圖法(第四版)》中的A-K類,自科類包含N-X類,綜合類指Z類。綜合類每年的購置量很少,此次在表2中體現,僅供參考,重點將社科與自科類圖書進行分析。從館藏冊數方面,由表2的數據統計得知自科類圖書占據主導地位,分別占到55%,54.5%,56%,54.5%,56.2%,這與圖書館每年制定的自科社科6:4的圖書入藏比例基本相符,也表明了圖書館的館藏結構符合學校以工為主的辦學特色。流通比例是指圖書的借閱量與總的借閱量的比例,可以從很多方面進行劃分,時間段內讀者對各類圖書的整體需求比例,從類別結構劃分流通比例就可以客觀的反映出來。由表2的數據統計得知,2008年—2012年,社科類的流通比例每年都高于自科類,分別占到了56%,58%,60%,57%,66%。
入藏比例與流通比例的分析比對
取自科與社科的入藏比例和流通比例的差值Z,以數值0為分界點,分為正負兩個區間,如果Z值落在同區間內,則表示館藏圖書與讀者需求在整體上保持一致,反之,若Z值落在不同的區間,則表示館藏圖書與讀者需求存在矛盾。計算公式Z=X-YX:入藏比例Y:流通比例如圖1所示,圖書館5年內的Z值均分布于兩個不同的區間,從而說明,入藏的圖書與讀者的需求存在出入,沒有達到一致。那么,為了使圖書更好的被利用,是應該繼續按照圖書館原有的采購比例繼續采購,還是要改變采購方向迎合讀者的需求,就要進一步的了解利用率較高的幾大類圖書。
文獻的利用率衰減對文獻采購的影響
1圖書利用率的分類排名
通過統計,借閱率排名前10位的有文學(I)、哲學(B)、藝術(J)、語言、文字(H)、社科總論(C)、歷史、地理(K)、經濟(F)、工業技術(T)、政治法律(D)、數理科學和化學(O)。以2008年入藏的中文圖書作為統計對象,以2008年—2012年5年作為5個借閱時間段,前10位的借閱率統計結果如表3。表3的統計結果清晰表明,在每年的借閱率排名前10類中,社科類占到了80%,而自科類只占到了20%,社科類中文學(I)的借閱率更是高居榜首,文學類圖書受到讀者的歡迎,在其他各個高校中的借閱率排名亦是居高不下。社科類更是占據了借閱率排行的前6位。自科類排名中T大類遙遙領先,這是由于工業技術本身就涵蓋了TB、TD、TM等眾多類別,受眾面較為廣泛,但與社科類的圖書利用率進行比較,自科類的圖書利用率還是有一定的差距。一個圖書情報機構是為某一個或幾個專業研究、教育培訓服務,還是為一般參考咨詢或娛樂欣賞服務,這是設計藏書結構的基本出發點和目標[2]。西安理工大學屬于理工院校,以工為主亦應該在圖書館館藏結構中得以體現。
2文獻利用率的衰減分析
文獻可看作是一種信息,信息有其時效性,文獻的價值也會隨著時間的流逝而逐漸降低(特種文獻除外)[3],圖書的利用率也符合這種規律逐年衰減。這一點可從表3的各類圖書的年利用率中清晰看到。文學(I)從91.19%降至47.70%,其它各類圖書都有不同程度的降低。如果用U來表示圖書利用率的衰減程度,那么U就應該等于同樣的入藏圖書大類在不同時間段內的借閱率之差。U的值越大,說明該類圖書利用率的衰減程度大,利用價值損耗大,反之,說明該類圖書的利用價值時間長,采購圖書時應加以考慮。2008年入藏的圖書,在2008年的借閱率與2012年的借閱率之差結果如圖2所示。其中U值較小的為T類與O類,I類排在第4位。自科類的圖書利用率雖然較低,但是,隨著時間的推移,自科類的圖書利用率衰減值小,所以利用價值可持續的周期比較長,可供讀者的參考價值也較高。社科類的圖書借閱率較高,但是時效性低,而且衰減值高,圖2中顯示,J類,H類,C類,F類的借閱率之差相當,而且數值較高,I類圖書借閱率最高,但是屬于非專業圖書,應控制采購比例。2008年入藏的圖書,5年之后,2012年的利用率排名前3位的分別為文學(I)47.70%、哲學(B)47.62%、工業技術(T)40.90%。T與O大類的借閱率排名分別從第8位與第10位上升為第3位與第6位。這說明自科類的圖書保值期比社科類圖書時間長,例如2008年購置的自科類《電子線路CADProtel99SE》一書,在2008年流通量為6次,2012年仍然流通量4次,而社科類《經濟學的分析方法》一書,2008年的流通量為11次,在2012年就只流通了1次。
數據統計分析范文4
[關鍵詞]建筑業;統計分析;利用;大數據
前言
數據統計是國家進行市場監控和企業進行內部管理的重要依據,對建筑行業的影響十分巨大。面對呈現出多元化的投資主體、承包方式,以及極具彈性的建筑業統計方法和數據整理分析,在建筑行業進行數據統計分析時利用好大數據,成為提高建筑業統計分析質量的有效方法。
一、建筑業統計分析的重要性
在建筑業運行過程中進行統計分析,其統計數據能夠為政府進行市場監管提供直觀可靠的理論依據,同時能夠給企業相關管理者提供內部管理和改造的參考依據。對建筑行業進行統計分析能夠直觀反映生產運作的真實情況,從而幫助決策者根據實際情況的不斷發展對企業的生產規劃作出改進。建筑企業做出合理的發展規劃是與數據統計分析密切相關的,統計分析能夠起到一個總結工作成果和指明發展方向的作用。對建筑業進行統計分析,是以建筑企業為主體展開的,包括企業的從業人員,企業的可用設備,固定資產原價以及固定資產凈值等部分。只有對生產過程中相關的各項數據進行整合與分析,才能切實得到企業在這一階段的發展過程中進行了哪些消耗,這些消耗為企業帶來了哪些利潤,并將各項消耗與企業的利潤進行對比,才能更直觀的看到企業的利潤最大來自于哪方面,而哪些消耗是可以減少或者避免的。統計分析能夠在整體上反映建筑業的發展情況,并引導政府、企業管理者進行監控與調控。
二、建筑業統計分析利用大數據的方法
(一)完善立法,加強執法
建筑業的統計分析需要一個良性的社會環境。在進行統計時要嚴格遵循《統計法》和《統計法實施細則》,有理有據的進行統計分析。同時,由于現階段建筑業的統計分析需要加入大數據,這就要求我國相關部門參照大數據的特點,制定針對于大數據環境和發展情況的統計法規,為建筑業在新時代的統計分析提供一個更加安全的環境。
(二)完善統計體系和評價制度
國家應該制定針對于建筑業的完善的統計體系,規范建筑行業進行統計分析的方法,從而更好地對建筑業進行監督與調控。制定好的統計體系要符合中國經濟發展的實際,與建筑業的現狀密切相關,這個統計體系還要能夠隨著社會的發展作出改進,并遵循科學發展觀的要求。從而減少建筑業統計分析過程中的不確定性,才能在新的時期利用好大數據,減少大數據給建筑業的統計分析帶來的工作量,并使統計分析更加規范和具有權威性。在一種科學的方法中利用好大數據做好對建筑業的統計分析,推動整個建筑業的發展。建筑業的統計分析是講究質量的,隨意要求在系統的統計體系的基礎之上建立起來一個完善的統計數據質量評價制度。
一個完善的評價制度能夠對建筑業得出的各類數據進行審核與監督,從而保證統計數據的真實性,為下一步的數據統計分析工作提供正確的數據,保證統計分析的順利進行,并得出有效的結論。大數據是多元化的、具有實時性的,這就要求相關人員在進行數據統計時根據評價制度選取有價值的數據進行整合和分析,才能得到真正反映建筑企業運行狀況的數據,從而根據這些數據進行下一步的工作安排,做到事半功倍。
(三)構建系統的統計網絡
大數據的利用是離不開網絡的,這就需要建筑行業吸收掌握先進網絡技術的人才,為建筑業的統計分析構建一個系統的統計網絡,為建筑業統計分析利用大數據提供可能。這個統計網絡不是字面意義上的構建一個專門用來進行數據統計的系統,而是包括從管理人員到員工的整個建筑企業在內,建設一個包含整個企業各環節的內部統計網絡。首先要安排專門的企業領導者負責進行數據統計和分析工作,并由其指定相關人員進行各部門、各環節的統計工作。從高層到低層,每一環節都要將數據統計的管理者落實到實處,并讓其真正對這一工作負責,定期將統計結果上報給上一級統計人員。并最終選擇三至五人對收集好的數據進行整合和分析,提供給建筑企業的領導者,讓其根據數據做出最后的決斷,并最終作出企業發展的規劃。做好相關人員的人事統計網絡之后,再建立好利用網絡技術進行數據處理的真正意義上的統計網絡。這個統計網絡也能技術收錄本企業各部門的發展概況,并對其運行過程中出現的各項數據進行統計。每個部門都設定為一個獨立的統計單元,各統計單元之間也要相互聯系,將各項數據進行整合。并制定專門的統計分析功能,讓系統自動將數據進行統計分析,提供給管理者,從而減輕相關統計人員的工作壓力。有特殊需要的情況下還可以將各項數據制成統計圖,更直觀的觀察各項指標的變化。各建筑企業之間還可以通過統計網絡進行數據的交流,讓各企業之間能夠互相借鑒,從而做出更好的推動建筑業向前發展的決策。這樣在兩個方面構建系統的統計網絡,才能在建筑業進行統計分析的過程中真正利用好大數據,更直觀更系統的監控建筑企業的發展狀況,并作出及時地調整。
(四)提高統計人員的素質
建筑業數據分析利用大數據,不僅僅是少部分人的工作,是需要整個建筑行業的從業人員進行關注的。這就要求建筑行業的從業人員特別是專注于統計工作的工作人員提升自身素質,緊隨時展步伐,學會使用新興的網絡技術對數據進行整理與分析。首先要求建筑企業的統計人員要具備專業的統計技能,能夠敏銳的發現各部門運行過程中發生的變化,并從中整合出數據,進行分析。而現代建筑企業的統計分析需要利用到大數據,這就要求統計人員在掌握了原有的統計技能的基礎之上學會運用網絡技術、計算機技術進行出具的整合與分析,并通過觀察其他建筑企業的各項數據,發現本企業各部門在運行過程中存在的問題,及時反映給相關管理人員。網絡技術的應用還為統計人員更多的接觸到國外一些高端建筑企業的運行模式提供了便利條件,讓我國的建筑企業在借鑒中得到成長。企業管理者要定期對員工進行統計技能的培訓,這些培訓還應加入對現代高科技的使用,讓統計人員掌握緊隨時展步伐的新技能,加強員工的職業道德明確員工責任心。從而為建筑業統計分析利用好大數據提供一個有利的環境,讓大部分員工能夠在進行統計時主動利用大數據,讓建筑企業內部管理與時代接軌。
結語
綜上所述,建筑業的數據統計在整個建筑業的發展過程中處于一個十分重要的位置,統計分析的好壞直接影響著建筑業的發展方向。在進行建筑業的統計分析時,完善立法,加強執法,建立系統的統計體系和評價制度,構建系統的統計網絡并提高統計人員的素質,從而更好地利用大數據,推動建筑業的飛速發展。
參考文獻
[1]應佩君.提高建筑業統計數據質量方法探討[J].統計科學與實踐,2012,03:58-59.
數據統計分析范文5
【關鍵詞】信息化;醫療統計數據;控制
一、前言
緊跟著我國目前信息化水平的不斷發展,醫院醫療建設也邁入了一個新臺階。目前來看,我國大多數醫院都是利用數字化和信息化這兩個方式進行管理,這樣的管理措施不單單會使得醫院醫療統計數據質量得到提高,而且還能夠在目前的醫院醫療衛生改革下完成醫院工作,因此,有關工作是具有非常大的意義。除此之外,在目前醫院醫療衛生產業不斷前進下,全方位的進行醫院醫療統計數據工作,亦是當今發展的關鍵項目,面對有關數據信息的處理不單單還需要關注質量,還要重視成本的計算,關注對目前醫院所面臨的問題分析。因此,加強醫院醫療統計數據的管理與控制,是現在醫院工作的關鍵部分。
二、目前我國醫療統計數據所面臨的問題
(一)標準化層次低
醫療統計數據需要把醫院的具體運行狀況和患者的具體健康情況準確地進行描述,將客觀、全方位、高效和真實的信息進行展現出來。然而,利用調查分析得出,現在我國醫療計量和評價標準都是沒有滿足其要求的。緊跟著社會化的持續發展,我國已經逐漸進入到了一個信息化的時代,醫院也邁向信息化和數字化的朝向發展。然而,在具體的醫療操作中,醫院對醫療數據的統計是沒有給予過多的關注的,使其變成了醫療數據來源中的盲區。對于醫院醫療管理的中,不一樣的科室和不一樣的病種的醫療質量分析以及研究等,都是遠遠無法滿足數據統計要求的。除此之外,在處理醫療數據過程中,常常會產生新的數據指標,然而在具體統計工作是沒有把這樣的數據信息進行反映的,往往表現為滯后以及緩慢。另一方面,醫院數據統計在再設計這個層面上是欠缺的,計算機管理人員因為不理解醫院在數據收集、分析、應用等方面都是無法切實反映出醫院的真實情況,致使醫院醫療統計數據的標準化層次較低,使得同級醫院數據信息很難實施對比分析等。
(二)業務能力較薄弱
依據有關信息資料表示,在外國的一些醫療單位中,其統計人員與醫院床位數的比例大概是1:12,而我國醫療單位的比例為1:100,在一些基層醫院其比例甚至更低。在具體的管理中,其統計者本身能力是比較低的,其調查與取樣缺少針對性和專門性,致使統計工作只可以依據報表來進行管理工作,其得到的統計數據信息不夠真實可靠,而且相較于日常醫療管理工作來說,其數據信息是具有滯后的。雖然醫院在相關的部門制定了相應的專門人員進行統計活動,然而因為其專業的根基并不是很高,大部分從業人員都是從醫院和其它相關部門轉過來的,很多都是沒有通過正統的專業統計訓練的,致使目前這種信息化的驅使下,其統計管理工作運行的并不是很順暢,嚴重阻礙了數據統計的質量和效率。
三、提升醫療統計數據質量的措施
(一)實施監控評估
如果想要在根本上提升醫療統計數據信息的質量,第一,就是要建立一個完善的監控評估措施。就監控來說,需要擴大其統計監督執行力度、進行相應的獎懲考核手段、設立和完善相關的管理機制,這樣都是提升提醫療統計數據質量的保障。就技術來說,在醫院管理體系上實施跟蹤軟件的設置以及安裝,設定對應的在線監測體系,進而可以使得數據統計有關信息得到收集,保證行為的切實性,切實檢查出相關不滿足標準的數據信息。與此同時,在管理和控制上,需要按期向上級對其所面臨的有關數據信息質量問題實施匯總,且對這樣的信息誤差實施改正,合理有效的衡量這些數據信息的規范和標準。除此之外,在進行評估之前,需要把這些分散的數據信息進行匯總,依據醫院的需要,和醫院的具體狀況進行結合,建立相關的統計指標系統,進而促進醫院內部管理和發展,對醫院資源實施優化配置,發展不一樣的指標綜合評價形式,推動其評價可以把將醫院醫療統計數據的完整性得以表現。
(二)健全其法律法規制度
真實性和客觀性是信息化醫療統計數據中的兩個重要特點。如果在統計管理中,產生數據誤差不單單會影響到大眾的身體健康,更有甚者會危害到大眾的生命財產安全。所以,在收集和管理統計數據的過程中,需要嚴格依據有關的法律法規制度的要求實施工作。通過建立有效合理的法律法規,使得醫院醫療統計數據避免受到不良的信息進行干擾和作用,保證數據的真實性以及客觀性。例如:在門診數據統計當中,需要科學合理分類指標系統,進而避免在就診中產生混亂的現象,與此同時,還需要合理管理病患,使得病患可以對號入座,用這個來節省就診時間。合時宜的補充新增加的指標,依據實際所遇到的問題進行具體分析,采用科學合理的管理舉措以及控制措施。緊跟著醫院醫療建設的發展,其統計工作也有了對應的改善,在其產生改變的同時,應切實更新其原有的含義和概念。與此同時,上級主管人員需要對基層員工的實際工作實施相關的培訓和指導,進而防止最終結論產生較大的判斷偏差。
(三)建立科學合理的統計分析系統
對于醫院的經營管理程序中,綜合統計分析是其主要的構成部分之一。所以,在具體的管理中,可以將醫院的經驗管理實際狀況和管理水平進行結合。第一,要建立一整套科學合理的統計分析系統,使其對比分析的結果能夠實現預期的目標。第二,對醫院不一樣時期的統計指標進行分析和比較,且從中找到其差距,和同級醫院實施對比和分析,將其結果和完成狀況實施仔細地研究和分析,把影響到醫院醫療統計工作的有關因數尋找出來,給出相應科學合理的建議。第三,通過因數比較,將不同因數的變化影響因素實施測量,實施投入產出的比較,對醫院的經濟利益實施綜合評價,進行動態分析,正確把握住醫院發展的趨勢,對醫療格局實施科學合理地調節,有效配置醫院內部中的財力、人力和物力等,重視其工作重心,提高醫院醫療服務質量,進而得到更好的經濟利益和社會利益。
(四)人員的管理
通過管理的過程中,其信息化發展無論多么先進,機器設備多么發達,都是需要人工進行操作的。在收集、分析、保存和比較醫院醫療數據信息時,人都是最為活躍的因素。緊跟著醫院信息化的推動作用,要逐漸的發展和健全醫院的醫療統計工作,提升工作人員的素質能力和專業知識技能。而這樣也要求了在管理與控制中,其工作人員一定要理解和把握相關的計算機技術,而且對醫學、統計專業知識、計算機技術、疾病分類防御、醫學管理和信息技術等有所相關的認識,全面、全方位地來監管以及處理這些統計數據信息資料。與此同時,醫院本身還需要擴大對統計部門的投入,按期實施各個層面的專業知識培訓,建造一支專業技知識強的統計隊伍,利用不同的形式以及渠道來實施業務能力培訓,盡可能為不同的員工提供交流以及進修的機會。除此之外,還需要加強管理計算技術層面的培訓,進而提升管理人員道德素質和專業能力。
四、總結
總而言之,緊跟著信息化的發展和醫院管理的具體要求,以前的醫療統計數據的對策已經無法適應時代的發展。本文從實施監控評估,健全其法律法規制度,建立科學合理的統計分析系統以及人員的管理這四個方面提升醫療統計數據質量。通過分析能夠有效的統計信息,在現今社會下推動醫院統計工作的完善。
參考文獻
[1]毛云鵬,馮昌琪,方詩偉,等.衛生統計直報數據共享的研究[J].中國衛生信息管理雜志,2012,9(6):87-91.
[2]王叢梅.信息化醫療統計數據質量管理與控制[J].吉林醫學,2010,31(3):425-426.
數據統計分析范文6
關鍵詞:大數據;統計學;數據分析;抽樣理論;理論
重構隨著信息科學技術的高速度發展,當代獲取和儲存數據信息的能力不斷增強而成本不斷下降,這為大數據的應用提供了必要的技術環境和可能.應用大數據技術的優勢愈來愈明顯,它的應用能夠幫助人類獲取真正有價值的數據信息.近年來,專家學者有關大數據技術問題進行了大量的研究工作[1],很多領域也都受到了大數據分析的影響.這個時代將大數據稱為未來的石油,它必將對這個時代和未來的社會經濟以及科學技術的發展產生深遠的意義和影響.目前對于大數據概念,主要是從數據來源和數據的處理工具與處理難度方面考慮,但國內外專家學者各有各的觀點,并沒有給出一致的精確定義.麥肯錫全球數據分析研究所指出大數據是數據集的大小超越了典型數據庫工具集合、存儲、管理和分析能力的數據集,大數據被Gartner定義為極端信息管理和處理一個或多個維度的傳統信息技術問題[23].目前得到專家們認可的一種觀點,即:“超大規?!笔荊B級數據,“海量”是TB級數據,而“大數據”是PB及其以上級別數據[2].
一些研究學者把大數據特征進行概括,稱其具有數據規模巨大、類型多樣、可利用價值密度低和處理速度快等特征,同時特別強調大數據區別于其他概念的最重要特征是快速動態變化的數據和形成流式數據.大數據技術發展所面臨的問題是數據存儲、數據處理和數據分析、數據顯示和數據安全等.大數據的數據量大、多樣性、復雜性及實時性等特點,使得數據存儲環境有了很大變化[45],而大部分傳統的統計方法只適合分析單個計算機存儲的數據,這些問題無疑增加了數據處理和整合的困難.數據分析是大數據處理的核心過程,同時它也給傳統統計學帶來了巨大的挑戰[6].產生大數據的數據源通常情況下具有高速度性和實時性,所以要求數據處理和分析系統也要有快速度和實時性特點,而傳統統計分析方法通常不具備快速和實時等特點.基于大數據的特點,傳統的數據統計理論已經不能適應大數據分析與研究的范疇,傳統統計學面臨著巨大的機遇與挑戰,然而為了適應大數據這一新的研究對象,傳統統計學必須進行改進,以繼續和更好的服務于人類.目前國內外將大數據和統計學相結合的研究文獻并不多.本文對大數據時代這一特定環境背景,統計學的抽樣理論和總體理論的存在價值、統計方法的重構及統計結果的評價標準的重建等問題進行分析與研究.
1傳統意義下的統計學
廣泛的統計學包括三個類型的統計方法:①處理大量隨機現象的統計方法,比如概率論與數理統計方法.②處理非隨機非概率的描述統計方法,如指數編制、社會調查等方法.③處理和特定學科相關聯的特殊方法,如經濟統計方法、環境科學統計方法等[7].受收集、處理數據的工具和能力的限制,人們幾乎不可能收集到全部的數據信息,因此傳統的統計學理論和方法基本上都是在樣本上進行的.或者即使能夠得到所有數據,但從實際角度出發,因所需成本過大,也會放棄搜集全部數據.然而,選擇最佳的抽樣方法和統計分析方法,也只能最大程度還原總體一個特定方面或某些方面的特征.事實上我們所察覺到的數據特征也只是總體大量特征中的一小部分,更多的其他特征尚待發掘.總之,傳統統計學是建立在抽樣理論基礎上,以點帶面的統計分析方法,強調因果關系的統計分析結果,推斷所測對象的總體本質的一門科學,是通過搜集、整理和分析研究數據從而探索數據內部存在規律的一門科學.
2統計學是大數據分析的核心
數的產生基于三個要素,分別是數、量和計量單位.在用數來表示事物的特征并采用了科學的計量單位后,就產生了真正意義上的數據,即有根據的數.科學數據是基于科學設計,通過使用觀察和測量獲得的數據,認知自然現象和社會現象的變化規律,或者用來檢驗已經存在的理論假設,由此得到了具有實際意義和理論意義的數據.從數據中獲得科學數據的理論,即統計學理論.科學數據是通過統計學理論獲得的,而統計學理論是為獲得科學數據而產生的一門科學.若說數據是傳達事物特征的精確語言,進行科學研究的必備條件,認知世界的重要工具,那么大數據分析就是讓數據最大限度地發揮功能,充分表達并有效滿足不同需求的基本要求.基于統計學的發展史及在數據分析中的作用,完成將數據轉化為知識、挖掘數據內在規律、通過數據發現并解決實際問題、預測可能發生的結果等是研究大數據的任務,而這必然離不開統計學.以大數據為研究對象,通過數據挖掘、提取、分析等手段探索現象內在本質的數據科學必須在繼承或改進統計學理論的基礎上產生.
統計數據的發展變化經歷了一系列過程,從只能收集到少量的數據到盡量多地收集數據,到科學利用樣本數據,再到綜合利用各類數據,以至于發展到今天的選擇使用大數據的過程.而統計分析為了適應數據可觀察集的不斷增大,也經歷了相應的各個不同階段,產生了統計分組法、大量觀察法、歸納推斷法、綜合指標法、模型方程法和數據挖掘法等分析方法,并且借助計算機以及其他軟件的程度也越來越深.300多年來,隨著數據量以指數速度的不斷增長,統計學圍繞如何搜集、整理和分析數據而展開,合理構建了應用方法體系,幫助各個學科解決了許多復雜問題.現在進入了大數據時代,統計學依舊是數據分析的靈魂,大數據分析是數據科學賦予統計學的新任務.對于統計學而言,來自新時代的數據科學挑戰有可能促使新思想、新方法和新技術產生,這一挑戰也意味著對于統計學理論將面臨巨大的機遇.
3統計學在大數據時代下必須改革
傳統統計學是通過對總體進行抽樣來搜索數據,對樣本數據進行整理、分析、描述等,從而推斷所測對象的總體本質,甚至預測總體未來的一門綜合性學科.從研究對象到統計結果的評判標準都是離不開樣本的抽取,完全不能適應大數據的4V特點,所以統計學為適應大數據技術的發展,必須進行改革.從學科發展角度出發,大數據對海量數據進行存儲、整合、處理和分析,可以看成是一種新的數據分析方法.數據關系的內在本質決定了大數據和統計學之間必然存在聯系,大數據對統計學的發展提出了挑戰,體現在大樣本標準的調整、樣本選取標準和形式的重新確定、統計軟件有待升級和開發及實質性統計方法的大數據化.但是也提供了一個機遇,體現在統計質量的提高、統計成本的下降、統計學作用領域的擴大、統計學科體系的延伸以及統計學家地位的提升[7].
3.1大數據時代抽樣和總體理論存在價值
傳統統計學中的樣本數據來自總體,而總體是客觀存在的全體,可以通過觀測到的或經過抽樣而得到的數據來認知總體.但是在大數據時代,不再是隨機樣本,而是全部的數據,還需要假定一個看不見摸不著的總體嗎?如果將大數據看成一個高維度的大樣本集合,針對樣本大的問題,按照傳統統計學的方法,可以采用抽樣的方法來減少樣本容量,并且可以達到需要的精度;對于維度高的問題,可以采取對變量進行選擇、降維、壓縮、分解等方法來降低數據的復雜程度.但實際上很難做得到,大數據涵蓋多學科領域、多源、混合的數據,各學科之間的數據融合,學科邊界模糊,各范疇的數據集互相重疊,合成一體,而且大數據涉及到各種數據類型.因此想要通過抽樣而使數據量達到傳統統計學的統計分析能力范圍是一件相當困難或是一件不可能的事.大量的結構數據和非結構數據交織在一起,系統首先要認清哪個是有價值的信息,哪個是噪聲,以及哪些不同類型的數據信息來自于同一個地址的數據源,等等,傳統的統計學是無法做到的.在大數據時代下,是否需要打破傳統意義的抽樣理論、總體及樣本等概念和關系,是假設“樣本=總體”,還是“樣本趨近于總體”,還是不再使用總體和樣本這兩個概念,而重新定義一個更合適的概念,等等.人們該怎樣“安排”抽樣、總體及樣本等理論,或人們該怎樣修正抽樣、總體、樣本的“公理化”定義,這個問題是大數據時代下,傳統統計學面臨改進的首要問題.
3.2統計方法在大數據時代下的重構問題
在大數據時代下,傳統的高維度表達、結構描述和群體行為分析方法已經不能精確表達大數據在異構性、交互性、時效性、突發性等方面的特點,傳統的“假設-模型-檢驗”的統計方法受到了質疑,而且從“數據”到“數據”的統計模式還沒有真正建立,急切需要一個新的理論體系來指引,從而建立新的分析模型.去除數據噪聲、篩選有價值的數據、整合不同類型的數據、快速對數據做出分析并得出分析結果等一系列問題都有待于研究.大數據分析涉及到三個維度,即時間維度、空間維度和數據本身的維度,怎樣才能全面、深入地分析大數據的復雜性與特性,掌握大數據的不確定性,構建高效的大數據計算模型,變成了大數據分析的突破口.科學數據的演變是一個從簡單到復雜的各種形式不斷豐富、相互包容的過程,是一個循序漸進的過程,而不是簡單的由一種形式取代另一種形式.研究科學數據的統計學理論也是一樣,也是由簡單到復雜的各種形式相互包容、不斷豐富的發展過程,而絕不是完全否定一種理論、由另一種理論形式所代替.大數據時代的到來統計學理論必須要進行不斷的完善和發展,以適應呈指數增長的數據量的大數據分析的需要.
3.3如何構建大數據時代下統計結果的評價標準框架
大數據時代下,統計分析評價的標準又該如何變化?傳統統計分析的評價標準有兩個方面,一是可靠性評價,二是有效性評價,然而這兩種評價標準都因抽樣而生.可靠性評價是指用樣本去推斷總體有多大的把握程度,一般用概率來衡量.可靠性評價有時表現為置信水平,有時表現為顯著性水平[8].怎么確定顯著性水平一直是個存在爭議的問題,特別是在模型擬合度評價和假設檢驗中,因為各自參照的分布類型不一樣,其統計量就不一樣,顯著性評價的臨界值也就不一樣,可是臨界值又與顯著性水平的高低直接相關.而大數據在一定程度上是全體數據,因此不存在以樣本推斷總體的問題,那么在這種情況下,置信水平、可靠性問題怎么確定?依據是什么?有效性評價指的是真實性,即為誤差的大小,它與準確性、精確性有關.通常準確性是指觀察值與真實值的吻合程度,一般是無法衡量的,而精確性用抽樣分布的標準差來衡量.顯然,精確性是針對樣本數據而言的,也就是說樣本數據有精確性問題,同時也有準確性問題.抽樣誤差和非抽樣誤差都可能存在于樣本數據中,抽樣誤差可以計算和控制,但是非抽樣誤差只能通過各種方式加以識別或判斷[910].大多數情況下,對于樣本量不是太大的樣本,非抽樣誤差可以得到較好的防范,然而對于大數據的全體數據而言,沒有抽樣誤差問題,只有非抽樣誤差問題,也就是說大數據的真實性只表現為準確性.但是由于大數據特有的種種特性,使得大數據的非抽樣誤差很難進行防范、控制,也很難對其進行準確性評價.總之,對于大數據分析來說,有些統計分析理論是否還有意義,確切說有哪些統計學中的理論可以適用于大數據分析,而哪些統計學中的理論需要改進,哪些統計學中的理論已不再適用于大數據統計研究,等等,都有待于研究.所以大數據時代的統計學必是在繼承中求改進,改進中求發展,重構適應大數據時代的新統計學理論.
4結論
來自于社會各種數據源的數據量呈指數增長,大數據對社會發展的推動力呈指數效應,大數據已是生命活動的主要承載者.一個新事物的出現,必然導致傳統觀念和傳統技術的變革.對傳統統計學來說,大數據時代的到來無疑是一個挑戰,雖然傳統統計學必須做出改變,但是占據主導地位的依然會是統計學,它會引領人類合理分析利用大數據資源.大數據給統計學帶來了機遇和挑戰,統計學家們應該積極學習新事物,適應新環境,努力為大數據時代創造出新的統計方法,擴大統計學的應用范圍.
參考文獻:
[1]陳冬玲,曾文.頻繁模式挖掘中基于CFP的應用模型[J]沈陽大學學報(自然科學版),2015,27(4):296300.
[3]卞友江.“大數據”概念考辨[J].新聞研究導刊,2013,35(5):2528.
[5]靳小龍,王元卓,程學旗.大數據的研究體系與現狀[J].信息通信技術,2013(6):3543.
[6]覃雄派,王會舉,杜小勇,等.大數據分析:Rdbms與Mapreduce的競爭與共生[J].軟件學報,2012,23(1):32-45.
[7]游士兵,張佩,姚雪梅.大數據對統計學的挑戰和機遇[J].珞珈管理評論,2013(2):165171.
[8]李金昌.大數據與統計新思維[J].統計研究,2014,31(1):1017.