大數據分析論文范例6篇

前言:中文期刊網精心挑選了大數據分析論文范文供你參考和學習,希望我們的參考范文能激發你的文章創作靈感,歡迎閱讀。

大數據分析論文

大數據分析論文范文1

關于移動通信論文參考文獻:

[1]謝顯忠等,基于TDD的第四代移動通信技術[M].電子工業出版社,2005.

[2]解梅,移動通信技術及發展[J].電子科技大學學報,2003,02.

[3]宋文濤、羅漢文,移動通信[M].上海交通大學出版社,1996.

[4]何林娜,數字移動通信技術[M].機械工業出版社,2004.

[5]呂昌春,李林園.移動互聯網產業鏈平臺競爭與電信運營商增值業務發展策略研究[J].郵電設計技術,2012(11):16-20.

[6]張潔.影響中國移動通信產業發展競爭力的因素分析[J].經濟視角(下),2011(01):52-53.

關于移動通信論文參考文獻:

[1]張潔.影響中國移動通信產業發展競爭力的因素分析[J].經濟視角(下),2011(01):52-53.

[2]呂昌春,李林園.移動互聯網產業鏈平臺競爭與電信運營商增值業務發展策略研究[J].郵電設計技術,2012(11):16-20.

[3]劉文婷.以運營商為主導的移動互聯網業務商業模式研究[J].中國工業經濟,2012(08):66-74.

[4]馮文高.我國移動通信產業的競爭均衡分析[J].現代經濟信息.2009(16)

[5]張潔.影響中國移動通信產業發展競爭力的因素分析[J].經濟視角(下).2011(01)

[6]馬云澤.我國移動通信產業的市場結構與規制改革[J].經濟問題.2009(01)

[7]張平王衛東陶小峰《WCDMA移動通信系統》人民郵電出版社

[8]詹炳根,《工程建設監理》,中國建設工業出版社,1997

[9]謝堅勛淺談工程監理與項目管理接軌建設監理2004(2)

關于移動通信論文參考文獻:

[1]趙剛.大數據:技術與應用實踐指南[M].北京:電子工業出版社,2013.

[2]漆晨犧.電信企業大數據分析、應用及管理發展策略[J].電信科學,2013(3):12-16.

[3]劉潔,王哲.基于大數據的電信運營商業務精確運營平臺的構建化[J].電信科學,2015,29(3):22-26.

[4]張俊.移動通信網絡中大數據處理的關鍵技術研究[J].電信網技術,2014(4):10-12.

[5]康波,劉勝強.基于大數據分析的互聯網業務用戶體驗管理[J].電信科學,2013,29(3):32-35.

[6]謝華.大數據在移動通信中的應用探討[J].科技創業家,2014(1).

[7]夏磊.探巧大數據下的智能數據分析技術[J].科技創新導報,2014(10):21.

[8]侯優優,隋化嚴.網絡優化中的大數據應用[J].互聯網天地,2014(l):34-37.

[9]劉震,付俊輝,趙楠.基于移動通信數據的用戶移動軌跡預測方法[J].計算機應用與軟件,2015,30(2):10-13.

大數據分析論文范文2

關鍵詞:技術創新;大數據;雙螺旋模型

一、引言

自2013年被確定為“大數據元年”以來,大數據應用已廣泛滲透到各行各業。伴隨著數據規模和類型的劇變、數據存儲成本的迅速下降、數據采集更加密集和廣泛,學術界和企業界開始站在戰略的高度重新審視大數據的價值。2008年9月,《自然》雜志推出了名為“大數據”的封面???,隨后IDC(2011)描述了大數據的“3V”:規模性(Volume)、多樣性(Variety)、實時性(Velocity),之后又加入價值性(Value)來描述大數據特征,稱之為“4V”[1]。麥肯錫(2011)將大數據定義為無法用常規軟件收集、儲存、處理、分析的龐大數據集。Forrester突破了以往單一對數據本身描述的局限,通過數據價值實現的角度將大數據定義為數據存儲、處理和訪問的流程與業務目標的集成。國內學者涂子沛在其專著《大數據》(2012)、《數據之巔》(2014)中反復表達“尊重事實,用數據說話”[2]以及“推崇知識和理性,用數據創新”的觀點,并描述了未來對于建設“SmartCity”的構想[3]。孟小峰(2013)指出大數據研究的火熱,并不能代表研究的深入,相反大數據的研究還處于一個非常起步的階段,還有諸如關鍵技術、利用方式等很多基礎性的問題需要解決[4]。大數據的發展和進步是以數字信息技術的發展和應用為主線的。數據分析、數據挖掘、數據存儲是拉動大數據發展的“三駕馬車”,這三項數據技術需要不斷進行創新才能進一步發掘大數據的價值潛力。由于大數據具備準確預測趨勢的能力、從海量數據中萃取有應用價值信息與知識的能力以及對市場技術需求方向突出的把控等能力,使得技術創新的效率有較大幅度的提升。同時,數據分析、挖掘和存儲本身作為技術手段也需要進行創新。因此,大數據與技術創新之間存在著密切的聯系。朱東華等(2013)提出了大數據環境下面向技術創新管理的雙向決策模型,以期提升我國技術創新管理研究在大數據環境下提取知識與觀點的能力[5]。趙亮等(2015)通過大數據的收集和預處理、大數據存儲、創新源數據可視化以及創新應用子項目的實施,實現對技術創新評估預測、風險把控能力的提升[6]。針對大數據與技術創新有關文獻的梳理,不難看出,在大數據時代下,大數據對于各類技術創新具有較大的提升作用,而“大數據”概念下作為技術支撐的數據技術同樣需要創新,同時也需要對數據技術的創新進行管理。對于大數據和技術創新這種“你中有我,我中有你”的相互作用關系,論文嘗試以雙螺旋結構模型為研究工具,提出大數據———技術創新雙螺旋模型,從而厘清在大數據與技術創新作用關系中的動力因素,以達到大數據與技術創新共同發展進步的目的。

二、雙螺旋結構理論

雙螺旋結構模型起源于生物學中的DNA雙螺旋結構,生物學家為了研究人類的遺產規律,從人類遺傳密碼———“基因”的角度出發,提出并繪制了DNA雙螺旋結構模型。1953年,沃森和克里克首次提出了DNA雙螺旋結構模型,該模型開啟了分子生物學時代。利用該模型,人類直觀地認識到遺傳信息的構成和傳遞路徑,并對人類遺傳信息復制上升的互融聯動關系有了初步的了解。在生物分子學領域,DNA雙螺旋結構模型是由兩條主鏈和堿基對組成,兩條主鏈相互盤旋形成類似于“麻花”狀的螺旋結構,而堿基對位于螺旋內部,兩兩對應。堿基對的排列順序就決定了生物體的不同性狀,而在DNA雙螺旋進行發展進化之時,堿基對的不同組合以及排列順序就確定了未來生物的發展走向。隨著管理科學的發展,在管理科學領域中有許多互相影響、互相促進、互相融合的二元關系,為了清晰地描述這種關系,管理學中引入分子生物學的DNA雙螺旋結構模型進行描述,從而形成了管理科學中的雙螺旋結構模型。質量管理學家戴明通過對計劃———執行———檢查的研究,提出這三個步驟不是原地循環往復的,而是一種螺旋式上升。于渤(2008)將知識創新雙螺旋作為企業知識創新過程,指出創新的過程需要經歷一套復雜的過程,最終實現自我超越的知識螺旋轉化[7]。管理科學與分子生物學的結合提煉出螺旋式系統方法論,又稱作螺旋式方法論。該方法論指導雙螺旋結構模型在管理領域的應用,而其基本的解決問題的精神是,按照事物發展的規律和演變的過程,通過螺旋內部重大影響因素的互相作用,循環使用不同的方法,推進事物有序的發展,最終達到事物發展的某種目標。

三、大數據與技術創新雙螺旋模型及分析

1.大數據與技術創新雙螺旋模型對于各類技術創新,大數據提供了龐大的樣本數據分析預測、精細的市場技術需求定位、詳盡的技術創新需求對象畫像刻畫等服務,使得技術創新的效率大幅度提升。而數據分析、挖掘和存儲是推動大數據自身發展的核心技術,這些技術的創新也將直接影響到大數據對其他技術創新的拉動作用。利用雙螺旋結構模型研究大數據與技術創新相互作用關系具有積極的現實意義,論文提出大數據———技術創新雙螺旋結構模型(BigData--Tech-nologyInnovation雙螺旋結構模型;BT雙螺旋結構模型)。依據BT雙螺旋結構模型,本文將大數據與技術創新視為兩條主鏈,即“大數據鏈”和“技術創新鏈”。這兩條主鏈的相互作用是依靠堿基對進行鏈接的,為了推動“大數據鏈”與“技術創新鏈”的發展增長,堿基對的不同搭配,相互作用,促進BT雙螺旋模型的不斷發展。數據挖掘、數據分析、數據存儲是推動大數據發展的技術核心,技術創新的發展需要技術創新管理理論的指導,以技術創新管理理論指導數據技術的創新,從而實現BT雙螺旋模型的發展。故將數據挖掘、數據分析、數據存儲和技術創新管理理論作為堿基,進行兩兩配對。圖1BT2.大數據———技術創新雙螺旋模型分析BT雙螺旋結構模型中將大數據與技術創新作為研究的主要對象,將其作為兩條主鏈進行分析。各類技術的創新需要在大數據以及大數據相關技術的支持下進行。同樣的,大數據自身數據技術的創新又歸屬于技術創新范疇,需要相關技術創新管理理論來給予指導和管理。BT雙螺旋結構模型需要向縱深發展,就必須要經歷雙螺旋結構的破裂———復制———重組———再破裂這樣的一個循環過程,從而循環往復,推動BT雙螺旋模型不斷發展。堿基一:數據挖掘技術,大數據需要通過從海量的數據中提取有效信息和知識,因此,數據挖掘技術是大數據未來發展的一項核心技術。憑借數據挖掘技術提煉出有價值的信息與知識,可以為技術現狀進行評估、技術創新未來趨勢進行預測、技術創新源進行匯總提供強大的信息支撐。堿基二:數據分析技術,數據分析技術是通過對現有數據進行分析,歸納、整理、總結并對所分析對象提供相應的預測。該技術是連接數據與結論的重要橋梁,通過分析技術可以順利地將“冷冰冰”的數據轉化成為有價值的結論成果,堿基三:數據存儲技術,存儲技術是數據挖掘技術與數據分析技術的基礎。信息時代的數據不僅僅是結構化的數據,更多的則是非結構化或是半結構化的數據,大量的數據需要有存儲空間,并且要做到隨用隨取,這樣才能使得數據的挖掘和分析更具時效性和針對性。堿基四:技術創新管理理論,數據技術的不斷革新需要從管理學的角度給出指導性的建議。大數據的三項核心數據技術本身作為一種技術手段,需要進行科學的發展,在數據技術的創新過程中,離不開技術創新管理理論的協助。大數據鏈與技術創新鏈作為BT雙螺旋模型的兩條主鏈擔負著不斷進步發展的使命,以數據挖掘技術、數據分析技術、數據存儲技術和技術創新管理理論為堿基對負責對兩條主鏈的發展進行指導。在DNA雙螺旋結構模型中,堿基對必須是A-T,G-C進行定位搭配互補,而在BT雙螺旋模型中,通過借鑒DNA雙螺旋結構模型的堿基對互補理論,從而進行多元輪回式的互補結合。BT雙螺旋模型中的堿基對不再像DNA雙螺旋模型那樣必須定位對象式的配對,當進入破裂階段,大數據鏈與技術創新鏈進行分離,兩主鏈破裂時連帶自己鏈條上所攜帶的堿基一并分離。進入到復制階段,各堿基進行復制,也即各項數據技術以及技術創新管理理論的推廣應用。而后,進入重組階段,堿基隨機兩兩結合,重新配對,在不同的空間、時間進行不斷的隨機結合,就會產生奇妙的化學反映。從而在不同隨機兩兩堿基結合的過程中,產生創新,發揮動力作用,就如同圖2所示地推動BT雙螺旋模型向縱深方向進行發展進步。

四、結論與展望

大數據分析論文范文3

【關鍵詞】大數據;高等教育;大數據思維模式;教育改革

一、大數據與高校

伴隨著人類存儲信息量的增長,越來越多的領域開始加入大數據陣營,越來越多的行業開始利用大數據分析,大數據給我們帶來的影響已經悄然成為社會各行業運行的基礎。

高校作為社會培養人才的一個重要的組成部分,目前多數學校仍延續著傳統的教育范式,教學策略依賴教師的經驗,教師的學術嚴重落后于社會科技的發展,學校的評估機制存在很多漏洞等等。許多專家發現了高等教育存在的問題,卻沒有更好的解決辦法,以前我們常說“讓事實說話”,現在我們大聲呼吁“讓數據說話,用說話的數據”。

二、迎接大數據

迎接大數據的到來首先要做的就是思維模式的改變。大數據科學本身其實是許多學科例如統計學,數據挖掘技術,機器學習,計算機技術,方法論相結合的跨學科科技,以多種理論為基礎而誕生的新興科技,使用者必須要對自己原本的思維模式進行相應的變革。

大數據首先強調的是“大”,采集一切有關甚至表面上看似“無關”的數據,也就是以后用于分析的數據要是全體數據,我們稱之為“全數據”;其次,采集的數據講究的是模糊,而不是精確,數據的種類模糊,數據的分析模糊,而預測分析的準確度來源于數據量之大,正所謂“量變帶來質變”;最后,就是對于大數據分析的結果,我們要明確“是什么”,而不必在乎“為什么”。于是,大數據體系形成了思維的改變去采集數據,從而獲得“大數據”,利用數據分析技術和算法來得到更為有效更為精準的數據。

三、使用大數據

(一)大數據的來源。高校中其實蘊含著更加豐富的數據,從學生的角度來說,學生的消費,家庭情況,宿舍活動,選課信息,學習進度,作業完成進度,考試成績的比對,參與的社團,參加的競賽,參加的活動,已經畢業的學生就業情況,社會職業供求關系,就業的滿意度調查等等太多數據,從教師的角度,教學過程的監控,教學內容的整理,課程設計,,學生的成績變化,論文質量,參與活動,科研項目等等數據,還要從社會,從家長,從宿舍,從第三方機構采集數據。由此可以看到整個校園的數據其實是一個極度龐大的數據,這些數據的集合才是“大數據”。

(二)大數據不是單純的“數字化”。例如,某個教師采用計算機多媒體課件,或者使用在線視頻課程,或者加入MOOC的陣營,這僅僅是簡單的將原本文字的東西變成“0和1“而已,這是數字化,不是大數據,充其量算是實現“大數據”而使用的計算機技術。我們真正要做的是在這些計算機平臺中去采集我們需要的數據,甚至收集我們看似毫無關聯的數據。

(三)廣義量化的數據。建立大數據,需要將一切信息進行量化,把文字量化,把數字量化,把地理位置量化,把溝通語言量化,把一切可以量化的信息都變成數據,構建大數據平臺。

(四)大數據的作用。高校的大數據,要還原真實的教學質量,真實的就業情況,真實的師資力量,真實的管理決策成效,不能簡單的用問卷調查得出“好、不好”的結論。大數據發掘了時間價值,節約了時間,歷史數據的總結,實時數據的分析,以及對未來的預測。這一切都是建立在時間這個維度上的大數據成果。

四、小心大數據

(一)數據的隱私和安全。在高校中,學生的成績,學生的基本信息,學生在網站上發表的信息,對老師客觀的評價,學生參與的活動,教師的論文,就業信息等等一些相對可以公開的數據,但是經過分析和預測得到的評估結果,卻涉及到了個人隱私。這也就是非隱私數據經過大數據分析得到的隱私結論的現象。那么我們該如何保護這些隱私,是需要相應的規范去保護,對于數據的使用和加工者要有詳細的法律責任,以保護非隱私數據提供者的合法權益。

(二)永久存在的數據。高校對于學生在校期間或者對于教師在校期間所有發生的數據,比如大到一次獎學金,一次公開獲獎,小到每次活動記錄,一次出勤,一次缺勤,這些曾經否定我們進步的數據在大數據的時代變成了永久存在的數據,我們如何對待和處理這部分數據,是一個值得深思的問題。

(三)知“難”而“退”。高校利用大數據的分析得出對于某個學生的學習建議,讓該學生能夠輕松避開自己的弱項,選擇相對平坦的路線進行學習,那么這樣的結果是不是教育者希望看到的。我們一直崇尚學生學者要迎難而上,不要輕言放棄,要主動迎接挑戰,現在有了大數據分析,他們可以輕松避開困難,為學生創造一條平坦的道路。這樣的結果是我們作為教育者希望得到的嗎?

結 語

任何新的變革,都需要時代的磨練,大數據時代剛剛起步,他要走的路還很長很長,他需要完善的地方還很多很多。現在我們要做的就是接受大數據,然后忘記大數據,讓大數據這個理念變成“計算機”一樣的通俗,一樣的深入人心。我們需要關注大數據,使用大數據,我們也需要和大數據一起成長,更好的發揮它的作用。高校未來離不開大數據,大數據的發展也離不開高校,讓每個學生、每個教師都步入大數據時代,去體會其中的奧妙,去感受他給我們帶來一場劃時代的變革,每個高校建立大數據信息平臺勢在必行。

參考文獻:

大數據分析論文范文4

關鍵詞 人文社會科學 科學數據使用特征

1 引言

在大數據時代,以科學數據為主要學術資源的數據密集型科學正改變著當前的科學研究模式。人文社會科學領域的研究者已經開始關注科學數據的作用和價值,定量研究也越來越得到重視。在一些數據科學的國際會議上,人文社科的數據管理也成為研究者討論的重點之一。

各種翔實、可靠的數據為以各種社會對象為研究主體的人文社會科學研究提供支撐,推動了社會調查方法、計量學方法、可視化方法等研究方法的應用和發展。中國管理科學與工程學會理事長李京文院士在2013年管理科學與工程學會年會暨第十一屆中國管理科學與工程論壇上指出,必須不斷研究大數據的形態變化規律,利用大數據來研究、認識和預測客觀世界及人類自身的發展變化趨勢。同時,科學數據也影響著傳統人文社會科學研究方法的轉型與創新。復雜的經濟統計模型、大規模的社會調查、豐富的科研數據處理和分析工具等,都為人文社會科學研究的創新提供了條件。科學數據的使用使得人文社會科學的“科學性”顯著增強。

雖然科學數據推動了人文社會科學的新發展,但是也有學者認為科學數據并未與人文科學結合起來,比如一些學者在從事人文研究時,常使用“絕大多數”等空泛概念的名詞。在數據密集型研究模式的背景下,人文社科領域的研究者對科學數據的使用習慣是怎樣的呢?哪些人文社科學科的研究者更擅長利用數據?他們獲取數據的來源、處理數據的類型和方法以及數據表現形式如何?研究者是不是由于缺乏對科學數據的使用而增加了“絕大多數”等空泛概念名詞的使用呢?

本文圍繞以上問題,對《中國社會科學》期刊的全文論文進行內容分析,探討我國部分人文社會科學學科在科學數據使用上的特征。重點分析研究者獲取實證數據的主要來源,所要分析的數據類型,處理數據的常用方法,以及數據分析完成后的表現形式。另外,針對學者提出“絕大多數”等空泛概念的名詞在人文社科學科中使用的問題,本文將分析研究者在這些名詞使用等方面的習慣。最后,根據人文社科研究者在科學數據使用上的特點,為圖書館提供科學數據服務給出建議。

2研究方法

本文采用文獻調查法采集論文資料,用內容分析方法統計論文中所用到的數據、中文數詞,分析其中的問題。人文社科數據主要指調查數據、網絡公開數據、政府統計數據和指標等,本文研究的數據對象除以上這些外,還包括實驗數據、文獻數據和圖片數據。文中討論的實證研究數據是指狹義實證研究所需要分析的數據。狹義實證研究是指僅依靠統計分析法的研究。另外,本文把“絕大多數”、“差不多”、“若干”、“大量”、“無數”、“少量”等詞語定義為模糊數詞。

本文的數據來源是《中國社會科學》的全文論文?!吨袊鐣茖W》是綜合性社會科學期刊,所刊登的論文代表我國人文社會科學領域最新的學術研究成果,也是我國人文社會科學研究的風向標。選用該期刊的全文進行分析,不僅可以了解我國最高水平人文社科學術成果在科學數據使用上的特點,而且也可以了解人文社科不同學科的學者在科學數據處理上所采用的最新方法。筆者于2014年12月通過CNKI數據庫收集該期刊2010年1月至2014年6月的全部期刊論文522篇,剔除其中“編者按”之類的7篇文章后,最終得到全文數據515篇。

3數據分析

3.1 總體概況

筆者對2010年1月到2014年6月的《中國社會科學》進行分析,共有全文數據515篇,把它們按研究內容分成、哲學、社會學、管理學、人口學、政治學、法學、經濟學、傳播學、語言學、文學、歷史學這12個學科。但由于人口學和傳播學的樣本數都小于5,統計的數據會在一定程度上有所失真,因而本文不統計這兩個學科的數據。

首先對論文的引用數據和實證數據進行分析。除去人口學和傳播學的論文,在剩余的論文中,僅引用數據而未進一步統計分析的論文168篇,占總數的33%,進行實證研究統計分析的論文113篇,占總數的22%。統計發現(見圖1):除了哲學學科的論文沒有引用數據外,其余學科的論文都或多或少地引用了數據。而實證數據主要集中在經濟學、社會學、管理學等幾個學科上,其中社會學和經濟學實證研究的比例分別達到67%和73%。這里政治學的數據值得注意,雖然該學科的論文沒有實證研究的數據,但引用數據的比例卻較高,達到53%,顯示了該學科數據使用的特點。

3.2 實證數據情況分析

本節主要對社會學、管理學、法學、經濟學、語言學和歷史學這六個有實證數據的學科進行分析,分別調查其使用數據的類型、來源、處理方法及其表現形式。這里,語言學和歷史學的實證數據由于是小樣本(樣本數小于5),因而需辯證看待這兩個學科的數據。

(1)數據類型

從使用數據的類型上看,這六個學科使用的數據基本上是數值型數據,經濟學還使用了部分圖片數據(表1)。

(2)數據來源

本文根據數據來源把實證數據分為一手數據和二手數據,其中一手數據是指研究者通過訪談、直接觀察、間接觀察等方式首次親自收集并經過加工處理的數據,二手數據是指來源于他人調查和科學實驗的數據。本文中,把一手數據分為調查數據、實驗數據和文獻資料數據;二手數據分為政府公開數據(如全國普查數據、各類統計年鑒)和數據管理機構(如中國社會科學調查中心ISSS等)的數據。

從數據的來源分析,社會學中44%的論文采用的是一手數據,而在經濟學中這一比例只有15%,經濟學更多的是使用政府公開數據等二手數據(圖2)。

在對一、二手數據的進一步分析后,可以看出社會學和法學的一手數據主要來自調查數據,經濟學的一手數據主要來自實驗數據;對于二手數據的來源,管理學、法學和經濟學主要以政府公開數據為主,而社會學稍微偏向于管理機構的數據(表2)。

(3)處理方法

本文把數據處理方法分為初級方法、中級方法和高級方法。初級方法是指平均數、頻數、方差、標準差等描述性統計方法;中級方法是指回歸分析、參數估計、假設檢驗、相關分析等統計方法;高級方法則是指模型計算等高等數學方法。

從數據處理方法上看,這六個學科的大部分論文都使用了描述性統計方法之類的初級方法,社會學比較注重對回歸分析、相關分析、假設檢驗等中級方法的運用,而經濟學則更擅長運用高等數學方法(圖3)。

(4)表現形式

本文把數據的表現形式分為統計表、統計圖和特定軟件繪制的圖形這三類。

從數據的表現形式來看,比較常用的是統計表形式,折線圖、柱狀圖和散點圖之類的統計圖在管理學、社會學和法學中的應用也比較廣泛。除此之外,經濟學和語言學還有一些利用特定軟件繪制的圖形(圖4)。

3.3模糊數詞使用情況分析

本節分析部分人文社科的論文使用“絕大多數”、“差不多”、“若干”、“大量”、“無數”、“少量”、“很多”和“很少”這八個模糊數詞的習慣,以及這些模糊數詞在部分人文社科學科論文中的使用情況。

首先統計以上這八個模糊數詞在一些人文社科學科論文中使用的比例(圖5)。筆者發現社會學、經濟學和文學這三個學科使用到以上八個模糊數詞的論文比例最高。相對來說,哲學的論文中出現這八個模糊數詞的比例稍微小些。

在統計2010年到2014年模糊數詞的篇均使用次數后發現,人文社科的學者在模糊數詞的使用上趨于穩定,各年篇均使用次數基本在2.0到2.5的區間內,除2012年和2013年的數值波動相對較大外,其余各年篇均使用次數的數值趨于2.3(圖6)。

隨后統計這八個模糊數詞的總使用次數及其篇均使用次數(圖7)。筆者發現,“大量”這個詞在論文中的總使用次數最多,而且篇均使用次數也最高(達3.14),這說明人文社科的研究者普遍喜歡使用這個詞,使用范圍也比較廣。其次是“很多”這個詞,研究者也比較喜歡使用。而“若干”這個詞,雖然總使用次數不算很大,但其篇均使用次數卻很高,這說明該詞的使用范圍比較集中。同樣的現象也發生在“絕大多數”這個詞上。最后討論一下“差不多”這個詞。雖然,先生提出中國人是“差不多先生”,凡事馬馬虎虎,不求精確,但是這個詞在人文社科領域的學術論文中卻很少使用,其總使用次數和篇均使用次數都是這八個詞中最低的。

這八個模糊數詞在部分人社科論文中使用分布情況見表3。表3中“一”表示該詞未在該學科中使用,“√”表示該詞在該學科中有使用,“”表示該詞不但在該學科中使用,而且其使用的頻率更高,即每一列的三個“”分別代表使用該詞的論文比例最高的前三個學科。從表3可以看出,管理學的論文對模糊數詞的使用頻率較高,有“差不多”、“若干”、“大量”等六個數詞在其學科論文中高頻率使用,其次是社會學。相比之下,哲學和語言學的論文對模糊數詞的使用頻率相對低一點。

4結果討論

本節依據以上數據分析我國部分人文社會科學學科的學者在科學數據使用上的特點,為圖書館今后開展科學數據服務給出針對性的建議。

4.1人文社科學科對數據的使用主要由研究對象決定

我們知道,社會學和經濟學是以社會現象或經濟現象為研究對象的學科,是偏向量化的科學。從上一節圖1的數據也可以看出,大多數論文(67%的社會學論文和73%的經濟學論文)都使用了基于數據的實證研究方法。在這些學科里,研究者尊重數據,把數據當作研究的主要素材,通過調查統計和模型計算使數據和學科發展有效結合在一起,推動了新知識和新規律的發現。而且,這些學科研究者的數據意識也比較強,對數據需求也更為迫切,獲取數據和處理數據的能力更強。比如經濟學,這個學科的論文有較高的實證數據使用比例,也非常注重政府公開數據等二手數據的獲取,二手數據的使用率比其他學科的使用率更高(圖2)。這就是由于研究者數據意識強烈,數據需求迫切,從而使他們獲取數據的渠道要比其他學科的研究者更廣。

相比之下,、哲學和文學這些學科是依靠思維邏輯的研究學科,主要是對傳統文獻資料的探討,很少討論實證或經驗現象,因而對實證數據的使用就不是很多,偶爾會引用一些數據,數據來源也只是依靠文獻。這些學科的研究方法仍較為傳統,主要以文獻為主,對數據使用的需求不是很迫切。

科學數據服務作為圖書館的一項創新服務,首先應該明確服務的對象。諸如以上這些人文社科學科,如果圖書館對其全面鋪開科學數據服務,那可能效果就并不是很理想,但如果圖書館首先對社會學和經濟學的研究者提供科學數據服務,為他們提供數據獲取、處理、共享方面的服務,則可能會取得事半功倍的效果。因而,筆者建議,針對人文社科的科學數據管理服務,首先可以把社會學和經濟學的研究者作為主要服務對象,把政治學的研究者作為潛在服務對象,在服務得到一定認可后,逐步向其他學科展開。對于主要服務對象,圖書館可以提供常規的檢索、收集、存儲、分析等數據情報服務和數據技術服務;而對于潛在服務對象,則可先向研究者提供科學數據在該學科中創新應用的情報信息,待研究者對科學數據服務需求提高后,再提供常規數據服務。

4.2人文社科學科對實證數據的處理以初級方法為主

在人文社科類論文的實證研究中,為了讓讀者了解數據和研究對象的特征,進而更好地了解統計分析結果,研究者根據不同的研究目的和研究對象會選取不同的數據處理方法。人文社科的研究者對數據處理采用的方法以描述性統計等初級方法為主,初級方法在法學、社會學、管理學等學科的實證數據研究中占了較大比例(圖3)。

相對而言,一些實證研究比較多的學科在數據處理方法上則更為多樣。比如社會學和經濟學,這兩個學科的研究者除了掌握描述性統計等初級方法外,對回歸分析、參數估計、假設檢驗、相關分析等一些中級方法也運用自如,而經濟學的研究者使用高等數學方法進行模型計算的能力更為突出,數據的表現形式也多種多樣,除了常用的統計圖表外,還有由各種特定軟件繪制的圖形,這些都顯示出他們優異的數據素養。

人文社科研究者在數據處理方法上的使用,一方面由論文的研究目的和對象決定,另一方面也由研究者的數據素養決定。對于前者,可能超出了圖書館的服務范圍,但要改善研究者的數據素養,圖書館還是可以有所作為的。筆者建議圖書館為研究者提供有針對性的數據處理方面的開放課程等信息,幫助研究者掌握更多關于數據處理的知識。除此之外,也可為研究者提供本學科在數據應用上創新研究的情報信息,讓他們了解本學科最新的數據處理技術,并提供相應的數據分析工具,促進定量研究的深入。同時,圖書館也可以與數學、統計學等院系合作,為研究者提供數據處理方面的專業講座,一方面增強對研究者數據素養的教育,另一方面也可為研究者跨學科合作提供平臺。

4.3模糊數詞的使用與研究對象和傳統文化有關

模糊數詞的使用在人文社科領域比較常見,并且各學科在使用上并沒有體現出明顯的差異。諸如在社會學和經濟學這些數據使用比較廣泛的學科里,研究者并沒有因為使用了數據而減少對模糊數詞的使用,反而模糊數詞在這兩個學科中的使用要比其他學科更多(圖5),而且各年模糊數詞的篇均使用次數也較穩定,沒有很大波動(圖6)。因而,模糊數詞的使用并不能說明科學數據沒有與人文科學的發展結合起來,這主要還是與研究者的研究對象和受傳統文化影響下的用語習慣有關。

比如“大量”這個詞,該詞使用總量和篇均使用量在這八個模糊數詞中都是最高的,說明人文社科的研究者普遍習慣使用該詞。然而進一步分析顯示,該詞在經濟學中的使用頻率最高。一方面,經濟學論文中存在的各種數量關系需要用“大量”這個詞來表述,另一方面,由于這個詞所代表的數量本身較難考證,再加上力求精確的數據精神缺乏和大概而言的用詞習慣,使得研究者摒棄了數據化表達而使用了這些模糊概念的詞語。

模糊數詞在人文社科領域的使用還是比較廣泛的,這與其研究對象有一定聯系,有些數量關系難以考證,無法精確量化。除此之外,研究者在傳統文化影響下的用詞習慣也是模糊數詞使用廣泛的重要因素之一。筆者建議圖書館在為人文社科學者提供科學數據服務時,要考慮到不同學科研究對象的影響,既要提倡數據文化,又要遵循人文精神。平時要注重收集有學術價值的科學數據,并為研究者提供方便查詢的數據平臺。與此同時,也可以根據研究者的需求,幫助他們收集和統計相關研究所需要的特定數據,以盡量減少模糊數詞的使用。但作為科學數據服務的提供方,圖書館也應尊重原有的人文社科研究方法,使科學數據作為一種補充材料,與現有的人文社科研究結合,相得益彰。

5 結語

大數據分析論文范文5

高校是我國科研創新的重要基地和主力軍。我國62%的國際重點實驗室、35%國家工程研究中心均設在高校。而科研統計是高校科研的一面鏡子,是其科研創新力的有效測度。它通過對高??蒲幸幠?、學術水平、增長速度和效益產出等方面的定量測量,反應高??蒲泄ぷ鳜F狀和發展趨勢,為高??蒲胁块T制定檢驗、調整科研方針、政策規劃和計劃提供依據,[1]是高??蒲泄芾碇贫然⒁幏痘幕A。

1 高??蒲薪y計工作存在的問題

在當前國家創新的大背景下,國家科技投入不斷增加,高??萍蓟顒友该桶l展,對科研統計也提出了更高的要求。因此,在科研統計中也暴露出不少的問題,主要表現在以下幾個方面。

1.1 統計人員流動性大

科研統計工作是一項基礎性工作,不像項目管理、成果管理那樣具有產出性,其成果、績效額度不宜測量和隱性化容易被忽視[2],導致統計工作人員熱情不高;另外,一些科研管理者也對該項工作重視不夠,認為只要完成上級單位布置的統計任務即可,對于統計人員沒有實施積極的鼓勵措施,導致科研統計人員很容易流失。北京2009年調查顯示,北京高校共有科研人員137人,其中首次承擔科研工作人員達52位,占總人數38%。這反映出科研人員流動性大,隊伍不穩定。新接觸科研統計人員對學校整體科研工作的了解、統計指標的理解都不如有經驗者全面、準確,反映在統計表中的數據邏輯性和合理性差、數據庫不全、數據庫不能定期維護等,影響數據質量,不能真實反映學??蒲泄ぷ鳜F狀。

1.2 數據收集精準度不高

科研統計工作相當復雜,涉及到科技投入、產出、項目分類、科研支出等上百個具有相關性的指標,如何正確理解這些指標范圍和相關性每個統計工作者都是挑戰。且在數據采集時涉及個人信息、機構信息、項目信息、經費信息、論文等多方面信息,這些信息在指標設置、分類標準、計算方法等方面有較大差異[3],這給數據統計的準確性和真實性都帶來困難。因此,科研統計人員在填表中很多指標僅能憑感覺申報,造成上報統計數據失真,使得報表對決策工作不但無幫助反而帶來不利影響。

1.3 科技統計數據分析不足、利用率低

科研統計工作最終目的是為管理者提供可靠依據。因此,僅做好基礎數據的收集是不夠的,科技統計報表只有通過專業數據分析才能發揮作用,只有專業數據分析結果才能對科研政策的制定和決策起到支撐作用。目前,我國許多高校還沒有組織力量進行數據分析建模工作,未對統計結果進行科學統計分析、未建立合理的指標評級體系,沒有讓數據“說話”。而且,我國科研統計工作自20世紀70年代以來經歷了近30年的發展[3],積累了豐富的歷史數據,這可以為當前科研管理提供寶貴參考信息。但目前尚未對這些信息進行有效的利用,且在數據保存、使用過程中還存在眾多問題。

2 提升科研統計工作效果的對策和建議

2.1 加強科研統計人員培訓,搭建交流平臺

從補充科研統計人員科研統計知識和加強對科研狀況掌握入手,對統計人員加強培訓,并為各高校科研統計人員間建立交流平臺,促進他們的互相學習和交流??梢圆捎弥黝}報告會、專項工作答疑會、基礎統計知識培訓、科研數據庫建立和維護培訓等,并引導、鼓勵統計工作這撰寫科研統計相關論文、參加相關項目科研團隊[4],通過多種方式提高統計人員專業水準,提高科研統計人員的工作積極性,才能保證數據的采集、處理、分析、審核的精準性。

2.2 提高數據的分析和利用能力

數據的簡單存在并不具備價值,只有得出分析結果才能體現其價值。數據分析可以從科研人員論文、專利、專注等信息與其年齡、學歷、職稱等基本信息相匹配,進行相關性分析,找出成果的產出與年齡、學歷、職稱等的關系,由此指導教師、科研人員的績效考核或人才引進;項目相關成果分析可以為項目評估提供借鑒,科技成果的相關分析是科研活動最好的體現,為科研工作者或教師科研績效評價和評估提供依據;通過對科研經費數據的分析,可以得出經費分布的主要方向、項目類型、年齡及職稱分布等特征性信息,為經費配比提供依據;另通過對歷年課題分析可以知道新項目的申報等。有條件的高校,可采用大數據技術驅動的數據流程,即通過基礎數據的采集后,從主管部門提取撥款等宏觀數據,從Web數據庫提取成果信息,而后建立數據庫,再利用相關性等技術對數據庫進行分析,得出結果,提高對數據的分析和利用能力。

大數據分析論文范文6

【關鍵詞】 統計學 教學實踐 財經專業

隨著大數據時代對于數據分析人才的需求越來越多,如何從海量數據中有效挖掘有用信息并進行數據分析已逐漸引起國內外政府機構及學者的極大關注,國際上關于大數據科學研究的呼聲也越來越高。統計學作為一門數據分析學科,主要通過收集整理研究對象的數據,進行建立統計模型、量化分析、總結和預測,探討研究對象的數量規律及其特征。隨著大數據時代的來臨,統計學的重要性越來越得到社會的認可和重視,具有統計學基礎的人才需求量也越來越大。

由于統計學涉及的理論內容、公式和抽象概念比較多,通常需要一定的數學基礎和較強的邏輯推理能力,因此學生普遍認為《統計學》是一門比較難以掌握和學習的課程。結合自己對財經類專業學生講授《統計學》課程的實際教學實踐,在分析目前教學中存在問題的基礎上,就如何提高統計學課程的教學效果,探索適合金融工程、工商管理、會計學等財經類專業的教學內容、教學手段和教學方法以及考核辦法,如何解決統計學教學存在的問題為社會培養高質量的專業數據分析人才談一下自己的想法和思考。

一、《統計學》教學中存在的問題

1、教學方法單一

目前,統計學教學仍然是以教師課堂講授為中心的教學思想、學生被動地接受知識傳輸的傳統填鴨式教學方式。以多媒體教學為主的背景下,雖然多數教師堅持黑板板書與多媒體課件相結合,但是有些教師將多媒體教學完全取代黑板板書,使得課堂教學內容容量過大,講授速度過快,缺乏師生之間的互動和交流。統計學內容在重點部分常常涉及較多公式和概率統計定理,使用多媒體課件授課使得講課速度過快,造成學生無法跟上教師思路不能理解具體內容,僅僅會記憶理解,熟練地套用計算公式,無法引起學生的學習興趣。

2、教學內容只注重應用表面,缺乏理論深度

財經院校《統計學》課程的教學內容仍然是以數據的收集、整理、描述和分析入手,簡單介紹統計調查、統計整理、統計指標、時間數列、指數、相關回歸、統計推斷等內容。對于教學中涉及到的基本數學定理、數學公式推理以及前后知識在數學上的聯系缺乏講解,使學生不能理解到所學知識的本質,僅僅會依葫蘆畫瓢地應用,導致學生在處理實際問題時方法單一、創新不足。有些財經專業的學生培養方案更是將統計學與概率統計同一學期開設,使得統計學課程的內容缺乏概率統計中的大數定律、中心極限定理等假設檢驗的基本知識,造成學生無法理解所學內容。

3、教師隊伍知識結構不合理

講授統計學的教師隊伍近幾年雖然有了很大的變化,但還有一部分統計教師的知識結構不夠理想,數學和計算機知識水平與客觀要求還存在一定的差距,仍需要繼續改進和提高。財經類院校講授統計學課程的教師主要以經濟統計、數量經濟學等財經類出身教師為主,缺乏數學專業科班教師,使得課程內容的設計僅注重應用,缺乏相應的數學理論作為支撐,使得學生對所學知識一知半解。

4、統計軟件與統計案例缺乏有效結合

隨著大數據時代的到來,學會用統計軟件處理實際問題的方法和分析能力已成為每個學生必經的階段,計算機軟件在統計學教學中的重要性越來越顯著?,F實中,雖然統計學的課堂教學中也注重統計方法的應用,但是由于統計學知識繁雜、課時安排普遍過少、開課班級過多等原因,導致統計學教學過程中對于學生的動手能力的訓練過少。尤其是財經類非統計專業學生的培養方案中《統計學》課程設計基本以54學時為主,使得課程教學內容僅可完成理論教學,缺乏用SPSS、SAS、R軟件等統計軟件進行實際問題處理的實踐教學。

5、統計分析方法與學生專業知識缺乏有機結合

統計分析方法與學生的專業脫節,教師從概念、公式、定理等方面講授完統計理論與統計方法后,往往無法從學生的專業角度出發與實際的經濟、金融、管理等內容相結合設計統計案例,或者完全缺乏與實際問題相關的統計案例,很難取得較好的教學效果。例如給金融工程專業的學生講測定離中趨勢的指標標準差時,可以結合股票投資的例子說明標準差度量風險的應用,以引起學生的學習興趣。

二、《統計學》教學改進措施

1、提高教師素質

大數據對統計學的挑戰要求統計學教師必須加強專業學習,及時學習和接受新的知識,提高自身專業素質。作為一名統計學教師,課堂教學不僅要給學生傳輸知識,還要與網絡資源相結合,充分發揮多媒體在統計教學中的作用,形象生動地展示統計過程和分析應用,通過實際的統計數據案例分析與學生互動,及時設置統計理論與實際數據分析相關啟發性問題,調動學生的學習興趣和主動學習積極性。同時,各財經院校要針對各自的具體情況采取有效措施,不定期或定期舉辦統計學授課經驗交流會或送青年教師參加國內一流大學舉辦的課程培訓或進修,為教師提高授課技巧創造有利條件,并注意吸收高學歷、高學位的統計專業人才充實到統計教師隊伍以提高統計學教師的整體素質。

2、改革教學方法和手段,增強學生學習的主動性和積極性

改變傳統教學方式,充分利用網絡資源充實多媒體教學課堂內容,調動學生主動學習的積極性和主觀能動性,提高學生綜合運用統計學方法解決實際問題的能力。在教學過程中采取“講授式教學”、“啟發式教學”、“互動式課堂討論”、“理論與案例結合”等形式多變的授課方法,以達到學生主動融入課堂、主動思考的更好教學效果。雖然各種教學方法都有不同的特點,但是授課過程中要根據學生的專業特點適當調整教學內容,并根據教學內容的性質和特點選擇合適的教學方法或多種教學方法進行優化組合,使學生能夠較容易地融入課堂,以快速掌握課堂知識取得較好的教學效果。

雖然多媒體教學具有內容豐富、所含內容信息量大的特點,可以圖文并舉形象生動地展示課堂內容,已經成為主流教學手段,但是僅用多媒體教學,忽視黑板板書教學,會使得課堂內容含量過大而導致學生的思維跟不上教學進度,特別是統計學課程內容涉及較多數學公式推導和定理證明,不用板書進行嚴密的推導,不利于學生理解和掌握。因此,在教學過程中應將傳統板書教學和多媒體教學相結合,充分利用這兩種不同教學方法的優勢,達到更好教學效果的目的。

3、積極引進數學專業教師,優化教師知識結構

財經類院校要積極引進數學專業出身教師擔任統計學教師,講授內容上對所涉及的數學理論進行適當的推理證明、補充最新統計方法并適當深入講解理論在實際應用時的重要性,將理論與實際應用相結合,培養財經院校非統計專業學生的邏輯思維和理論與實踐結合的能力,讓學生在未來工作中遇到處理實際問題時能夠具有較強的理論基礎應用于實踐,并為實現數據處理方法創新、理論創新和知識創新打下較好的基礎。

4、將理論教學與實踐相結合,加強軟件應用實踐教學

財經類院校開設統計學課程的目的是為學生更好地學習專業理論知識提供數量分析的理論與方法,為學生運用統計學的理論與方法分析、研究其專業實際問題提供方法論基礎。而統計學正是以經濟、金融、社會等實際現象的數量方面為研究對象,通過統計軟件直觀處理和分析實際問題的方法,因而教學過程中要與學生所學專業相結合,選擇SPSS、SAS或R軟件進行案例教學,培養學生熟練應用統計軟件進行數據分析的能力,為學生將來獨立處理大數據問題打下堅實的實踐基礎。

5、改革傳統考核方式

《統計學》是一門側重實際應用的方法論課程,傳統的考核方法主要以閉卷筆試為主,考核內容主要是統計基本理論和方法,通過期末閉卷考試并不能客觀準確地評價學生對這門課的掌握程度和實際應用能力,當學生遇到具體的實踐問題時往往不知如何處理。因此,有必要對統計學課程考核方式進行改革??梢詫W生的期末總成績從傳統的閉卷考試方式改成由平時成績20%、軟件實踐30%和筆試成績50%三部分構成。筆試考核內容突出實用性和工具性,可設置開放試題,重在考核理解而不是死記硬背定理或公式,考查學生綜合利用統計知識和方法分析和解決實際問題的能力,使學生不僅學到統計學知識,又能靈活地運用于實際問題。

三、結語

隨著大數據時代的到來,社會對具有扎實統計基礎的數據分析人才需求越來越多,《統計學》作為數據分析方面重要的基礎工具課程,對于財經類學生的專業課學習和畢業論文設計及將來從事金融、管理、經濟等行業數據分析相關專業工作十分重要。因此,要提高統計學課程的教學效果和教學質量,任課教師不僅要努力鉆研統計基礎知識,探索新的統計授課方法,提高自己的綜合素質,同時也要勇于探索適合不同專業特色的教學內容,編寫符合新時代特征的新的教學案例和多元化的教學手段,在教學活動中不斷實踐探索,切實加強理論教學與實踐教學相結合,改革已有考核方式,提高教學效果和質量。

(基金項目:吉林省教育廳“十二五”社會科學研究基金項目(2015348)。)

【參考文獻】

[1] 游傳新:高校統計學教學存在的問題與改革思路[J].長江大學學報(社會科學版),2008(5).

[2] 馮蕊、王國輝:高職財經類非統計專業統計學教學中的問題與思考[J].科技和產業,2010(6).

亚洲精品一二三区-久久