數據分析方法范例6篇

前言:中文期刊網精心挑選了數據分析方法范文供你參考和學習,希望我們的參考范文能激發你的文章創作靈感,歡迎閱讀。

數據分析方法

數據分析方法范文1

[關鍵詞]新媒體營銷;企業轉型升級;市場營銷模式

1引言

新媒體營銷是隨著互聯網技術不斷發展而衍生的重要產物,它是以移動平臺為載體,以信息技術為橋梁而實現的企業網絡市場競爭的過程。這種模式的出現意味著企業與現代科學技術的接軌,是企業智能化數據化發展的鮮明體現。企業在新媒體平臺和技術的指導下,能夠依靠各類先進技術,轉變自身的發展方式。其中最為突出的應用便在于企業對數據分析的引進。

2分析數據,確立市場受眾群體

企業要想在眾多新媒體平臺營銷中脫穎而出,就必須掌握符合自身市場定位的消費群體,要讓自身生產的產品能夠有廣泛的接受度,要取得屬于自身獨有的市場信任感和公信力。這也就意味著企業要主動出擊,積極地吸引消費者群體的關注和重視。如果一個企業發展自身新媒體營銷的方法,僅僅是通過水軍或者是買來的粉絲,或者是通過轉發抽獎等,那么這個企業只會在短時間內取得一定的爆發式關注,無法取得長遠的市場利益,也沒有辦法真正的給消費者留下深刻的印象,自然也不能根據消費者的喜好和興趣制訂出針對性的市場營銷方案。這就需要企業通過數據分析的方法來明確自身的受眾群體。[1]首先,企業要用數據分析的方法,對自身已有的市場發展基礎進行系統的分析和總結,整理出自身的市場定位和發展特點,包括品牌形象、競爭優勢、產品性質等。在此基礎上,大致地規劃消費者的群體范圍,制訂相應的宣傳方案和宣傳規劃,同時也要注意把握時間的限制,要盡可能地尋求時間和效益之間的平衡。在這一過程中,企業要按照消費者的點擊喜好和頻率,來制定有針對性的宣傳模式,這樣可以更為有效地吸引消費者的關注。其次,企業要重視用戶之間的傳播和轉發,企業要在吸引一批粉絲的基礎上適當地進行轉發和抽獎活動,擴大自身的市場影響力。最后,企業也要在這一過程中精確自身的市場定位,要動態地觀察宣傳的成果和績效,要尋找大眾的認同感。這便要求企業要借助數據分析和檢索的平臺,搜索與自身宣傳相關的信息確立關鍵詞和重點語句,并分析大眾對于自身的評價和看法,更好地改進營銷中存在的缺陷和不足。同時要在此基礎上,讓自身的宣傳內容更加量化和準確,更好地提升在用戶之間的口碑。

3分析數據,確立市場營銷載體

根據上文所述,企業在新媒體營銷中所進行的宣傳是離不開固定的平臺和載體的,移動平臺是企業信息和展現自身形象的基礎與保障。因此,企業要十分重視自身新媒體營銷工具的選擇,要運用數據分析的方法精準地統籌和管理市場營銷的信息,推動網絡營銷能夠適應自身發展的特點和規律。同時,數據分析方法還可以把企業自身經營的特點與不同的新媒體平臺進行融合,對比其結合后的實際效益和成果,同時也可以與事先的市場規劃設計相比較,在此基礎上選擇最為合適的企業新媒體營銷載體。[2]之所以運用數據分析的方法來選擇企業新媒體營銷載體,是因為現階段網絡企業的發展形式多種多樣,不同的企業也有自身不同的市場定位和產品特點,彼此之間相互獨立,但是也緊密聯系。這也就意味著,各類企業在共同運用新媒體網絡平臺這一方法進行市場營銷的同時,也要根據自身的發展特點來選擇適合自己的宣傳載體和工具,只有這樣才可以促進宣傳內容的有效傳播。當下企業利用新媒體進行宣傳的主要形式包括紀錄片、文字和圖像等,也可以是多種表現形式的結合。盡管在宣傳方式上具有多樣性,但是否能真正的起到吸引用戶的作用還需要依靠用戶的主觀能動性。這就要求企業在選擇好自身營銷載體的基礎上,利用后臺運行接收數據信息的方法,分析用戶點擊頻率最多的板塊和內容,總結出現階段自身市場發展應當跟隨的主流趨勢,以及分析當下營銷平臺運行的成果。例如當下的微博小程序,就是企業依靠文字推送或者視頻的方式,與用戶建立線上的交流和溝通,在此基礎上根據用戶的點擊頻率來制訂出更有針對性的市場營銷方案。

4分析數據,確立信息展示模式

現階段,有許多企業建立了自身運營的自媒體平臺,有相當一部分是需要用戶下載相應的軟件,并注冊賬號才可以獲得相關的信息。用戶在注冊之后,便可以通過在移動端登錄的方法來完成后續操作。[3]但也正是因為這種登錄方法的存在,用戶會獲得比其他平臺更多的市場信息。這就在一定程度上激發了用戶的厭煩心理,有相當一部分用戶會由于時間的限制,直接略過企業所的信息。同時,也有一部分企業將自身的信息運用網頁鏈接或者是二維碼的方式展現出來,用戶必須要在登錄網站的基礎上再一次點開網頁鏈接,這就會讓用戶覺得瀏覽信息是一件非常煩瑣的事情。因此,企業要重視自身信息展現形式的轉變,企業要盡可能地選擇簡潔明了的形式突出自身信息的重點,要讓用戶可以看到自身營銷的優勢和特點。企業可以用數據分析的方法,統計出用戶容易接受的信息展現形式,并按照類別進行劃分。當下,用戶容易接納的是企業圖文并茂的信息展現形式,可以是圖片和文字鏈接的結合,也可以是視頻和文字鏈接的結合,或者是將鏈接安置在圖片上。企業就可以根據用戶的喜好,將自身內容展現的形式進行改革和優化,例如企業可以將市場經營的方向和產品的性能,利用形象化的圖片展示出來。讓用戶可以一眼就看到自身的品牌特色,提高自身的吸引力。在這一過程中企業要意識到信息真實準確表達的重要性,企業可以在原有的基礎上進行適當地渲染和潤色,但是不能虛假信息,不能夸大其詞,不能讓用戶接受錯誤且夸張的市場營銷數據。

5分析數據,確定市場發展價值

企業運用數據分析的重點不僅是要打造更為針對性的市場營銷方案,更是要在數據信息的分析過程中審視自身的市場經營價值,分析自身的發展建設前景,評估現階段自身方案的質量和效益,并以此來為未來的長遠發展打下堅定的基礎。因此企業要用數據分析的方法,對自身新媒體運營平臺進行階段性和周期性的監督,分析現階段自身在市場競爭中的地位。[4]監督的內容主要包括平臺粉絲的瀏覽量和點擊率、粉絲的轉發量、粉絲總量的增減、除粉絲之外的市場其他用戶點擊率,以及現階段市場營銷的經濟利潤和收益等。這樣就可以在很大程度上幫助企業確定自身營銷平臺選擇的正確性,分析自身市場發展定位的準確性。

數據分析方法范文2

關鍵詞:供電企業;信息安全;大數據;分析方法;思路;探討

前言

智能化的電網正在全面地實施建設。隨著以大數據為中心的IT技術的不斷融入,當前我國的供電企業展開了大數據分析的研究,以便更好地使得大數據應用到整個配網的規劃當中。此外,還要根據電網的實際數據情況,把數據應用到智能變電站的建立、智能電網的調度及供電信息的采集等各個方面。進而有效地提高我國供電企業的管理水平及處理業務的能力。然而,信息化新技術在應用的過程中也具有一定的風險因素,所以需要建立大數據的安全分析結構,進而對數據進行相應的處理并把安全分析方法應用到整個供電企業的信息系統中去,進而更好地為供電企業的數據安全提供保障。

1供電企業的信息完全風險分析

大數據作為供電企業的管理工具是一把雙刃劍,給供電企業管理提供了便利,提高供電企業的管理水平和管理能力的同時,也給供電企業帶來了一定的挑戰和風險因素。使得企業數據處理、收集及傳輸的風險等級提高。若企業內部的數據出現問題,則會使得數據在進行傳輸的過程中被盜取和竊聽,這給企業的管理帶來了很大的風險。除此之外,企業在進行數據中進行一定的儲存和利用的過程中,也會由于大數據系統的內部維護不到位而帶了很大的風險。若企業的數據被長時間地竊聽,就會使得不法分子有機可乘,采用各種方法來對數據后臺進行攻擊和試探,并尋找系統的薄弱之處。最后實行致命的攻擊,并造成系統的癱瘓。所以,大數據給在方便企業的信息管理的同時,也帶來了一定的信息安全挑戰。

2供電企業信息安全大數據所面臨的數據安全的需要

傳統的電力信息系統逐漸地走向了信息化處理的進程,智能化的電網模式帶給了供電企業信息系統數據安全更大的要求。每次進行數據的訪問時,都需要確定數據的訪問權限,并核實訪問者的身份,并查看是否被授權。供電企業的數據信息需要被完整地保護,并保障其不被刪除或者惡意的篡改。一旦供電企業發生一定的突發事件,需要大數據平臺對數據進行自動的備份,并使數據得到安全的保護。④要采取一定的措施來保證供電企業的數據在運行過程中的安全性不被破壞。⑤要切實保證整個供電企業的信息系統的網絡安全,控制供電企業信息系統的基礎安全信息網絡和供電企業內部比較重要的業務系統的安全。

3供電企業的信息安全大數據分析思路

當前供電企業內容的安全信息系統逐漸地向著對抗型的信息安全系統方式轉變,并使得電力系統的大數據網絡可以積極地應對外界的攻擊。并對潛在的敵人進行分析和識別,并歸納總結當前的供電企業的信息安全大數據的風險類型,從而采取相應的對策,并先發制人,提高安全大數據系統的防御能力。這就是當前供電企業的信息安全大數據的分析思路。大數據的分析和挖掘技術需要不斷地融入到大數據的安全分析中去,下圖是大數據的安全結構分析思路。供電企業的信息安全大數據分析思路是基于技術的安全分析和理念,是至今為止比較完善的大數據安全分析辦法,是供電企業大數據的核心環節,是對相對分散的信息進行采集并實現存儲,并對其進行一定的分析,最后把其分析結果進行分發,把所有的安全分析體系結合在一起,并實現安全技術的互動。

4供電企業信息安全大數據安全分析結構的數據處理

供電企業的信息安全大數據的結構具體根據業務的不同分為不同的數據庫進行處理。關系數據庫是當前最豐富的數據庫,是進行供電企業信息安全處理的主要形式。而數據倉庫屬于一種多維的數據結構,可以允許用戶進行匯總級別的計算,并對數據進行觀察。事務數據庫中記錄了每一個事務,并同時附帶了一些相互關聯的附加表。文本數據庫是對圖象進行描述的數據庫,文本數據庫與圖書館數據庫類似。而多媒體數據庫則是對圖像以及音頻和視頻的存儲,并用于存放內容的檢索。供電企業的信息安全大數據的存儲往往需要先確定好處理的目標,并對數據進行量化的處理,最后對數據進行一定的評估,最后進行結果的展示。將大量的數據進行集中化的處理可以切實地反映出安全數據的指標,并根據指標對安全數據進行相應的評估。

5供電企業信息安全大數據安全分析方法

當前,進行供電企業信息安全大數據安全分析的方法有很多,隨著大數據的技術體系逐漸成熟,目前對安全數據的分析算法也變得多樣化,很多分析方法比如分類技術方法、序列分析方法等等對大量的數據的分析具有很好的效果。而對于不同的數據庫可以采用不同的分析算法進行分析。比如,當利用關系數據庫和事務數據庫時,就可以利用序列分析的辦法進行數據的挖掘和統計;而數據倉庫除了需要進行聯機處理以外,還需要進行數據的挖掘;文本數據庫則是利用模式匹配以及關聯分析等方法相互結合來進行數據的挖掘分析。

6結論

針對供電企業的信息安全的大數據分析有很多的途徑,在進行供電企業信息安全的大數據分析時,需要對供電企業的安全數據信息進行全面預測,并利用多種分析辦法綜合處理。隨著當前大數據網絡技術的不斷發展,根據大數據的分析特點進行安全分析的辦法也在不斷地完善?;谛畔踩拇髷祿治龇椒ê退悸肪哂泻艽蟮陌l展前景,安全大數據技術的不斷革新,使得供電企業的防護網絡更加地發達,并逐漸實現了供電企業的大數據信息安全的評估系統的完善,使得供電企業的信息安全大數據發展更為迅速。

參考文獻

[1]鐘志琛.電力大數據信息安全分析技術研究[J].電力信息與通信技術,2015(9):45-46.

數據分析方法范文3

【關鍵詞】大型裝備制造 項目型制造企業 數據分析 決策支持

在我國制造行業的快速發展下,提升制造企業的管理水平已經成為當前需要重點解決的問題。隨著信息技術的快速發展,促進了制造企業數據分析和決策支持的發展。通過創建企業信息管理系統,可以有效提升企業的生產效率,使各個部門之間的工作更加協調。對分散、零碎的信息進行充分挖掘和利用。利用決策模型,對企業生產管理中遇到的問題提供決策支持。

一、基于數據倉庫的企業對集成的應用

(一)面向主題性

完成事務型處理的任務是傳統操作型數據庫進行的數據組織工作,各業務系統間存在相對獨立性,按照一定的主題組織數據倉庫中的數據。對主題而言,其概念比較抽象,通常情況下,一個主題同時與多個操作型數據庫有關系。例如,在確定企業的采購訂單時,需要分析供需情況、庫存信息、供應商信息等多方面的數據的綜合關系,然后做出最終的決策。

(二)集成性

一般情況下,操作型數據庫進行事務處理工作與某些特定的應用關系密切,數據庫間具有相對獨立性,通常具有異構性。抽取、清理原有分散的數據庫數據,然后對其進行系統加工、匯總和整理最終獲得了數據倉庫中的數據,并保證存儲在數據倉庫內的信息與規范的信息相一致。例如,在查詢銷售數據時,系統會根據輸入的條件要求,進行篩選、整理后提供出最終的決策參考數據。

(三)歷史變化的反映

當前的數據是操作型數據庫主要關注的,但是數據倉庫中還包括很多豐富的歷史性信息,系統將企業從過去某一時點(如開始應用數據倉庫的時點)到現在各階段的信息完整的記錄下來,企業可以以這些信息為依據,定量分析企業產品未來的發展情況。例如,企業可以通過分析產品上季度的綜合銷售情況以及市場反映來決策下一季度的生產量。

二、決策支持系統的概況

(一)決策系統的含義

Decision Support System 即決策支持系統,簡稱DSS,是指對大量數據和數學模型與數據處理模型等有機組合眾多模型進行綜合利用,通過人機交互功能,幫助企業各級決策者完成科學的決策的新型系統。機器學習(ML)興起于80年代后期,自動獲取知識有了新方法。數據倉庫(DW)和數據挖掘(DM)兩項新的決策支持技術興起于90年代中期。數據倉庫的發展是以數據庫為基礎發展的,支持決策是其發展目標。知識發現(KDD)是面向數據庫的機器學習方法發展的結果;“數據挖掘”是發現知識的關鍵步驟。決策的支持也是數據庫知識的功能。隨著決策支持技術的不斷發展,決策系統逐漸完善。

(二)決策支持系統組成部分

R.H.Sprague 提出DSS的構成部分為人機對話系統、數據庫與模型庫的兩庫結構。隨著決策支持系統功能的增強與擴大,對模型與方法進行分離存儲,因此,數據庫、模型庫與方法庫構成了 DSS。近年來,DSS 將人工智能技術、專家系統、知識工程的相關思想方法引進后,以原來的結構為基礎,新增知識庫,將推理機制引入,最終DSS的四庫結構框架形成。

隨著決策支持技術的發展提高,決策支持系統的體系結構不斷發展健全,傳統決策支持系統中的數據庫、模型庫與方法庫、知識庫與推理機、數據倉庫、OLAP、數據挖掘技術等都是其組成部分,將引進顯性知識與隱性知識同時引進到決策支持過程中是這種體系結構最關鍵的特點,保證推理的結果更科學合理,為決策層做出決策提供更高價值的參考依據。

三、實現數據分析與決策支持方法

(一)建立制造業決策模型庫

當前比較常用的決策模型系統如GIS、PDM、ERP、CRM、SCM 等。在選擇決策系統時,需要根據企業的發展戰略來進行選擇。通過決策模型,可以為企業的生產經營提供指導,使企業可以更好的把握市場、順應市場。企業用戶決策分析的存放模型是決策模型庫。進行決策的模型的建立是以大型制造企業生產過程中的材料采購、庫存管理、產品生產、市場營銷、財務管理、人力資源管理、研發設計、質量管理、售后服務等方面的數據為依據。決策模型被授予一定程度的權限,對數據進行訪問。然后以數據倉庫中獲取的數據為依據,對用戶指定的目標進行決策支持。系統描述現有模型的組成元素與其組成結構的知識,模型構造過程中的各類推理算法被獲取。以模型構建推理算法為基礎,使匹配模型的框架由新問題的屬性值填充,最終決策問題模型得以建立。

(二)實施制造業決策分析

對決策模型進行求解的過程就是決策分析的實施。通過理解決策問題獲得用戶需要決策的目標、意圖等方面信息,然后利用合適的決策模型分析獲得的數據,再根據規則與模型的求解算法獲得有價值的決策意見,將其提供給用戶。本系統規范描述每個模型包含的求解算法利用含有通用求解算法的模型很容易求解問題。但是如果沒有求解算法或者不確定利用哪種算法進行求解,平臺依據以前比較成功的相似的案例,將范例的求解方法求解問題。平臺會詳細記錄取得較好決策效果的案例,并用數據層的公用數據庫進行存放,這樣能夠及時調用成功的相似案例進行決策分析問題的求解。

(三)協作決策支持的多環節性

通常企業決策不會通過利用單一的決策模型得到。企業管理的決策方案案是利用了多模型的協作來實現決策的。協作決策的實施系統從兩個方面著手。

(1)為實現有效的智能理解需要利用人機智能交互接口實現,分解復雜的問題,最終可以得到結構有序的子問題、與決策問題有聯系的事實與數據、求解方案等;

(2)參與決策的模型可以利用平臺進行調用,與決策相關的模型的選擇可以通過分解的子問題實現,為了保證多個模型為特定的決策目標服務需要采用協調的合作機制。

數據分析方法范文4

關鍵詞 自組織映射 組織特異性基因 管家基因 基因表達譜

一、SOM算法介紹

由Kohonen提出的自組織映射(SOM)的神經網絡是神經網絡中適合用于對數據進行分類的有效方法。SOM神經網絡包含一個輸入層和一個輸出層,組織成一個二維的網格結構(圖1.1)。該網絡能夠從任意一個隨機選擇輸入的結點開始最終形成一個拓撲結構的映射,這個映射反映了輸入模式的內在的關系。但是運用SOM有一些參數的限制,首先需要指定類別數目,對映射空間結點進行權值的初始化等。如(圖1.1)所示,SOM網絡是一個的映射,如果這個神經元被安排在一個平面網格上面的話,這個神經網絡就稱為二維神經網絡,因為這個網絡將一個高維的輸入向量映射到一個二維的平面上面。給定一個網絡,輸入向量是一個維的向量,相應的第個突觸向量的第個元素與輸入向量的第個元素相連,這樣,一個維的突觸向量就和第個神經元實行連接。

圖1.1 SOM網絡的基本結構

SOM算法描述如下:

(1)令網絡學習次數,賦予初始化權值向量一個小的隨機向量值,對拓撲鄰域()、學習率()進行初始化,設置網絡總的學習次數()。

(2)當學習次數()小于總的學習次數()時,重復步驟3至步驟6。

(3)隨機選一個輸入向量進入網絡進行訓練。

(4)確定獲勝神經元,相應的權值向量為與輸入向量距離最短的向量,成為獲勝神經元,輸入向量與獲勝神經元的最短距離為,定義如下:

(1.1)

(5)按照下式更新獲勝神經元及其鄰域內神經元權值向量:

(1.2)

與函數定義如下:(1.3)

(6)令,如果,回到第(3)步繼續訓練,否則結束訓練。

二、數值模擬計算

本文以HUGEindex數據庫中人7000多條基因在19個正常組織中的表達情況這19個組織中表達的基因為樣本對其進行分析。不同組織下的全基因表達數據構成了一個7070x59的數據矩陣,其中每一個元素表示第個基因在第個組織中的表達水平值,行向量代表基因在19個人組織中的表達水平,成為基因的表達譜,列向量代表某一組織的各基因的表達水平。

(1.4)

本文運用SOM方法對人基因19個組織的59個樣本進行聚類,SOM網絡的拓撲結構見(圖1.2)及參數選擇見表(表1.1)。

圖1.2 樣本聚類SOM網絡結構圖

上圖中,根據Genechip得到的人體19個組織的59個微陣列數據所得到的信息,我們采用4x5的二維拓撲結構的SOM網絡對人體組織樣本進行分類(其中第(4,5)個結點為空),圖中每個結點的位置(結點位置用與輸入模式維數相同的向權值向量表示,初始權值由系統自動產生)為各個結點權值尺度化之后所得到的位置。

三、結論

通過分類可以將芯片實驗的59個樣本按照人體組織類別分為19個類別,并且與采用層次聚類法所得結果進行比較,可以看出自組織映射的聚類方法與層次聚類方法比較,可以看出采用SOM網絡聚類方法比層次聚類得到的結果更為明確,其分類正確率達到了92.2%,證明了SOM方法是有效的。

參考文獻:

[1]孫嘯,陸祖宏,謝建明.生物信息學基礎[M].北京:清華大學出版社,2005:282-285.

[2]許東,吳錚.基于matlab6.x的神經網絡系統分析與設計[M].西安電了科技大學出版社,2002.

[3]閻凡平,張長水.人工神經網絡與模擬進化計算[M].北京:清華大學出版社,2005.:11-34,360-395.

作者簡介:

數據分析方法范文5

【關鍵詞】大數據 網絡規劃 用戶價值 用戶感知

doi:10.3969/j.issn.1006-1010.2015.10.004 中圖分類號:TN929.53 文獻標識碼:A 文章編號:1006-1010(2015)10-0022-06

引用格式:李梅,杜翠鳳,沈文明. 基于大數據分析的移動通信網絡規劃方法[J]. 移動通信, 2015,39(10): 22-27.

1 引言

隨著移動通信網絡的發展和移動互聯網業務的增長,移動通信網絡的各類相關數據呈爆炸式增長。借助大數據強大的數據處理能力和數據挖掘技術,通過分析用戶行為、基于用戶價值和用戶感知規劃設計網絡,成為運營商提升網絡競爭力的關鍵環節。

傳統的移動通信網絡規劃需要借助海量的測試,分析總結網絡存在的問題,再基于對市場和業務的經驗預測,制定規劃方案。該過程中,測試結果的普遍性和業務預測的準確性制約了規劃方案的合理性,高昂的測試成本和冗長的測試工期影響了規劃效率。

基于此,提出了基于大數據分析的移動通信網絡規劃方法,通過大數據工具分析海量數據,實現用戶業務趨勢預測、用戶價值挖掘、用戶感知評估分析,進而能夠以用戶為中心、面向具體業務場景展開通信網絡規劃。同時,該方法能夠綜合分析CQT(Call Quality Test,呼叫質量撥打測試)、DT(Drive Test,路測)等多種前端測試數據和信令數據、位置數據、用戶業務信息等大量后臺數據,克服單一數據分析的局限,不僅能夠大規模降低測試成本、縮短方案制定時間,而且還提高了方案的科學合理性。

2 基于大數據分析的移動通信網絡規劃

體系

如圖1所示,本文提出的移動通信網絡規劃體系可分為數據層、管理層、業務層和展示層,各層均與大數據密切相關。

2.1 大數據數據層

該層采用HDFS數據庫和Hbase數據庫管理通信網絡相關的結構化、非結構化數據。數據主要來自于網管側和計費側,包括:核心網管數據、詳單數據、網優平臺數據、投訴數據、用戶信息表等,這些數據經過預處理、算法處理后,按照標準數據格式存放在Hbase里面。

2.2 大數據管理層

該層基于Hadoop管理平臺建立特定的數據預處理腳本和算法模型,實現對用戶價值和用戶感知數據的分析管理。

數據的預處理主要包括確實數據處理以及噪音數據處理。為分析用戶價值和用戶感知,本系統用到的大數據分析算法模型主要有層次分析法和聚類閾值法。

2.3 大數據業務層

該層是對用戶價值和用戶感知業務實施梳理與管理,對影響用戶價值和感知業務的各維度進行分析并找出其關聯關系。例如:用戶價值與收入、終端、業務、套餐的各維度關聯關系的梳理;用戶感知與回落之間的關系梳理等。

2.4 大數據展示層

該層是以圖表進行展示數據分析結果,輔助開展通信規劃,重點是對用戶價值與感知進行地理化展現、相關圖表的輸出。

3 用戶價值與感知評價分析方法構建

3.1 用戶價值評價體系構建

通信領域中的用戶價值評估是一個多層次、多因素的問題,需要針對相關的業務構建評價指標體系,能夠全面考慮用戶的收入特征、層次結構、業務特征相互聯系。

(1)建立用戶價值評價體系結構模型――AHP分析法

采用AHP法評價用戶價值時,首先是把用戶價值進行梳理,建立出以業務為基礎的層次結構模型,然后將用戶價值分解成收入、套餐、業務和終端4部分。具體如圖2所示:

用戶價值評價模型的層次一般分為:

最高層:用戶價值。

中間層:用戶潛力和消費能力。

最底層:用戶潛力包括用戶的套餐指標與終端指標;消費能力包括用戶的收入指標與業務指標。

基于以上的維度進行評分,可將評分落到各基站扇區,根據評分做出扇區化的圖層,并將網絡的價值扇區進行地理化呈現。

(2)確定用戶價值評價模型各指標權重

以AHP法確定用戶價值評價模型各指標的權重分為以下兩步:

首先,構建遞階層次結構。如圖2所示,目標層是用戶價值,該層是建立評價模型的目的和追求的最終結果。一級指標層為{用戶潛力,消費能力};二級指標層包括套餐、終端、收入、業務等。

其次,要建立判斷矩陣。根據模型同一層級的相關指標體系指標可構造判斷矩陣,將同一層次的指標元素按照其上層指標元素的重要性進行兩兩比較,判斷相對重要程度。一般都會邀請通信專業人士和資深人員組成專家小組,依據他們的通信專業知識和研究經驗進行評估,構造判斷矩陣。

(3)綜合權重計算用戶價值

針對移動通信系統,服從一定社會(地理和邏輯)分布的具有不同消費能力、行為和移動特征的客戶群體,在通信過程中形成的具有運營價值的業務活動區域叫做價值區域。

價值區域可以采用收入、終端、用戶、業務(數據和語音)“四維度”,基于各自評分標準進行評分;將評分落到各基站扇區,再根據評分做出扇區化的圖層,就可以將網絡的價值扇區進行地理化呈現。

根據AHP法得出的權重以及各維度的評分標準,可以算出各小區的綜合評分;再根據綜合評分,可定義TOP30%為高價值扇區,TOP30%~TOP50%為中價值扇區,TOP50%~TOP80%為一般價值扇區,TOP80%以上為低價值扇區;最后,根據高低價值區域的評定,可以將網絡的價值扇區進行地理化呈現。

該價值分析結果在規劃中可進一步拓展到區域層面、微網格層面,從而實現網絡建設目標精準定位,以更好地指導網絡資源投放。

3.2 用戶感知分析方法

(1)建立用戶感知評價體系結構模型

如圖3所示,與用戶價值評價體系結構模型建立的方法相似,仍采用AHP分析法,用戶感知評價模型可分為:

最高層:用戶感知。

中間層:網絡覆蓋和網絡質量。

最底層:網絡覆蓋主要為MR(Measurement Report,測量報告)覆蓋指標;網絡質量包括HSDPA(High Speed Downlink Packet Access,高速下行分組接入)用戶速率與3G回落指標。

(2)確定用戶感知評價模型各指標權重

與用戶價值評價模型各指標權重計算方法相似。

首先,構建遞階層次結構。如圖3所示,目標層是用戶感知,該層是建立用戶感知評價模型的目的和追求的最終結果。一級指標層為{網絡覆蓋,網絡質量};二級指標層包括MR覆蓋指標、HSDPA用戶速率、3G回落指標等。

其次,建立判斷矩陣。由專家根據經驗確定權重。

(3)綜合權重計算用戶感知

用戶感知可以采用MR覆蓋指標、HSDPA用戶速率、3G回落指標“三維度”,按照評分標準進行評分,再將評分結果落到各基站扇區,做出扇區化圖層實現網絡感知的地理化呈現。

3.3 價值與感知聯合評估

為了更好地指導網絡規劃建設,可將用戶價值分析方法和用戶感知分析方法聯合起來,建立4×3的價值與感知聯合評估矩陣,針對不同矩陣中的網格分別制定對應的資源投放策略。

價值與感知聯合評估矩陣中,不同網格的資源投放策略建議如表1所示(紅色、綠色區域為重點投資區域)。

4 應用案例

在某運營商本地網的無線網絡規劃中,運用上述的分析方法對2014年6月的7 000萬條語音原始詳單、5億條數據原始詳單、238萬條用戶原始信息詳單進行了大數據分析。

4.1 價值區域分析

(1)終端分布分析

網上現有用戶約110萬戶,其中支持3G業務的終端56萬戶,占比50.7%,僅支持2G業務的終端54萬戶,占比49.3%;約一半用戶終端不支持3G業務,3G終端使用者中有一半終端使用的是2G套餐。

(2)業務分布分析

現網用戶的業務分布統計情況是:語音業務63%承載在2G網絡上,37%承載在3G網絡上;數據流量2G承載24%,3G承載76%??紤]到3G網絡的業務體驗更好,且網絡資源更為豐富,應通過各種措施加快業務的遷移,促進2G/3G網絡的融合發展。

(3)套餐分布分析

現有用戶的套餐數據統計結果如圖4所示:

從圖4統計分布可知,低端用戶貢獻了61%的收入,但占用了73%的流量資源和65%的語音資源。低端用戶單位收入消耗的網絡資源更高,說明高流量不一定帶來高收入;市場營銷策略是影響用戶規模、用戶行為以及網絡資源使用的主要因素,為此,建議規劃與市場應緊密結合,以計劃為先、網絡先行,市場與建設互相配合、逐步推進。

(4)用戶收入分布分析

從用戶收入角度分析,結果如表2所示:

從表2統計分析可知,使用2G套餐2G終端ARPU(Average Revenue Per User,每用戶平均收入)值低于2G套餐3G終端,3G套餐2G終端ARPU值低于3G套餐3G終端,3G套餐ARPU值整體高于2G套餐,3G終端ARPU值整體高于2G終端。

從以上“收入、套餐、終端、業務”四維度進行扇區化統計,各扇區統計結果如圖5所示:

從圖5統計分布可知,高價值小區數占比為30%,收入占比達到72%;中價值小區數占比為20%,收入占比達到16%;高/中價值全網小區數占比為50%,收入占比達到88%,高價值小區各維度占比均接近70%,各維度評估合理。

4.2 用戶感知分析

(1)用戶速率分析

網絡單用戶下載速率統計分布如圖6所示:

從圖6統計分布可知,全網速率大于1Mbps的扇區占比為90.3%,需重點關注低于1Mbps區域的速率改善。

(2)3G用戶回落分析

3G用戶回落指標統計分布如圖7所示:

從圖7統計分布可知,全網回落評估指標差的扇區占比為23.2%,需重點關注回落評估指標差的扇區的深度覆蓋問題。

(3)用戶感知MR覆蓋分析

對MR數據中扇區級的RSCP(Received Signal Code Power,接收信號碼功率)進行統計,其分布如圖8所示:

從圖8統計分布可知,全網MR覆蓋指標差的扇區占比為20.87%,需重點關注MR覆蓋指標差的扇區的深度覆蓋問題。

4.3 價值與感知聯合分析

綜合以上價值區域及用戶感知分析,按照專家法取定的權重對各維度指標進行綜合評分,得到全網各小區的綜合評估分析結果,統計各類小區占比如圖9所示:

從圖9統計分布可知,全網綜合評估高/中價值扇區中感知中/差的扇區占比為34%,這部分區域將是本次規劃中需要重點投入網絡資源的區域。具體分布如圖10所示:

5 結束語

綜上所述,通過對現網用戶的收入分布、終端分布、套餐、業務、用戶感知等多維度分析,可精準定位高價值扇區及高價值區域,以進一步指導網絡的精準化規劃設計,引導投資的精準投放。除此之外,基于用戶價值和用戶感知的多維度分析還可以應用于市場營銷、渠道規劃等領域。

基于大數據的價值分析對運營商而言,是市場驅動、精細化管理的重要途徑,有利于改變傳統的經營模式,改善用戶感知、增強自身競爭力,從而能夠有效應對來自于虛擬運營和OTT業務的沖擊。

參考文獻:

[1] 黃勇軍,馮明,丁圣勇,等. 電信運營商大數據發展策略探討[J]. 電信科學, 2013(3): 6-11.

[2] 劉旭峰,耿慶鵬,許立群. 運營商獲取移動互聯網用戶價值的策略研究[J]. 郵電設計技術, 2012(8): 9-12.

[3] 袁首. 多網協同下的電信無線網絡規劃方法研究[D]. 北京: 北京郵電大學, 2012.

[4] 曹艷艷. 3G無線網絡規劃[D]. 濟南: 山東大學, 2005.

[5] 李勇輝. 大數據概念辨析及應對措施[J]. 互聯網天地, 2014(1): 11-14.

[6] 龍青良,李巍,呂非彼. 基于用戶感知的WCDMA無線資源效能評估方法研究[J]. 郵電設計技術, 2014(9): 33-39.

[7] 朱強. 3G無線網絡規劃和優化的探討[J]. 通信世界, 2005(30): 57.

[8] 任毅. 3G無線網絡規劃流程[J]. 電信工程技術與標準化, 2005(11): 15-18.

[9] 郭金玉,張忠彬,孫慶云. 層次分析法的研究與應用[J]. 中國安全科學學報, 2008(5): 148-153.

數據分析方法范文6

關鍵詞: 關鍵詞模板庫; 景區輿情; 滿意度; 評價數據

中圖分類號:TP391 文獻標志碼:A 文章編號:1006-8228(2017)03-62-03

Abstract: This paper puts forward a method of analyzing public opinion and satisfaction on the evaluation data of scenic spots based on tourist demand template. By means of keywords template library building and expansion based on the template of tourism demand, the paper analyses and builds the model of the public opinion and satisfaction on the evaluation data. It solves the problem that unstructured content such as tourists' travels and evaluation cannot be efficiently searched and utilized by other tourists. It can not only provide tourists with scenic spots' comprehensive satisfaction value, but also satisfaction values in the specific area of cuisine, housing, transportation, travelling, shopping, and entertainment, and even more specific related content of the satisfaction value in those six aspects. Thus it helps visitors quickly understand the evaluation of the various parameters of the area.

Key words: template library; public opinion of scenic spots; satisfaction; evaluation data

0 引言

隨著經濟的發展,現在已經進入旅游智能化階段和大數據的時代,游客通常通過查看媒體互動分享評價來決定自己旅游計劃。然而,傳統游客在游記中對景區景點的評價內容是非結構化、離散的,即難以采用一定的算法對其進行有規律地提取和組織,從而導致不能采用計算機智能對其提取分類。然而游客對“吃、住、行、游、購、娛”的評價獲取需求頗為急切,因此需要采用一種新的技術來實現游客評價的自動化提取并對大量的數據進行高效的有價值的分析[1-3]。

1 本文提出的方法步驟及特征

本文提出一種基于旅游需求模板的景區評價數據分析輿情滿意度方法,主要有基于旅游需求模板的關鍵詞模板庫構建(見圖1)、關鍵詞模板庫的擴充(見圖2)和針對景區評價數據的輿情滿意度分析計算三個步驟。該方法的特征在于:所述的旅游需求模板主要由內容大類關鍵詞、內容子類關鍵詞和情感關鍵詞構成,每個內容大類關鍵詞下分屬有其對應的內容子類關鍵詞,每個內容子類關鍵詞下分屬有其對應的情感關鍵詞[4-5]。

1.1 基于旅游需求模板的關鍵詞模板庫構建

主要由基于旅游需求模板引導評價的內容大類關鍵詞、內容子類關鍵詞和情感關鍵詞構成,每個內容大類關鍵詞下分屬有其對應的內容子類關鍵詞,每個內容子類關鍵詞下分屬有其對應的情感關鍵詞。

關鍵詞模板庫初始由列舉而成,所述的內容大類關鍵詞包括吃、住、行、游、購、娛的六個類別;所述的內容子類關鍵詞是在內容大類關鍵詞的基礎上構建的;所述情感關鍵詞是對內容子類關鍵詞的描述性詞語。

1.2 關鍵詞模板庫的擴充

關鍵詞模板庫的擴充具體是采用以下方式對內容子類關鍵詞和情感關鍵詞進行擴充:

⑴ 在已構建的關鍵詞模板庫基礎上,通過網絡爬蟲工具在內容大類關鍵詞所在段落文字附近搜索內容子類關鍵詞,將找到的在已構建關鍵詞模板庫中不存在的內容子類關鍵詞作為新的內容子類關鍵詞,并加入到關鍵詞模板庫中;

⑵ 在已構建的關鍵詞模板庫基礎上,通過網絡爬蟲工具在內容子類關鍵詞所在段落文字附近搜索情感關鍵詞,將找到的在已構建關鍵詞模板庫中不存在的情感關鍵詞作為新的情感關鍵詞,對新的情感關鍵詞賦權值后加入到關鍵詞模板庫中。

1.3 針對景區評價數據的輿情滿意度分析計算

所述針對景區評價數據的輿情滿意度分析計算具體是:由擴充后的關鍵詞模板庫通過網絡爬蟲工具搜索景區下的文字數據,抽取出內容大類關鍵詞所在段落文字附近的內容子類關鍵詞,再搜索抽取出每個內容子類關鍵詞所在段落文字附近的情感關鍵詞,從而獲得所有情感關鍵詞及其每個情感關鍵詞對應的內容子類關鍵詞和內容大類關鍵詞,然后構建景區輿情與滿意度的分析模型,通過景區輿情與滿意度的分析模型獲得以平均滿意度值作為該景區的輿情滿意度值。

2 景區輿情與滿意度的分析模型

⑴ 先采用以下公式計算獲得文字數據中所有評論中的關于某一個內容子類關鍵詞的滿意度值:

其中,表示第i個內容大類關鍵詞下第j個內容子類關鍵詞的平均滿意度值,t是分值(1~5),表示i個內容大類關鍵詞下第j個內容子類關鍵詞對應分值為t的情感關鍵詞的數量,Bij表示第i個內容大類關鍵詞下第j個內容子類關鍵詞,B{B11,B12,B13…B21,B22,B23…}代表內容子類關鍵詞集合。

⑵ 再采用以下公式計算獲得文字數據中一個內容大類關鍵詞的滿意度值:

其中,表示第i個內容大類關鍵詞的滿意度值,表示第i個內容大類關鍵詞下第j個內容子類關鍵詞的權值,n表示第i個內容大類關鍵詞下內容子類關鍵詞的數量,A{A1,A2,…,A6}代表內容大類關鍵詞集合。

⑶ 再采用以下公式計算獲得該景區的綜合滿意度值:

其中,Y表示景區的綜合滿意度值,i表示內容大類關鍵詞的序號,i取值范圍是1~6,表示第i個內容大類關鍵詞下的的權值。

3 具體實施方式

3.1 基于旅游需求模板的關鍵詞模板庫構建

⑴ 內容大類關鍵詞構建,主要包括吃、住、行、游、購、娛幾個大類。

⑵ 內容子類關鍵詞構建,主要是在內容大類關鍵詞的基礎上構建,比如和內容大類關鍵詞吃相關的內容子類關鍵詞有飯店、餐館、快餐店、小吃街等。

⑶ 情感關鍵詞構建,主要是在內容子類關鍵詞基礎上構建,比如和內容子類關鍵詞‘吃’對應的情感關鍵詞有味道很好,價格實惠,環境優美等。

3.2 關鍵詞模板庫的擴充

⑴ 基于需求模板引導評價的內容子類關鍵詞庫擴充,通過網絡爬蟲工具在內容大類關鍵詞附近搜索相關的內容子類關鍵詞并與已有的模板庫進行對比,遇到新的內容子類關鍵詞后,自動加入到模板庫,比如遇到與內容大類關鍵詞吃相關的新的內容子類關鍵詞野味店等。

⑵ 基于需求模板引導評價的情感關鍵詞庫擴充,通過網絡爬蟲工具八爪魚采集器,在內容子類關鍵詞附近搜索相關的情感關鍵詞并與已有的模板庫進行對比,遇到新的情感關鍵詞后,自動加入到模板庫。

⑶ 情感關鍵詞均已由用戶進行賦分,給出分值(1~5),比如非常好/棒極了/美妙極了,這三個情感詞表達的滿意度是相同的,對應的分值都是5分,一般/湊合/還行對應的分值則都是3分;差極了/難受死了/簡直就是受罪/再也不會去了,對應的分值則是1分。

3.3 針對景區評價數據的輿情滿意度分析計算

⑴ 根據已有模版庫構建評價體系表。內容大類關鍵詞和內容子類關鍵詞的權重和情感關鍵詞的分值以及相同分值評論數量如表1所示,表中{}表示第i個內容大類關鍵詞下第j個內容子類關鍵詞對應分值為t的情感關鍵詞的集合。

⑵ 通過網絡爬蟲工具搜索景區網頁的每個帖子,按內容子類關鍵詞,搜索所有相關的情感關鍵詞,根據表1進行分類統計,把相應的情感關鍵詞的數量記錄到對應到中。

比如:通過網絡爬蟲工具搜到網頁得到1000個情感關鍵詞,有600個是與內容大類關鍵詞‘吃A1’有關的,其中300個是與內容子類關鍵詞‘味道B11’有關的,對應的情感關鍵詞集{}及數量如表2所示。

由內容子類關鍵詞滿意度計算公式可知該景區關于吃的味道的滿意度值為:

即:該景區關于吃的味道的滿意度值為3.6,同理可以計算其他內容子類的關鍵詞的滿意度值。

4 結束語

通過這種方法得到滿意度值,解決了以往游客的游記、評價等非結構化內容難以被其他游客高效搜索利用的問題,除了可以向游客提供某個景區的綜合滿意度值外,還可以向游客提供該景區具體的關于吃、住、行、游、購、娛六個方面的滿意度值,以及比吃、住、行、游、購、娛更具體的相關內容子類關鍵詞的滿意度值,讓游客快速了解該景區的各個評價參數。

參考文獻(References):

[1] 維克托.邁爾舍恩伯格著,盛楊燕,周濤譯.大數據時代:生活、工作與思維的大變革[M].浙江人民出版社,2013.

[2] 馬建光,姜巍.大數據的概念、特征及其應用[J].國防科技,2013.2:10-11

[3] 黃先開,張麗峰,丁于思.百度指數與旅游景區游客量的關系及預測研究-以北京故宮為例[J].旅游學刊,2013.11:93-100

亚洲精品一二三区-久久