互聯網中的個性化推薦思考

前言:尋找寫作靈感?中文期刊網用心挑選的互聯網中的個性化推薦思考,希望能為您的閱讀和創作帶來靈感,歡迎大家閱讀并分享。

互聯網中的個性化推薦思考

 

12011年2月JohnDoerr首次提出“SoLoMo”概念后,由social(社交)、local(本地化)和mobile(移動)所標識的這一新的移動互聯網發展趨勢被業界廣泛認可,認為SoLoMo模式是用戶消費模式、基礎信息建設、移動技術變革等多方面的融合和統一。中國電信集團公司(以下簡稱中國電信)在向現代化“綜合信息服務提供商”的轉型過程中,業務模式互聯網化的特性逐步顯現并越來越明顯;特別是在移動互聯網進入高速發展時期后,根據中國電信對移動互聯網時展的精準解讀和定位而提出的“新三者”戰略目標表明,移動業務應用的一個重要方向就是要站在移動互聯網時代的前列,并加強了其在價值高端區域的地位。   在SoLoMo趨勢下,成功的移動互聯網應用再次證明,要以戰略性的高度來重視客戶的需求和體驗,技術和應用兩手抓,更多地激發用戶在應用中互動性、實時性的參與意識,充分運用數據挖掘理念,精確聚焦用戶需求,為用戶提供個性化、差異化的服務;以產品的生命周期理論為指導,適時更新產品功能或開發出新產品,持續刺激用戶對產品的興趣,增加用戶黏性,實現用戶價值最大化。   2業務運營發展的關鍵問題   移動互聯網時代,用戶的規?;洜I愈發重要,沒有市場份額作基礎就難言生存,更別談發展。工業和信息化部的統計數據顯示,截至2011年年底,我國的3G用戶總數達1.28億戶,其中,中國電信的3G用戶超過3700萬戶,且有近一半的3G用戶使用中國電信天翼智能終端。這些智能終端為移動互聯網業務的興起和發展奠定了強有力的基礎,除手機移動終端外,其他各種平板電腦、電子閱讀器、移動導航等設備終端同樣也承載著大量的移動應用。   相比于傳統的固話、PC互聯網業務,移動互聯網時代是個性化更明顯的時代,用戶提出了更高的能動性需求:用戶不再滿足于被動地接受信息瀏覽、信息推送等服務模式,而是希望以參與者的身份與內容提供商一起通過自制或定制的方式來展示自己的獨特個性,這也是SNS、UGC等在社交媒體網站火爆的重要原因。因此,移動互聯網業務更需要收集這些用戶的行為特征,以新穎的創意和可持續的功能優化來吸引用戶,以極致的用戶體驗來提高用戶的黏性,并在規模化的基礎上,提供便捷新穎的交互性產品,促進移動互聯網類業務的創新和發展。   在移動互聯網業務中,以滿足用戶個性化需求為關鍵出發點,成功把握移動互聯網時代個性化、差異化的市場先機,甚至成為業務規則的制定者,需要把移動互聯網的內容、產品與用戶的年齡、身份、職業等自然屬性和消費特點、個性偏好、動態需求等特點相關聯,結合下面描述的移動互聯網業務特點,以數據挖掘的技術手段,如挖掘潛在用戶、提供用戶分群和進行交叉營銷等,做大做強整個產業鏈。   2.1個性化的用戶數據分析是產品成敗關鍵   SoLoMo應用的基礎是個性化信息的整合,因此建立具備能力開放功能的移動用戶行為知識庫平臺是SoLoMo應用的必要前提。   首先,快速圈住一批用戶是產品成功的先決條件。中國電信的基礎業務積淀了大量的真實用戶屬性和行為特征,如八大基地數據、移動互聯網日志、號百查詢記錄、用戶話務清單、電信CRM資料等,而云計算技術框架為這些海量數據的整合提供了可能。根據確定的主題領域分析建模后可得到綜合的用戶社交圈、興趣偏好、消費能力,建立一個最基礎的用戶知識庫平臺。   其次,還應該提供一個能力開放平臺,使移動用戶、終端提供商、應用軟件商、電信運營商、第三方平臺都可以通過靈活的接口豐富與修正用戶知識庫,構建一個共贏的生態價值鏈。   2.2提升用戶體驗是產品發展的動力和保障   移動應用產生的數據以碎片化的形式填滿用戶的24h。用戶體驗正日益成為驅動互聯網行業發展的原動力,未來的業務也將以“On-Demand”體驗為主,以Apple的產品為例,“簡潔是蘋果被認識最為普遍的美學特點”,其目的就是把用戶體驗做到極致,增加用戶黏性。   另外,從產品的內容本身來看,產品要不斷注入搶眼球的新玩法才能夠使產品不斷延續生命,保持核心競爭力。否則新鮮感過后,用戶容易產生體驗疲勞而逐步邁入寒冬。目前大多數SoLoMo應用,用戶群規模相對較窄,用戶活躍度更低,產品的同質化競爭激烈。故需要通過多種方式吸引用戶,提升產品的用戶體驗,用戶的深度參與反過來進一步刺激新的創意型產品。除了常規的界面動效設計、內容定期更新外,精確的屏幕適配性(屏幕尺寸、屏幕分辨率)、便捷的輸入輸出(如話音交互、手勢指令)都會給用戶的體驗得以升級。   2.3提供合理的用戶引導是產品規模化的前提   移動用戶的使用技能差異很大,因此提供合理的用戶引導可以幫助用戶更好地使用產品,最終提升用戶滿意度。不同于PC界面,移動終端的界面多受屏幕尺寸、適配繁瑣等條件所限,再加上產品功能的不斷膨脹,在簡化設計界面和追求功能豐富的二難選擇之間,需要輔助以必要的引導,告之產品的主要功能和獨有特色,從而引導用戶正確的操作和完成產品的主要功能,而不至于迷失在應用中而放棄產品。這些引導要建立在收集大量用戶行為特征的基礎上,綜合分析用戶的多種差異而得出的,甚至可以為了某類用戶而定制。   2.4發揮終端優勢是提高用戶體驗的重要途徑   硬件功能:本地化位置服務(locationbasedservices,LBS)是目前階段移動互聯網產品中應用最廣和最容易接受的服務,它與社交網絡、移動支付、移動廣告、數字內容發行等諸多移動互聯網重點業務領域的融合深度和廣度正在與日俱增。充分利用終端提供的定位、圖像等特性,對產品提供方便快捷的輸入方式、輸出滿足用戶需求的精確內容等方面都起到非常重要的作用,特別是以“簽到”類服務為代表的LBS應用中,地理信息以及用戶身份及狀態跟商業消費更容易契合而創造商機。#p#分頁標題#e#   軟件功能:以終端定制為例,除了進一步繁榮軟件應用商店類似的模式之外,還需要關注當前現狀。由于終端的種類繁多,給軟件的適配造成很大困難;同時仍有部分智能終端用戶在軟件的選擇、安裝、升級維護過程存在一定程度的困難,因此采用終端定制成為電信運營商備受青睞的選擇,可以將電信主推服務與移動終端深度整合,大幅度提升用戶體驗的同時,還可以盡可能圈進部分非智能手機,避免失掉這部分用戶群。   2.5服務綜合化是產品從用戶規?;呦蛴氖走x途徑   移動、社交和云技術,作為一種綜合的驅動力,改變了人們的聯系內容、聯系方式以及交易方式,單獨的垂直搜索類服務已經很難滿足用戶的需求。信息獲取、信息分享、一鍵支付這類需求要求應用的綜合化,使得用戶從一個入口進入后可以享受多種服務(如導航門戶、應用商店、搜索引擎、社區門戶、音樂、視頻、游戲等),進而實現精準廣告投放、流量經營、交叉營銷等盈利模式。   3數據挖掘工具及算法   本節重點分析基于商業和開源的挖掘工具、算法的特點及優劣,以及基于移動業務建立面向精確營銷的智能化用戶模型所面對的關鍵問題及解決方案。據RexerAnalytics2010年度數據挖掘調查的結果顯示,當前數據挖掘的主要特點呈現如下特征[1]。   挖掘算法上來看,決策樹、回歸和聚類分析依然是最常用的算法,且主要應用領域為CRM、市場營銷。   從數據存儲來看,數據挖掘依然主要發生在個人電腦上,數據一般也是存儲在本地,近幾年興起的云技術遠未達到普及。   從關鍵疑難問題來看,臟數據、數據挖掘概念的普及、對數據的訪問依然是數據挖掘人員面臨的最大挑戰。   從挖掘工具來看,開源數據挖掘軟件R-Project已經成為挖掘人員的首選(被調查者的比例高居43%),其次是Statistica(18%)。而且Statistica、IBMSPSSModeler和R-Project在2009、2010年被參與調查人員給了最高滿意得分。   從挖掘結果來看,模型輸出依然主要依賴于軟件本身,只有13%的挖掘人員給自己的公司的分析能力評為“優秀”,只有8%的人認為他們的數據質量可以被認為“很強”,可見這個領域仍存在很大上升空間。   3.1商業套件和工具概要   2007年Gartner“客戶數據挖掘魔力象限”的客戶數據挖掘工具評估中[2,3],SAS和SPSS還被評為處于領先地位,但跟2011年的報告對比后就會發現,經過幾年的技術和軟件發展后,該領域發生了很大的變化:主流的元數據管理軟件廠商(如Oracle、IBM)進入領導行列,而數據發現供應商(如Quiterian、Tibco、Tableau)正逐漸嶄露頭角并占據重要角色。因此Gartner給出的結論是,目前商業智能(BI)市場分裂為截然不同的兩個陣營,一方由傳統的BI平臺供應商組成,另一方由數據發現供應商組成。   以Quiterian的動態數據網絡(DDWeb)產品為例,核心價值在于它使數據挖掘和統計分析簡單易行,從而使這些工具更容易在以市場為導向的企業得到利用,后者雖然市場份額不是很大,但對前者的挑戰正逐步加強。   目前數據挖掘相關的工具主要有以下系列:SASEnterpriseMiner是一種通用的數據挖掘工具,按照SEMMA(抽樣、探索、轉換、建模、評估)的方法進行數據挖掘,性能較高,但SAS的軟件許可證的成本及開發預測分析的人力成本對其普及造成很大阻礙;而Clementine作為一種可視化數據挖掘工具,提供了多種圖形化技術,有助理解數據間的關鍵性聯系,指導用戶以最便捷的途徑找到問題的最終解決辦法,提出了CRISPDM(業務理解、數據理解、數據準備、數據建模、評估建模、模型)的6步方法論;另外還有數據庫產品內置的數據挖掘模塊,如:SAPNetWear7.0DataMiningWorkbench、Oracle11gDataMining、MicrosoftSQLServer2005AnalysisServices等。   3.2開源軟件簡介   開源(opensource)數據挖掘軟件有R-Project、Weka、Mahout等,但從實際應用來看相對成熟、完整、現成的開源解決方案較少:R-Project有很強的面向對象功能,可通過下載用戶撰寫的擴展包進一步增強,但由于R-Project需要較扎實的統計知識,造成了其學習曲線非常陡峭。Mahout是作為推薦引擎的一種實現框架,可以把常用的Content-Based推薦算法及協同過濾算法(Item-Based、User-Based)相結合,但在實際應用中要解決冷啟動、大數據量的性能下降等問題。   3.3云計算技術對數據挖掘的影響   根據Gartner的預測,盡管云計算的市場仍處于早期階段,但“云”作為一種顛覆力量,對多數的產業可能具有廣闊的、長期的影響。下一代的分析必然面對數據規模、復雜格式和交付速度的挑戰,甚至從傳統的離線分析轉向在線嵌入式分析。   云計算的MapReduce計算模型適合結構一致的海量數據,但像點擊流數據、互聯網訪問日志、社交網絡評論等非結構化數據更適合把云計算作為一種ETL工具來構建用戶行為庫;而對于大量的數據密集型應用(如數據挖掘任務),往往涉及數據降維、程序迭代、近似求解等復雜的算法,用云計算的方式實現比較困難。   4LBS應用框架及前景LBS提供了移動互聯網時代聚攏用戶的基礎能力,其核心概念(精準營銷、信息定位、區域受眾、位置服務)在SoLoMo模式下被廣泛應用,并形成了多種新型的創意產品的試驗田和新產品體驗的促成物。隨著移動定位技術的發展,不同精度的位置服務提供者相繼出現,服務的“本地化”概念也將呈現從米級到城市級多種尺度,但關鍵核心其實是服務和內容,“位置”在這里只是服務的一種載體形式。LBS應用的關鍵在于把移動互聯網的線上用戶和線下商店聯系起來并形成良性互動,重點應用模型有基于位置信息推送實時服務、基于協同過濾進行消費智能推薦、基于偏好構建虛擬社交圈等。#p#分頁標題#e#   誠如ThomasHusson“移動位置趨于無形”[4]報告中提到的LBS應用范疇所述:當位置和地圖越來越成為新移動產品和服務的標配功能之后,基本信息的提供已經遠遠不能滿足用戶的需求了,用戶生成內容(UGC)、實時數據(交通信息、優惠券和促銷等)、動態數據(評論和促銷)、虛擬現實等與用戶環境耦合的精準本地數據需求愈發顯著,把地理信息及其附屬的時間信息、行為預測引入商業模式中,必然帶給用戶全新的體驗。互聯網時代,數據量呈爆炸式增長,數據來源多樣化,如何把海量數據處理和挖掘算法結合起來,“淘金式”地尋找有價值的用戶信息成為關鍵,把消費者行為和本地數據連接起來的新模式,會產生與用戶環境耦合的更多精準本地數據。通過把線下和線上活動嫁接起來,帶動整合產業鏈的良性循環。   基于海量數據處理的LBS業務框架模型,按照處理流程可分為多源數據獲取層、云計算ETL處理層、用戶行為分析層、業務建模及應用層等邏輯架構,如圖2所示。該模型已經在“中國電信愛音樂”的相關項目應用,其中基于用戶已聽歌曲的內容推薦、基于當前位置的友鄰聽等功能的應用,在用戶的黏性和活躍度提高方面取得了良好效果。   多源數據獲取層主要靠離線方式收集用戶在業務消費過程中產生的歷史明細、行為習慣以及電信CRM用戶資料數據。這些數據因為來源于不同的業務系統,其業務標志、數據真實性、數據重復性等需要建立一套數據過濾規則來初步清洗。在海量數據ETL過程中,其大量的運算、臨時存儲等會產生嚴重的性能問題,可以借助云計算技術解決這一難題。在項目中,使用了基于Hadoop的開源分布式數據處理框架,通過幾臺廉價的PCServer即可處理“億×億”級的數據關聯。云計算的結果是已經格式化的用戶行為、興趣偏好等通用行為知識數據,通常存儲在關系型數據庫中,根據業務主題的需求即可構建對應的用戶模型并應用于移動位置業務。   5結束語   本文從SoLoMo業務特點和數據挖掘技術應用相結合的角度,以LBS為代表的典型移動互聯網應用,探索其業務框架及前景,但是受新算法復雜性和高效性的限制以及流量費用、隱私習慣等問題的影響,要實現更廣泛的應用還有很長的路要走。但隨著云計算技術的初現成效和更多數據挖掘工具、算法的改善,數據挖掘在移動互聯網時代的用戶行為分析、精確營銷以及市場預測中必然會發揮更大作用。

亚洲精品一二三区-久久