盤點:那些年,曾經被我們誤讀的大數據

論文類別:計算機論文 > 互聯網研究論文
上傳時間:2014/12/6 11:36:00

  (免費論文下載中心訊)如今,業界和學術界一直在討論一個詞,那就是大數據。不管是學術圈還是IT圈,只要能談論點兒大數據就顯得很高大上。然而,大數據挖掘、大數據分析、大數據營銷等等事情僅僅只是個開始,對大多數公司來說,大數據仍有很強的神秘色彩。於是,在我們還沒有完全搞明白如何運用大數據進行挖掘時,各種過於神化大數據的輿論就已經不絕於耳了。當然,也有很多人直接批判大數據或大數據營銷給我們造成的隱私威脅。也有很多人根本沒有搞清楚什麽是大數據,到底有什麽價值。

  於是,站在客觀的角度,圍繞下面幾個問題與大家分享有關大數據的幾個觀點,也扒扒大數據的那些事兒:

  1、大數據營銷和個人隱私泄露究竟有無因果和邏輯關系?

  2、大數據營銷到底能帶給企業什麽樣的價值?到底能帶給用戶什麽價值?用戶是否全盤否定或反感大數據營銷?

  3、如何正確看待大數據?如何看待大數據和傳統調查方法或統計學的關系?

  4、大數據營銷究竟面臨什麽樣的挑戰?

  一、大數據的迅猛發展與數據隱私的憂慮相伴而生

  社交媒體的出現,讓用戶數據的分享數量達到了難以估量的程度。而如今,社交媒體的種類有增無減,智能手機的更大普及,又讓更多用戶轉移到移動互聯網,從而又進一步貢獻更多數據和內容。這樣的數據增量讓全球社交媒體的收入大漲,僅根據咨詢公司Gartner2012年的研究結果顯示,2012年全球社交媒體收入估計達到169億美元

  一邊是社交媒體因為大數據的盆缽滿載,另一方面則是用戶不斷毫無保留的將個人信息交給互聯網,這些信息包括年齡、性別、地域、生活狀態、態度、行蹤、興趣愛好、消費行為、健康狀況甚至是性取向等。一時間,針對海量用戶信息的大數據挖掘、大數據分析、大數據精準營銷、廣告精準投放等等迅速被各大公司提上日程。

  比如,一個發生在美國的真實故事就會告訴我們,利用數據挖掘如何掌握我們的行蹤。一個美國家庭收到了一家商場投送的關於孕婦用品的促銷劵,促銷劵很明顯是給給家中那位16歲女孩的。女孩的父親很生氣,並找商場討說法。但幾天後,這位父親發現,16歲的女兒真懷孕了。而商場之所以未蔔先知,正是通過若幹商品的大量消費數據來預估顧客的懷孕情況。

  類似的大數據挖掘和營銷事件在今天更多的發生,尤其是社交媒體產生大量數據後。於是,許多人對個人隱私數據開始擔憂,開始批判大數據精準營銷侵犯了個人隱私,憂慮我們進入了大數據失控的時代,並將原因更多歸結於社交媒體。

  二、大數據營銷和個人隱私泄露之間不能完全劃等號!邏輯關系不成立!

  如果客觀的分析一下上述問題就會發現,這是一個難以分說的雞生蛋還是蛋生雞的問題。一味地批判大數據分析對個人用戶數據的泄露或濫用是不客觀的。

  因為,社交媒體的本質在於分享和傳播,社交媒體的出現的確滿足了人們分享個人信息、曬各種數據的欲望,讓人們在過去無聲無息的生活中突然轉移到了可以讓全世界看到自己的平臺上來。人們從而達到了內心的滿足感和存在感。因此,單從個體的背後心理來考慮,社交媒體對他們來說是有益的,他們不認為自己貢獻的是不可告人的秘密,既然分享出來,那一定是希望或允許別人看到的。因此,這是一種無形的默許的交易,用戶樂意把自己的各種瑣碎細節暴露於社交媒體,而對社交媒體上雜亂無章的海量用戶數據進行有序的分類和分析也沒有什麽不妥。

  當然,如果社交媒體平臺隨意濫用或泄露用戶的後臺數據,比如個人聯系方式、家庭住址、銀行等極為隱秘的信息,這的確是赤裸的侵犯隱私的行為,極其沒有道德,必須要受到譴責和法律制裁。

  但目前,許多大數據精準營銷的前提是對用戶在互聯網上留下的公開顯在的信息進行算法歸類和內容分析,從而對海量用戶進行人群劃分,或者對小眾群體進一步細分化,甚至達到某種程度上針對單個人的個性化定制,最終達到精準推送廣告或有針對性推出營銷活動的目的。

  所以,從這個角度來看,大數據精準營銷與個人主動分享和傳播到網絡上的信息數據之間並沒有矛盾。人們起初或許會驚訝:為什麽他們知道我想買什麽?為什麽他們知道我的需求?但隨著“猜透心思”的推送行為讓人們的生活越來越便利時,比如省去大量搜索、查找和對比產品或服務的時間,他們可能會十分習慣並依賴這種精準性,並不會在意他們本來就隨意分享到網絡上的雜亂信息被如何挖掘和利用。

  因此,用戶發布和分享的信息是否為隱私,在用戶分享信息之前就做過慎重考量和篩選。這一點非常重要,這是侵犯隱私與否的界限。那些被用戶選擇為不適合發布或不希望別人知道的信息就是用戶認為的隱私,而那些已經公開發布到社交媒體或網絡上的信息則被用戶認為是可以傳播的。

  所以,普通的對海量公開信息的分析、挖掘、歸類,從而進行精準營銷的大數據行為不能一味被罵成是對用戶利益的損害。而那些對用戶存儲在某些位置、不希望被他人了解的信息(私人存儲的信息)如果被別有用心的人泄露或利用,那這就是隱私侵犯行為。但這就不能歸罪於大數據,而應質問存貯平臺的安全性問題。

  因此,我們不能過分解讀大數據精準營銷。其實,問題的本質在於,人們是否真的在意雜亂信息的去向(涉及到分享信息的背後心理和動機)?以及大數據營銷是否真的觸碰了人們不可告人的秘密或底線(需要對秘密和底線重新定義)?因為,如果人們默認分享的都是公開的,那麽侵犯隱私的概念就是不成立的。如果人們有不希望別人知道的信息,也不會貿然在網絡上分享和傳播。

  三、大數據營銷究竟會給企業和用戶帶來什麽價值?

  討論完上面的問題之後,我們是否應該誠懇對待大數據精準營銷這件事?那麽大數據營銷究竟對於企業和用戶兩方面來說,都有什麽樣的價值?

  1、對於企業的價值

  讓我們先看一個國外案例:

  我們都知道美劇《紙牌屋》,提到《紙牌屋》的成功,最大的功勞便是大數據分析。因此,《紙牌屋》幾乎成了大數據營銷的經典案例,也是美國Netflix公司基於用戶信息挖掘來決定內容生產的成功嘗試。

  Netflix的訂閱用戶達到了3000萬左右,而大多數用戶的觀影都與精準推薦系統有關。Netflix會定時收集並分析用戶觀看電影或電視劇的行為,比如根據用戶對電影的評分、用戶的分享行為、用戶的觀影記錄等信息去分析用戶的收看習慣,從而推斷用戶喜歡什麽樣的影視劇,喜歡什麽樣的風格,喜歡什麽樣的導演和演員。在此基礎上利用算法對用戶感興趣的視頻進行推薦排序,直到用戶找到最喜歡的影視劇。《紙牌屋》的導演和主演就是Netflix挖掘用戶信息後的預測出來的。

  那我們再看一個國內案例:

  我們都知道阿裏巴巴和新浪微博合作的事情,阿裏巴巴斥資5.86億入股新浪微博。除了網絡上各大媒體分析的,認為阿裏巴巴希望打造生態圈、強化流量入口、挑戰騰訊等等原因之外,還有一個重要原因或許就是大數據營銷的戰略。

  如今各大互聯網大佬都在跑馬圈地,圈住用戶,誰能圈住用戶,讓用戶在其平臺上活躍,誰就掌握了用戶的大量信息(包括顯在的前臺信息和隱藏的後臺信息)。新浪微博在中國有幾億用戶,這個量十分龐大,但如果新浪不能把這些用戶產生的信息合理的利用,那麽這些資源就是巨大的浪費。我們再看阿裏巴巴,中國最大電商平臺,它有產品,但是卻沒有完整的用戶日常生活行為信息,只有購買信息,但這些購買信息不足以了解人群特點和喜好。所以,只有跟新浪微博合作,掌握大量用戶的行為信息,從而對其分類,找到不同人群甚至不同個體的喜好、偏好、興趣、愛好、習慣、傳播習慣、分享路徑等等,那麽就能實現精準營銷,甚至還可以通過不同用戶的信息傳播規律,而制定產品的最佳品牌傳播途徑。這是一座巨大的金礦。

  新浪微博和阿裏巴巴合作後,微博上出現了一些產品推薦信息,同時新浪微博已經推出支付功能。可以想象:未來你在微博上看到相關推薦的產品,恰好是你喜歡的產品,那麽你就可以直接在微博上實現支付和購買。從而新浪微博和阿裏巴巴各取所需,共享收益。當然,這是我個人的觀察和分析,不過阿裏巴巴的大數據戰略也很明顯了。

  2、對於用戶的價值

  上述兩個例子說的都是大數據帶給企業的價值,那麽,大數據營銷對於用戶來說,到底有沒有價值?用戶是否十分反感精準營銷?讓我們再來看看一個新的調查數據:

  中國傳媒大學國家廣告研究院剛剛發布一份《2014中美移動互聯網發展報告》,這份調查報告對比了中美兩國用戶移動互聯網的使用習慣,以及移動用戶對於移動廣告的態度。

  調查顯示,最可能得到智能終端用戶回應的廣告內容為:(1)與用戶要購買物品相關的廣告(2)與要購買物品相關的優惠券(3)搞笑的廣告(4)與用戶最喜愛品牌相關的廣告(5)與用戶在線上訪問過網站或使用過的應用相關的廣告(6)與最近線上購物相關的廣告(7)與用戶所在場所相關的廣告(8)與最近收聽、收看的廣播/電視相關的廣告。(占比>=20%)

  從這些數據我們可以看出,在8個結果中,有6個都是跟大數據精準營銷扯上關系的。比如,與用戶要購買物品相關的廣告,更能引起用戶的回應或互動。如何理解?大數據營銷的前提就是計算並推測用戶的真實需求,看用戶需要購買什麽相關產品,然後給用戶直接推送用戶想要的、喜歡的,做到了精準到達。那麽用戶呢?用戶樂意對這樣的推動廣告或產品做出回應,因為這些廣告少了對用戶的打擾,並且讓用戶費勁心思對對比或貨比三家後才購買的決策過程降低,節省了時間,讓用戶直接找到內心真正所需的產品或服務。

  所以,這樣的結果就表明,大數據精準營銷並不是完全都會讓用戶反感,而是看你猜透用戶心思的程度。因此,如果你推送的內容和用戶想要購買的物品相關,與用戶最喜愛的品牌相關等等。那麽這種精準挖掘並不會受到用戶的反感,反而會給用戶帶來便利。

  四、不要過分迷信大數據;大數據的實質究竟是什麽?

  看了上面的分析,或許你會認為大數據分析真是無所不能。但是,我們不能過分迷信大數據,於是接下來的問題就產生了。

  1、大數據分析和傳統統計學方法有什麽樣的關系?

  大數據所遵從的是:以大量數據,甚至所有數據為基礎,然後用算法去計算分析,從而更精準的找到各個因素之間的相關關系(不是因果關系),以發現數據之間的規律。

  那我們看看傳統的統計學方法,統計分析學解決的就是如何通過選取少量的樣本,通過對樣本的分析,然後推斷整體的趨勢和規律。所以,用的是概率。一般會規定在90%、95%或98%的置信度(精確度)下最大程度推斷總體。如果目的明確,樣本選取得當,操作科學,那麽不需要大量數據就能分析出規律,從而推斷出總體的規律,並且可以發現不同因素之間的因果關系。比如,抽樣方法確定後,就可以確定樣本數量,如果抽樣得當,那麽樣本的數量跟總體的數量之間沒有太多直接關系。

  舉個不恰當的例子以供理解:假設選取1000個樣本,推斷的規律是A,選取2000個樣本,同樣呈現出A規律,選取3000也差不多這樣。那麽,我們實際上科學選取1000多個樣本就可以達到目的了。所以,傳統的抽樣和統計方法,在最大程度上解決了成本問題,雖然會有誤差,但仍可以發現的顯在規律。

  所以,從這個角度來說,大數據分析最終得到的結果很可能跟傳統統計學方法分析的結果類似,只不過把原來的小樣本變成了大樣本分析。雖然大數據分析理論上是更精準,也可以彌補傳統誤差的缺陷,但準確度未必像我們想象的那樣提高非常多(因為大數據分析會嚴重受到數據源的影響)。另外,也不一定能發現更多新規律。如果是這樣的話,我們不禁要問,大數據究竟是為什麽而存在?

  另外,在傳統的統計學分析當中,比如對市場情況的分析,我們要結合實際的環境和背景來解讀數據和分析數據,我們並不把數據當成唯一的和萬能的指引。所以,這裏面就存在人根據經驗和實際情況進行數據分析的過程,而人參與分析的能力是很重要的。

  2、什麽樣的事情是大數據做不到的,而傳統的調查分析方法卻可以做到?

  大數據營銷的前提是大數據分析,而大數據分析是基於算法的,是計算機固化的模式。也就是說,原來由人對數據分析的那部分工作,現在我們把它約定到算法裏了。並且,大數據精準營銷是對用戶產生的網絡瀏覽數據、分享數據、搜索數據等等行為信息進行分析,從而對人群或事物進行分類,並由此推測人的偏好、興趣等。

  但是,偏好不等於真實需求,點擊不代表一定喜歡。一個人今天在社交媒體上說:“這個產品不錯”,就認為他一定喜歡或一定需要這個產品嗎?

  機器可以對行為分類,但卻不能真正探測到人的心理和真實需求。那麽,對於人的真實心理和需求的探測,我們如何做到?這時候,傳統的市場調查和分析方法是不可取代的。比如,深度訪談法,比如焦點小組訪談法,投射法等等。這些方法都可以在最大程度上,從心理學的角度去分析和發現,人真正的欲望和本質需求。所以,今天很多大的廣告公司、營銷公司,他們仍然采用這樣傳統的方法去了解表面數據背後的故事和原因。而這些故事和原因,是算法目前沒辦法做到的,必須由人來完成。人和人的交流才能探測人的內心。

  從這個角度來說,大數據並不是萬能的,也不能被一味神話,我們必須清晰的認識到它的實質,它能用來幹什麽,不能用來幹什麽。我們可以這樣理解:人對數據的計算和分析工作如今可能會被機器替代,但是,人的另一部分工作(探測人內心的能力)沒辦法被算法替代。

  比如,前兩年我曾報道過《寫書都可以用算法實現自動化了,拿什麽挽救出版》這樣的新技術,據稱目前亞馬遜上大量圖書都是被算法寫出來的,算法會根據人寫書的邏輯思路來組織語言。但是,這些書卻不能彌補人類情感的缺失,不能表達出社會背景和作者所處環境帶來的情感波動等等。

  五、大數據分析或大數據營銷面臨的真正挑戰是什麽?

  1、數據冗余問題,有沒有必要用這麽多數據?

  數據源問題,數據質量有無保障,是否是真正所需?

  大數據分析一直被人稱頌的優點就是:海量數據的運用。但是,數據是不是越多越好?如何篩選這些數據?如何找到有價值和有用的數據?數據的龐大和冗余會對大數據分析造成什麽樣的影響?

  對於大數據而言,巨量的數據來源是分析準確性的根本保證。但是,數據量大到一定程度後也面臨著很大問題:想要保證準確度就變的困難了。這樣就難以保障分析結果的準確性了。大數據分析和預測失敗的例子也有很多。比如,最典型和著名的一個便是谷歌預測流感趨勢失敗的案例。

  報道稱,谷歌是基於搜索引擎數據進行的分析,其分析結果與美國疾病防控中心的監測數據相差近兩倍。盡管谷歌不斷調整算法,但仍不能保證結果的準確性。這就說明一個重要問題:數據源問題。谷歌是基於搜索引擎上的搜索詞來分析的,許多搜索詞都是無效的,沒有任何意義的,所以它們不能真的代表流感趨勢,但它們同樣被計算在內。這就造成了結果的嚴重偏差。

  所以,你弄到的這些數據,如何保障它們的確是你所需的?的確是重要的?如果數據源出現了嚴重偏差,那麽你的分析再精準,那麽也是徒勞。比如,你花費了大量精力去搜集互聯網用戶產生的日常分享信息,你對他們的所有信息都進行分析,結果預測出幾種消費趨勢。但是,這些分享信息中有大量冗余信息,數據精準度很差,許多都是跟消費沒有關系的,那麽這種分析結果很可能就是不準確的。你按照這種結果進行下一步營銷戰略當然可能是失敗的。

  2、大佬平臺的遊戲,普通企業難掌握大量數據;難檢驗可信性

  各大互聯網公司平臺掌握著用戶資源,用戶產生的信息當然也被聚集在各平臺內。但是,各家公司或平臺的數據並不會完全向公眾開放。我們只能通過某些工具抓取到網絡上散落的信息,但不能準確掌握完整的有實際價值和意義的後臺數據和信息。

  而這些海量信息,對於像谷歌這樣的大互聯網公司來說,就是寶藏。大數據或許只是這些大佬平臺的遊戲,普通企業比較難參與進來。

  並且,這些平臺之間並不互通和開放,他們分析出來的數據結果得不到第三方的驗證和檢驗,我們就無法知道他們大數據分析結果的有效性和可信性。當然,他們將這些數據分析用戶自身產品開發和自身發展上還是很有價值的。所以,普通人或普通企業對於大數據的渴望或許是奢望。將來互聯網大平臺公司或許會售賣大數據分析的服務,這很有可能。並且,未來,個人數據管理領域的創新和創業將會增加,應用也會增多。

  另外,目前大數據分析的算法還沒有標準,也沒有公認和統一有效的工具。

  所以,從以上這些方面看,大數據分析和大數據營銷還有很長的路要走。我們需要正確、理性地看待大數據。(來源:鈦媒體;編選:免費論文下載中心)

下载论文

論文《盤點:那些年,曾經被我們誤讀的大數據》其它版本

互聯網研究論文服務

網站聲明 | 聯系我們 | 網站地圖 | 論文下載地址 | 代寫論文 | 作者搜索 | 英文版 | 手機版 CopyRight@2008 - 2017 免費論文下載中心 京ICP备17062730号