手機(jī)上的大數(shù)據(jù)(六):手機(jī)大數(shù)據(jù)的挑戰(zhàn)
通過(guò)手機(jī)瀏覽、手機(jī)音樂(lè)上的用戶舉動(dòng),我們可以看到手機(jī)大數(shù)據(jù)在移動(dòng)互聯(lián)網(wǎng)利用上的威力,但同時(shí),手機(jī)上的大數(shù)據(jù)也不是萬(wàn)能的,它的發(fā)展還面臨著很多實(shí)際的問(wèn)題和尋釁。
數(shù)據(jù)的稀疏性
智能手機(jī)端的App利用數(shù)以十萬(wàn)計(jì),但是每個(gè)利用中兩個(gè)用戶之間選擇的重疊非常少,如果用用戶和商品之間已有的選擇關(guān)系占所有可能存在的選擇關(guān)系的比例來(lái)衡量系統(tǒng)的稀疏性,在我們研究的幾個(gè)App數(shù)據(jù)中,稀疏度均不超過(guò)4%,其實(shí)這些其實(shí)都是非常密的數(shù)據(jù)。想想一個(gè)具有千萬(wàn)級(jí)用戶,百萬(wàn)級(jí)歌手的App,平均而言一個(gè)用戶能聽(tīng)100首歌嗎,估計(jì)不能,所以稀疏度應(yīng)當(dāng)在萬(wàn)分之一或以下的量級(jí)。
這個(gè)問(wèn)題本質(zhì)上是無(wú)法完整克服的,但是有很多措施,可以在相當(dāng)程度上緩解這個(gè)問(wèn)題。比如擴(kuò)散方法、隨機(jī)缺省值方法、隨機(jī)選擇等。
冷啟動(dòng)問(wèn)題
在我們前面討論的音樂(lè)APP中,我們創(chuàng)造歌曲的籠罩只有2%左右,這個(gè)是由于大批歌曲出于冷啟動(dòng)狀態(tài)造成的。這是因?yàn)樾律唐酚捎诒贿x擇次數(shù)很少或沒(méi)有,難以找到合適的措施推薦給用戶結(jié)論。
近一個(gè)有趣的研究顯示,新用戶更容易選擇特別風(fēng)行的商品—這無(wú)論如何是一個(gè)好消息,闡明利用熱歌榜也能獲得不錯(cuò)的成果。
大數(shù)據(jù)處理與增量計(jì)算問(wèn)題
盡管數(shù)據(jù)很稀疏,大部分?jǐn)?shù)據(jù)都含百千萬(wàn)計(jì)的用戶,與此同時(shí)新用戶不停進(jìn)入系統(tǒng)。數(shù)據(jù)量不僅大,而且數(shù)據(jù)本身還時(shí)時(shí)動(dòng)態(tài)變更,如何快速高效處理這些數(shù)據(jù)成為迫在眉睫的問(wèn)題。在這個(gè)大前提下,算法時(shí)間和空間的復(fù)雜性,尤其是前者,獲得了空前器重。一般而言,一個(gè)高效的算法,要么自身復(fù)雜性很低,要么能夠很好并行化,要么兩者兼具。
隨著參加的信息量的增多, 終每過(guò)一段時(shí)間還是需要利用全局?jǐn)?shù)據(jù)重新進(jìn)行計(jì)算。更先進(jìn)但也更苦難的措施,是設(shè)計(jì)出一種算法,能夠保證其誤差不會(huì)累積,也就是說(shuō)其成果與利用全部數(shù)據(jù)重新計(jì)算的成果之間的差別不會(huì)單調(diào)上升。
用戶舉動(dòng)模式的發(fā)掘和利用
深入發(fā)掘用戶的舉動(dòng)模式能更正確的抓住用戶愛(ài)好,從而有渴望做出更好的用戶體驗(yàn)。譬如說(shuō)在音樂(lè)APP中,新用戶和老用戶具有很不一樣的選擇模式:一般而言,新用戶偏向于選擇熱門的歌曲,而老用戶對(duì)歌曲的多樣性關(guān)注更多。
用戶舉動(dòng)的時(shí)空統(tǒng)計(jì)特點(diǎn)也可以用于進(jìn)步者設(shè)計(jì)針對(duì)特定場(chǎng)景的利用。舉個(gè)例子,在進(jìn)行手機(jī)個(gè)性化瀏覽推薦的時(shí)候,如果曾經(jīng)的數(shù)據(jù)顯示某個(gè)用戶只在7點(diǎn)到8點(diǎn)之間有一個(gè)小時(shí)左右的手機(jī)瀏覽舉動(dòng)(可能是上班時(shí)在地鐵或者公交車上),那么9點(diǎn)鐘發(fā)送一個(gè)電子書瀏覽的短信廣告就是很不明智的選擇。從含時(shí)數(shù)據(jù)中還可以分析出影響用戶選擇的長(zhǎng)期和短期的興趣,通過(guò)將這兩種效應(yīng)分辨出來(lái),可以明顯進(jìn)步推薦的正確度。

多維數(shù)據(jù)的交叉利用
目前手機(jī)端的APP還出于孤立的狀態(tài),并沒(méi)有真正的完成數(shù)據(jù)買通及數(shù)據(jù)共享的地步。想象如果能夠把這些數(shù)據(jù)整合起來(lái),特別是知道每個(gè)節(jié)點(diǎn)身份的對(duì)應(yīng)關(guān)系(不需要知道你真實(shí)身份,只需要知道不同APP中存在的若干節(jié)點(diǎn)是同一個(gè)人),可以帶來(lái)的宏大的社會(huì)經(jīng)濟(jì)價(jià)值。
舉個(gè)例子,你可能已經(jīng)在新浪微博上關(guān)注了很多數(shù)據(jù)發(fā)掘達(dá)人的微博,并且分享了很多算法學(xué)習(xí)的心得和問(wèn)題,當(dāng)你第一次上當(dāng)當(dāng)網(wǎng)購(gòu)書的時(shí)候,如果主頁(yè)向你推薦數(shù)據(jù)發(fā)掘的 新專著并附有折扣,你會(huì)心動(dòng)嗎?所以多維數(shù)據(jù)發(fā)掘是真正有望解決系統(tǒng)內(nèi)部冷啟動(dòng)問(wèn)題的法寶——只要用戶在系統(tǒng)外部的其他系統(tǒng)有過(guò)運(yùn)動(dòng)。
目前有很多技術(shù)方法可以實(shí)現(xiàn)這種多維數(shù)據(jù)發(fā)掘,比如統(tǒng)計(jì)物理學(xué)的物質(zhì)擴(kuò)散、熱傳導(dǎo)方法,機(jī)器學(xué)習(xí)的遷移學(xué)習(xí)方法都有望解決這種多維數(shù)據(jù)發(fā)掘。

結(jié)論與展望
由于移動(dòng)互聯(lián)網(wǎng)的迅速崛起,讓互聯(lián)網(wǎng)大數(shù)據(jù)變得更為多樣、豐富。它不但可以作為互聯(lián)網(wǎng)大數(shù)據(jù)的一個(gè)有益補(bǔ)充,而且還可以作為移動(dòng)互聯(lián)網(wǎng)新業(yè)務(wù)本身的舉動(dòng)領(lǐng)導(dǎo)。
在市場(chǎng)營(yíng)銷領(lǐng)域,數(shù)據(jù)可以用來(lái)洞察客戶,例如衡量他們的生命周期價(jià)值或者預(yù)測(cè)可能的購(gòu)置舉動(dòng)。對(duì)于全部企業(yè)而言,利用數(shù)據(jù)進(jìn)行分析和應(yīng)對(duì)的能力,對(duì)于進(jìn)行正確的決策并 終取得更好的事跡是至關(guān)重要的。
真正實(shí)現(xiàn)“精準(zhǔn)營(yíng)銷”需要底層海量的用戶舉動(dòng)數(shù)據(jù)做支撐,網(wǎng)絡(luò)營(yíng)銷尋求的都不應(yīng)是曝光率,而是用戶轉(zhuǎn)化率。而對(duì)用戶轉(zhuǎn)化過(guò)程進(jìn)行有效的數(shù)據(jù)分析,可實(shí)現(xiàn)效果的優(yōu)化。效果可從三個(gè)層面分解:目標(biāo)是否明確、向過(guò)程要效果, 終目標(biāo)達(dá)成率就是效果。利用數(shù)據(jù)工具把持和優(yōu)化營(yíng)銷過(guò)程,可不斷提升ROI效率。
這需要具體懂得客戶的業(yè)務(wù)發(fā)展目標(biāo)和推廣需求,可以考慮借助專業(yè)的第三方服務(wù)公司作有關(guān)于網(wǎng)絡(luò)營(yíng)銷策略的效果評(píng)估。以制定出或調(diào)劑有關(guān)于網(wǎng)絡(luò)營(yíng)銷策略。
一般來(lái)說(shuō),對(duì)于不同的營(yíng)銷平臺(tái)會(huì)有不同的廣告情勢(shì)投放,從而產(chǎn)生的效果也多種多樣,各家說(shuō)各家的好。網(wǎng)絡(luò)營(yíng)銷中,品牌認(rèn)知、提升偏好、主動(dòng)尋找、購(gòu)置轉(zhuǎn)化、分享/再購(gòu)各階段,分辨對(duì)應(yīng)廣告管理、口碑、網(wǎng)站、電商、客戶管理的營(yíng)銷策略。以“大數(shù)據(jù)”貫穿網(wǎng)絡(luò)營(yíng)銷全過(guò)程,就可將有價(jià)值的數(shù)據(jù)轉(zhuǎn)化為有意義的數(shù)據(jù),讓廣告從效果監(jiān)測(cè)變?yōu)樾ЧA(yù)測(cè)、讓流傳更有效率、用戶體驗(yàn)更佳,用戶轉(zhuǎn)化更明確、可控。
讓我們一起隨著手機(jī)上的大數(shù)據(jù)一起“爆發(fā)”吧。
相干瀏覽:
手機(jī)上的大數(shù)據(jù)(一):移動(dòng)互聯(lián)網(wǎng)的入口
手機(jī)上的大數(shù)據(jù)(二):手機(jī)大數(shù)據(jù)的特點(diǎn)