數(shù)據(jù)是有價值的,但大數(shù)據(jù)最核心的價值到底是什么?能夠用大數(shù)據(jù)來作什么呢?
我總結(jié)了一下,大數(shù)據(jù)最核心的作用和價值有四個方面:
1) 查看數(shù)據(jù)規(guī)律,來探索事物的運(yùn)行規(guī)律和特征
2) 發(fā)現(xiàn)數(shù)據(jù)變化,來探索業(yè)務(wù)的變化和業(yè)務(wù)問題
3) 理清數(shù)據(jù)關(guān)系,來尋找影響業(yè)務(wù)運(yùn)行的關(guān)鍵因素
4) 擬合數(shù)據(jù)模型,來預(yù)判業(yè)務(wù)在未來的發(fā)展趨勢
下面我將為大家舉一些案例,看如何利用大數(shù)據(jù)來實(shí)現(xiàn)這些價值。
3.1 探索規(guī)律
利用大數(shù)據(jù)來探索業(yè)務(wù)運(yùn)行的規(guī)律和特征。
拿產(chǎn)品的銷量分析來說,我們收集產(chǎn)品的銷量數(shù)據(jù),作趨勢分析,得到下圖所示的按照時間維度(星期)的折線圖。
從數(shù)據(jù)的特征可以看出,產(chǎn)品的銷量基本上是隨著時間在逐步上升的,周末的產(chǎn)品銷量比較高,即非工作日比工作日的產(chǎn)品銷量要高,這是絕大多數(shù)零售店的銷售規(guī)律,即“周末是交易高峰時間”。
而銷量高,也就意味著在產(chǎn)品銷售上的規(guī)律,即客流量比較大,看來周末上街購物的人數(shù)比較多。所以,從業(yè)務(wù)角度看,也就發(fā)現(xiàn)了客流量在時間上的分布規(guī)律。
基于客流量的分布規(guī)律,就可以提出如下的業(yè)務(wù)建議或策略:在人力安排上,周末需要更多的銷售員工上班;在庫存管理上,在周四或周五就要安排人員檢查庫存,確保庫存中有足夠的產(chǎn)品在周末售賣;在營銷活動的時間安排上,要想達(dá)到更好的品牌宣傳效果或者銷售業(yè)績,就得選擇在客流量多的周末時間進(jìn)行宣傳和促銷,等等。
所以,大數(shù)據(jù)能夠幫助我們做決策,是怎樣做到的呢?
背后的思維其實(shí)很簡單,就是,先利用數(shù)據(jù)來探索業(yè)務(wù)的發(fā)展規(guī)律和特征,再利用業(yè)務(wù)規(guī)律,按規(guī)律來決策,就能夠做到事半功倍的效果。
哲學(xué)告訴我們,任何事物都是發(fā)展的,發(fā)展必定是有規(guī)律的,即萬物皆有規(guī)律。
任何客觀事物,大到天體運(yùn)行,中到社會發(fā)展,小到原子分子的運(yùn)行,都是有規(guī)律的。而大數(shù)據(jù),則是探索事物規(guī)律的有效的工具!
3.2 發(fā)現(xiàn)變化
利用大數(shù)據(jù)來發(fā)現(xiàn)業(yè)務(wù)運(yùn)行的變化和問題。
谷歌公司的流感趨勢預(yù)測產(chǎn)品(Google Flu Trends, GFT)是2008年推出的一款預(yù)測流感的產(chǎn)品,可以說是比較早的一個大數(shù)據(jù)產(chǎn)品了。
正常情況下,傳統(tǒng)的疫情報告是由各地醫(yī)院、診所和醫(yī)務(wù)人員向*CDC(疾病控制和預(yù)防中心)上報的,但這種方法往往會有10~14天的時間延遲,而在這兩周內(nèi),疫情有可能早已經(jīng)迅速擴(kuò)散。而谷歌的這款產(chǎn)品,卻可以利用了各個地區(qū)用戶搜索關(guān)鍵詞的數(shù)據(jù)量來判斷流感的傳播情況,來實(shí)時呈現(xiàn)或預(yù)測流感蔓延到哪個地區(qū)了,這對于CDC及時控制疫情具有更大的指導(dǎo)意義。
谷歌工程師每天都會對搜索感冒相關(guān)詞的搜索量做分析,在正常情況下,某地區(qū)每日的搜索量都會在一個正常的范圍內(nèi)波動。但如果有一天(比如12號開始),某地區(qū)的搜索量開始持續(xù)上升,這上升的背后,其實(shí)體現(xiàn)的是患感冒人數(shù)的增加。這就是GFT產(chǎn)品背后的數(shù)據(jù)思維,基于搜索詞的熱度來預(yù)測流感的爆發(fā)。這個產(chǎn)品,甚至可以在流感爆發(fā)前的7-14天就能夠做出預(yù)判。因此,國家或企業(yè)都可以基于此預(yù)測進(jìn)行相應(yīng)的準(zhǔn)備活動。
所以,可以基于數(shù)據(jù)的變化,而探知業(yè)務(wù)的變化,從而可以進(jìn)一步思考給出相應(yīng)的業(yè)務(wù)判斷和業(yè)務(wù)建議。即,數(shù)據(jù)的變化就意味著業(yè)務(wù)的變化。
這也是我們做決策的另一個底層邏輯,找到業(yè)務(wù)短板和變化,給出應(yīng)對策略。最典型的就是運(yùn)營分析,通過大量的KPI指標(biāo)來呈現(xiàn)業(yè)務(wù)運(yùn)營的各個環(huán)節(jié)的發(fā)展情況,以找到需要改進(jìn)的環(huán)節(jié),并做出優(yōu)化建議。
世界是物質(zhì)的,而物質(zhì)是運(yùn)動的,變化是事物的本質(zhì)。
一切事物都在運(yùn)動變化,這些運(yùn)動變化是可以被探知的。大數(shù)據(jù),則是及時發(fā)現(xiàn)事物變化的一個工具。
3.3 理清關(guān)系
*印第安納大學(xué)的教授約翰·博倫(Johan Bollen),曾發(fā)表了一篇文章《Twitter情緒預(yù)測股票市場》。這些教授們一直想弄清楚到底是什么因素在影響股票的漲和跌,以及能否預(yù)測股市的漲或跌。于是,他們收集了2008~2010年期間在Twitter上發(fā)表的上億條條文,然后做了一個對用戶情緒的量化模型,就是根據(jù)發(fā)表?xiàng)l文的字詞來估算用戶的情緒,并將其量化為一個情緒數(shù)值。一個用戶就有一個情緒指標(biāo),然后,他們把當(dāng)天發(fā)表?xiàng)l文的所有用戶的情緒指標(biāo)綜合起來,最后形成了一個客戶群的綜合情緒指數(shù)。最后,他們把這個客戶群的綜合情緒指數(shù)按照時間的維度連接起來就形成了一條情緒曲線,然后,再把這條情緒曲線和道瓊斯指數(shù)曲線進(jìn)行比對。經(jīng)過不斷的優(yōu)化他們量化情緒的模型,他們很驚奇地發(fā)現(xiàn),這條情緒曲線的波動居然和股票曲線的漲跌有著驚人一致(如下圖所求)。
仔細(xì)觀察一下,下圖的情緒曲線與股票曲線并不是完全重疊的,而是,情緒曲線在股票曲線波動的之前。也就是說,當(dāng)情緒曲線往后挪3~4天以后,情緒的波動和股票的漲跌就基本上吻合了,這也就說明,可以利用情緒來初步判斷股票的漲跌,這開啟了大數(shù)據(jù)炒股的新時代。
用大數(shù)據(jù)的技術(shù)語言來說,就是,情緒指數(shù)與股票指數(shù)的具有相關(guān)性。
相關(guān)性分析,是大數(shù)據(jù)時代用得最多的一類分析方法之一,可用來探索事物之間的相互影響和相互制約的關(guān)系。
比如,企業(yè)的采購、生廠、設(shè)計(jì)、市場、售后等等,都是相互影響和相系制約的。
唯物辯證法認(rèn)為,世界上的一切事物都處在普遍聯(lián)系中,沒有任何一個事物是孤立地存在的。聯(lián)系是指事物之間以及事物內(nèi)部諸要素之間相互連結(jié)、相互依賴、相互影響、相互作用、相互轉(zhuǎn)化等相互關(guān)系。
一句話,萬物皆有聯(lián)系!而大數(shù)據(jù),成為探索事物間相互聯(lián)系的一種有效的手段。
3.4 預(yù)測未來
大數(shù)據(jù)的核心是預(yù)測。
在2008年,當(dāng)大多數(shù)企業(yè)在經(jīng)濟(jì)危機(jī)中掙扎時,阿里巴巴卻相對輕松地地度過了此次危機(jī),因?yàn)榘⒗锇桶吞崆熬皖A(yù)測到經(jīng)濟(jì)危機(jī)要來了。
他們是如何預(yù)測到經(jīng)濟(jì)危機(jī)要來的呢?其實(shí)馬云在很多次場合都說過,他說阿里巴巴有兩大類重要的數(shù)據(jù),一類是交易數(shù)據(jù),另一類是詢盤數(shù)據(jù)。詢盤數(shù)據(jù),指的就是在網(wǎng)站的瀏覽數(shù)據(jù)、搜索數(shù)據(jù)、點(diǎn)出數(shù)據(jù)等等。
很顯然,詢盤數(shù)據(jù)和交易數(shù)據(jù)是有關(guān)系的。首先,詢盤量和交易量存在正相關(guān)的關(guān)系;其次,詢盤數(shù)據(jù)肯定發(fā)生在交易數(shù)據(jù)的前面。阿里巴巴每個月都會對這兩大類數(shù)據(jù)進(jìn)行統(tǒng)計(jì)和分析,找到他們的關(guān)系和規(guī)律。在2008年的年初,他們發(fā)現(xiàn)詢盤數(shù)據(jù)已經(jīng)持續(xù)幾個月都在下降了,盡管此時交易數(shù)據(jù)并沒有明顯的下降趨勢,但基于上面的關(guān)系,可預(yù)見,在未來的交易數(shù)據(jù)也肯定會下降。因此,阿里巴巴才作出了“經(jīng)濟(jì)危機(jī)”的初步判斷,然后,再收集更多的數(shù)據(jù)來驗(yàn)證這個判斷的正確性,并進(jìn)而作了大量的準(zhǔn)備,從而安然度過這次經(jīng)濟(jì)危機(jī)。
大家都知道,大數(shù)據(jù)分析的是已經(jīng)發(fā)生過的數(shù)據(jù),那么過去的數(shù)據(jù)已經(jīng)發(fā)生了還有什么用呢?其實(shí),大數(shù)據(jù)只是借分析過去的數(shù)據(jù),來探索事物的規(guī)律和特征,其目的是為了預(yù)判事物在未來的發(fā)展變化或發(fā)展趨勢,
因此,大數(shù)據(jù)的目的是預(yù)測,基于對事物的預(yù)測結(jié)果,用來作出相應(yīng)的策略調(diào)整。如果預(yù)測的結(jié)果不是我們想要的,則需要調(diào)整相應(yīng)的策略,施加影響因素,使得事物朝著我們想要的方向去發(fā)展。
所以,大數(shù)據(jù)描述的是過去,表達(dá)的卻是未來!只有預(yù)見未來,才能把握未來!
可見,大數(shù)據(jù)之所以能夠用來進(jìn)行業(yè)務(wù)決策,不外乎就是通過對數(shù)據(jù)的分析,來實(shí)現(xiàn)對業(yè)務(wù)特征、業(yè)務(wù)規(guī)律、業(yè)務(wù)變化的把握,以及影響業(yè)務(wù)變化的關(guān)鍵因素進(jìn)行分析,來達(dá)到了解業(yè)務(wù),預(yù)測業(yè)務(wù)未來發(fā)展的目的。
所以,大數(shù)據(jù)分析的核心價值,就是去發(fā)現(xiàn)數(shù)據(jù)的特征、變化和關(guān)系。
因?yàn)閿?shù)據(jù)的特征就是業(yè)務(wù)的特征,數(shù)據(jù)的變化就是業(yè)務(wù)的變化,數(shù)據(jù)間的關(guān)系就是業(yè)務(wù)因素間的關(guān)系。
轉(zhuǎn)載:http://www.jkyingpanluxiangji.com/zixun_detail/111710.html