熱門測算
如今對大數據預測性分析可謂大肆宣傳,人人都想在預測分析市場上分得一杯羹。周末和朋友喝茶聊天,談到了這個話題。預測的故事一個接着一個,然而一些關於預測性分析的價值的說法,似乎太過美好且不太真實。
當然,這個話題很大,可以談的內容很多。我從“預測性分析”的定義談起。關於預測分析的定義有不少種版本,在被廣泛接受的版本中,都圍繞着三個共通的關鍵點:
從數據中提取信息。
預測潛在趨向或行為模式。
既關係著未來,也關係著當下和過去。
把這上述的三個核心特徵點融合,我們可以看到預測性分析就是通過分析全面數據,包含了歷史數據與實時數據,人類行為數據和機器數據等,預測潛在的結果或可能,而非宣布絕對的確定即將、會或已經發生什麼。
在大數據討論中,有一句經典的流行語錄:大數據預測就好比算命。
大數據預測vs.算命占卜
占卜功能來源於《易經》,從來就是神秘高深,不可測。而我們從《易經》中了解到,每個卦,每一爻都包含了“象”,“數”,“理”三種含義。就好比,我們在晚宴上,舉起紅酒杯,左右搖擺,這就是一個“象”,而左右搖擺了多少度,多少秒鐘搖擺一次,就有了它的“數”,為什麼要搖擺?所以“理”就出現了。
宇宙間萬事萬物都有它的理,也必有它的象,每個現象必有定數,這是必然的過程。這就是占卜預測的基礎與科學。
中國人講“旁觀者清,當局者迷”。“當局者迷”是因為自己看不清自己,所以我們要把自己的處境懸架起來,當作一面鏡子,這就是卦。把自己的狀態,自己的處境,讓自己成為旁觀者來做評判,這個過程就是算卦,其中對未來的展望就是占卜。
《易經》把360度的空間通過八八六十四卦,分成了64種情景。這與大數據預測分析中提出的360度数字畫像類似。可是,無論是占卜還是預測分析,我們並不知道自己現在處在哪一個卦或位,也不明白自己所處的情況,只能憑感覺。從占卜來講,就是通過么一個場景,每一卦的每個一爻找到自己的定位。而大數據預測就需要聚焦到具體的行業應用的特定功能,這也是現代預測的定位要求。
預測分析的過去與現在
人處在這個世界上,與這個世界的關係不停地在變化,只要發生了變化,就包含了它的象,數,理。人的智慧如果能夠全面了解事物的象,數,理,就會知道事物的變化,就能夠知變,預測未來,這就是《易經》的智慧。
從製造業預測分析工具來看,過去正是對高質量算法的需求驅動着預測性分析市場的發展。無論是對於庫存優化、狀態和可靠性維修,還是先進的基於模型的過程控制和過程優化,預測引擎的質量以及對過程或領域動態的了解是獲得可靠且可盈利的結果的關鍵。這是“過去”式的預測分析。
“現在”的預測分析更象沃森技術。能夠解的問題並沒有框架,而且沃森可以處理缺損數據,並提供可靠結果的基於平台的計算預測性分析,功能着實強大,正在改變着預測性分析的局面。多種多樣且結構不定的大數據促進數據庫的製造者比如企業軟件供應商和數據庫供應商等提供配置功能強大的分析引擎。而強大的分析引擎反過來又使任何人都可以在幾乎任何類型的數據基礎上進行預測分析並獲得可以比較滿意的結果。
2預測分析:準不準與信不信
占卜準不準?很難講。預測準不準,也很難講。一件事讓10個人來做,一定會有很多種不同的結果。算命或預測亦是如此。
如果卜出來的結果是好,大利,當然高興。如果卜出的結果是大凶,不利,我們還要不要繼續把工作或事情做下去么?無論您的心裏有多麼強大,卜出來的結果多少都是會影響你。占卜是《易經》裏面非常重要的內容。作為至聖先師的孔子,因為喜歡《易經》而韋編三絕,但他卻忠告世人:不佔而已。既然占卜是《易經》的功能之一,為什麼先師又勸我們不佔呢?一定有很多種原因。曾仕強教授認為熟悉卜卦的人,從一開始就知道第一爻到最後一爻,這當中的變化又多少,所以不可以完全相信占卜的結果應該是孔聖人不佔的主要原因之一。
對於大多數企業而言,預測性分析主要是在現有數據的基礎上,理解可能出現的可能性。預測的準確性取決於預測算法的好壞或準確性以及預測算法操作時所使用的數據的“質量”。
隨着物聯網技術的發展,採集數據的方式多樣化,數據的總量顯著增多。但是,數據可能質量的確不高。也就是說,數據其實並不精確,這也是大數據分析中講的要擁抱混亂。如果利用這些不夠精確的數據,不管預測算法或模型如何高明,預測結果的準確率都會下降。
另外一種情況就是數據基本準確,但不夠完整。當然,我們要採集足夠的樣本又有相當的精確度在現實生活中的難度非常高。預測算法在沒有足夠的完整數據樣本前提下做出的預測,預測結果也不會好到哪裡去。當然,如果算法本身有很多不足,不管數據質量多高,預測結果還是很可能有誤。
未來的預測性分析
隨着工業物聯網(IndustrialIoT)的發展,傳感器、系統、設備等產生的數據正在迅猛增長。過去依賴大量工程及特定領域的預測性分析解決方案將難以跟上如今不斷擴大的數據云。雲計算的計算與存儲等功能將變得更加強大,擁有自學習型預測性分析解決方案的能力從而適應新的且不斷變化的數據流,將對過去的預定義模型發起顛覆性的挑戰。
然而,即便基於雲的自學型系統提供的預測質量可以與專用解決方案作出的預測結果相媲美,但這還不是未來的預測分析。最終的預測分析的領導者必須符合下面這三個優勢:
能夠適應不斷增長的複雜數據流的學習型預測分析解決方案。
可以為特定行業,特定領域,特定功能的模型提供高質量預測結果與創新思路。
所有企業都支付得起的預測解決方案。
風險管控是現代管理學也是預測管理學中的一個重點。其背後的思路與《易經》中占卜類似,那就是預測占卜后,我們可以拿結果做為參考,從當中找到合理的,能夠趨吉避凶,能把損害減到最小到路徑。
閱讀全文