2020年6月16日 星期二

大數據的另一章

大數據的另一章!資料分析3.0時代,靠分析讀懂你的客戶,讓企業贏得競爭優勢
The Analytics Revolution: 
How to Improve Your Business By Making Analytics Operational In The Big Data Era
Bill Franks

Part01|分析革命已經開始
Chapter01 瞭解營運分析
- 國際分析研究所(International Institue for Analytics,IIA)建立的分析3.0框架。
-數據分析2.0:
- 專業分析人員在企業中部是演變為決策層的一員,就是對決策層有著直接的影響力。
專業分析人員不再是完全獨立於業務群體的幕後資源。
-數據分析3.0:
- 長期以來,客戶流失分析已經演進為尋找行為組合的特定模式,
這是因為行為組合比單一行為更具危險性。這一般稱作「路徑分析」(path analysis)
如果一個客戶線上看到對帳單,首次了解手續費後請求取消手續費。這可能不是一件麻煩事。
但是,如果客戶透過致電客戶服務管道再次要求取消手續費,並且接下來又致電分支機構,
那麼對客戶的忽視就會加大其關閉帳戶的風險。

Part02|奠定分析基礎
Chapter04 想要預算?先制訂商業計畫
- 關注回報而非成本
最大化關注點:解決的業務問題、價值回報、差異性。
最小化關注點:需要的工具和技術、成本、持續改進。
- 很多企業會進行一個有針對性的概念驗證(proof of comcept,POC)作為第一步,
這是一個不錯的想法,但是別讓範圍有限的概念驗證作為終點。
只解決某個問題的一小部分並不能讓一個商業計畫獲得投資通過,特別是需要大量資金和人力的投資時。
- 展開新的營運分析的第一步不必走得太遠,第一步是要簡單證明這個新想法是有價值的
一開始你並不需要一個完整的、生產就緒的流程,只要可足夠展示價值就行了,
然後利用累積的經驗去更加有效地設計和建立最終方案。
- 為了具備差異化潛力的分析來制訂商業計畫,而不是僅改善、提升現有的分析流程。

Chapter05 建立分析平台
- 基礎流程或政策問題的一個常見表象,就是它們對所涉及的技術的影響。
在很多案例中,看上去是技術問題,但其實不是。一定要區分開「技術問題是更大問題的表象
與「技術確實是問題的誘因」兩種不同的情況。
- 資料倉儲學院(TDWI)
- 對大多數企業來說,使分析營運化不是一個技術問題,技術問題僅僅是潛在的政策和文化問題的表象。
- 除非即將到來的一項功能是絕對重要的,否則不要因將來可能出現的技術推延今天的投資決策。

Part03|分析營運化
Chapter07 資料分析
- CRISP-DM規定了傳統資料探勘過程的基本步驟。
- 另一個常見的模式是SAS研究所的SEMMA模式。
SEMMA代表「sample,explore,modify,modal,and assess」
(資料採樣、資料特徵探索、資料調整、模式研發和模式評價)。
- 在批次分析中用於預測對所有使用者的最佳推薦的演算法。
也可以用於預測對某一個目前正在瀏覽網頁的特定使用者的最佳推薦。
區別在於產生對目前特定使用者推薦的演算法使用的是最新資料。
- 大部分由大公司建立的分析過程都可以總結為兩個原則。
第一個是統計,其中包含了變異數分析(ANOVA)迴歸分析以及顯著性檢驗
第二個是預測,其中包含了傳統時間序列預測投影預測技術
這兩個分析原則已經無法滿足目前的要求,企業需要精通除統計和預測方法之外的更多分析原則。
像是模擬分析蒙特卡羅(Monte Carlo)模擬是特別流行的方法。
- 最佳化分析原則也正得到越來越廣泛的使用。長久以來,最佳化都用於定價分析,
而近來其應用範圍得到了拓展。他透過分析變數和限制條件提供可能的最優方案。
蒙特卡羅模擬一一查看和量化各種可能的影響;最佳分析則從中找出最佳方案。
最佳方案通常用於重要變數可控制的情況。在定價分析中是可以控制商品的價格來獲得最優結果的,
而在退休計畫分析中,通膨率則是無法控制的,因此就不能使用這種方法。
- 為了處理資料流,「複雜事件處理原則(Complex Event Processing,CEP)」漸成主流,
CEP原則在資料流傳遞期間分析資料並快速做出決策,其也能夠同時運用大多數其他分析原則。
- 資料探勘預測分析人臉辨識演算法圖形分析演算法地理空間分析文字分析社群網路分析
- 設計分析時,提出正確的問題比後面的其他工作對結果的影像更大。
- 分析結果往往取決於問題的定義、提問的內容、分析方案的設計,以及該方案一旦確立將為如何實施與過程中的細節相比,選擇解決哪一個提問對結果的影響更大
稍不注意,建立的分析可能就回答了錯誤問題的錯誤提問
- 不可能探索到所有潛在的分析。當錯過了某些東西之後,總是會事後諸葛。
為此,不只記錄為什麼採取某些路徑,也記錄為什麼沒有選擇其他的路徑。
- 探索性分析允許一個寬泛的目標或有限的假說,而驗證性分析從一開始就高度集中並界線分明。
- 典型相關分析或迴歸分析可於確定那些路徑特徵與利息指標最相關。
在這種情況下,非統計學的路徑功能提供了新的資訊,可以用嚴格的統計方式進行分析。
統計方法增加了路徑分析的影響力。
提供解決方案,而不是分析說明。重點必須放在透過分析解決問題上
證明一個過程是可行的,只關注結果而不是直接關注分析。
- 營運分析的發起人和使用者童常不了解或不關心分析,他們只想得到問題的解決方案。
如果不被問到風險,不必談論技術細節。

Chapter08 分析組織
- 資料科學家往往是電腦背景出身,使用Hadoop,用Python或R等語言寫程式。
傳統意義上的專業分析人員多半是統計數學運籌學背景,
使用的可能是關係式的分析伺服器環境,語言用的是SAS和SQL。
使用的平台或者語言不同,並不會改變背後的技能與思維方式。
- 認證分析專家(CAP,Certified Analytics Professional),該認證項目是由美國運籌管理協會
(INFORMS,Institute for Operations Research and the Management Sciences)贊助的。
- 分析完成之後,工作仍在進行。我們還得完成分析結果的行銷和推廣,建構營運過程支撐模式,
這樣才能儘可能大地發揮影響力。
- 專業分析人員是顧問、是導師、是教練,但不是因循守舊者,該表態就表態。
舉止不像專家,別人自然不會以專家視之。


沒有留言:

張貼留言