成長駭客行銷:引爆集客瘋潮的新實戰力
2021年11月20日 星期六
成長駭客行銷:引爆集客瘋潮的新實戰力
2021年9月11日 星期六
消費者行為市場分析技術(下)
麥可.格里斯比(Mike Grigsby)
-- 有幾點需要注意:
第一,K平均演算法方法以歐式距離平方根為依據,來決定觀察項的歸屬,因此並非統計屬性,而是數學性質的分析法。
第二,集群中心值(即集群)高度取決於資料集的順序。若將資料集重新排序,最後可能會得到天差地遠的區隔結果。第三,此方法幾乎毫無診斷功能可言。第四,由於群集呈現自然球形(因為是根據與中心值的距離,決定觀察值歸屬何處),集群的大小會很相似這不太可能符合真實市場的情況。雖然K平均演算法又比RFM模型和卡方自動交互作用偵測更進一步,但顯然仍有許多缺陷。
2021年9月4日 星期六
消費者行為市場分析技術(上)
- (就商品/服務而言)消費者有哪些偏好?
- 消費者(在分配有限預算時)有哪些限制?
- 在資源有限的情況下,消費者會怎麼選擇?
- 買家的議價能力
- 供應商的議價能力
- 新進廠商的威脅
- 現有同業的競爭
- 替代品的威脅
- 企業可以打價格戰(當低價產品提供者)。
- 企業可以塑造差異,專注於高階產品。
- 企業也可以區隔市場,專心經營規模較小的利基市場。
- 營運卓越(致力追求低成本)。
- 產品領導(專注發展較高階的差異化產品)。
- 貼近顧客(一種差異化/市場區隔策略)。
- 含有新資訊
- 專注於了解消費者行為
- 量化因果關係
- 提供競爭優勢
- 傳達財務意義
- 描述性分析主要關注已發生的事;
- 預測性分析會運用統計分析法,依指定的輸入變數變化(例如價格),計算輸出變數(例如銷量)的相應變動;
- 時效性分析是一種試圖將某些數據(通常是獲利)最佳化的機制。
- 如同稍早所提,依變數是事件發生前經過的時間,因此分析中已經內建了時間。
- 設限觀察值。設限觀察值包含尚未發生事件的觀察值,以及研究中因故無法掌握動向的觀察值,
- 事件發生前經過的時間,
- 事件是否發生,因此需採用設限觀察值。
- 時序資料:從單一橫斷面擷取多個觀察項,例如股價、單週銷量摘要。
- 合併的橫斷面資料:自多個橫斷面收及兩個以上樣本,例如社會/人口問卷調查、地區或子市場的營收。
- 追蹤資料:自兩個以上橫斷面,匯集兩個以上觀察項,例如不同企業組織在不同時間點的時序資料、地區或子市場,在不同時間的彙總資料。
2021年8月7日 星期六
2021年7月16日 星期五
統計學,最強的商業武器(商務篇)
統計學,最強的商業武器(商務篇):把數據資料轉換成獲利能力的智慧
第1章 用於經營策略的統計學
- 對於解釋變數的組合也可能產生疑問。可藉由加入「相乘之值」(稱為交互作用)
- 也有一種將解釋變數的平方值(稱作平方項)納入分析的技巧可用。
- 即使分析得不夠完整,「似乎能賺到30億日圓」的分析結果一值無法實現的狀態,
- 在進行與經營策略有關的分析時,做為分析對象的企業數量往往有限,
- 變異量成分分析(Components of Variance Analysis或Variance Components Analysis),
- 一般的多元迴歸分析屬於固定效果模型(Fixed Effects Models)。
第2章 用於人事的統計學
- 95%的信賴區間代表的是,收集無限多數據應該就能得知的比值比「大概就在這個範圍內」。
此範圍的兩端若是都比1大,或反之都比1小的話,p值應該會小於0.05,亦即都表示了此結果
第3章 用於行銷的統計學
簡言之,就是將市場整體分割(區隔)成數個需求或生或風格相似的小群體(Segment),以思考行銷策略。
- 而考慮要集中火力針對這些區隔中的何者進行行銷這件事,也稱為目標市場選擇(Targeting)。
- 一旦能決定出鎖定的顧客族群,並充分理解這些的人,接著便可考慮「要賣什麼,又要如何賣?」
具體來說,「要賣什麼」指的就是所提供的商品及服務,
亦即應先思考定位(Positioning)這點,也是現代行銷的準則之一。
- 行銷數據分析的步驟
- 設定分析的目標對象
- 包含應分析變數的資料收集
- 分析所得之資料
- 解讀與行動的規劃
此一假設,來推估解釋變數和成果之間的關聯性。
在這種情況下,會得到「若性別相同,年齡大的比較會買」且「若年齡相同,女性比較會買」的結果。不過,實際上消費金額最高的市場區隔,是位於圖右上方的「60歲以上的男性」。
雖然光是年齡大這件事與消費金額沒有關聯性,但卻存在有「為男性且年齡大」的交互作用。
- 聚類分析所用的變數要能夠提示「怎樣的行銷策略可能有效」,或者更具體地說,
而一旦獲得足以為所有聚類命名的具說服力的分析結果,便要進行成果的比較。
- 在市場區隔方面,基於交互作用的問題,「就算將所有具顯著影響力的解釋變數都組合起來,也不見得就能成為理想的市場區隔」,但在定位方面卻非如此。若能藉由可用一句話表達的定位,
- 比值比或迴歸係數及p值等雖可做為大略的標準,提供思考策略時的線索,
這些所顯示的不過是「一旦製造出變化,可能產生多大影響」罷了。
- 為了判斷「是否為好的分歧」,有一些指標可以利用,像是資訊熵(Information Entropy)及
例如:使用資訊熵的,包括名為C4.5及C5.0的演算法,
還有使用卡方檢定值的方法叫做CAID(Chi-Squared Automatic Interaction Detection)演算法。
第4章 用於營運管理的統計學
而用來檢驗其精準度的後者稱作測試資料。
- 最常見的所謂10折(10-fold)交叉驗證,就是先將整體資料隨機分成10個群組。
反覆進行10次,值到每個群組都當過一次測試資料為止,藉此驗證其精準度。
2021年6月26日 星期六
人工智慧在台灣:產業轉型的契機與挑戰
人工智慧在台灣:產業轉型的契機與挑戰
第二章 機器學習是什麼?
例如能不能從醫生的X光判讀結果,學習到怎麼看新的X片?
能不能從一個人的刷卡及繳費行為,預測她若借十萬元會不會準時還款?
- 無論選擇哪一種類型的題目,以及使用哪一種模型,資料都是專案成敗的關鍵。
都會影響機器學習的準確度。
Part 2 人工智慧與產業發展
第五章 產業人工智慧化經驗談
- 零售業與金融業的共通日常決策問題之中,最常被關注的應該是發送廣告文宣。
- 在金融業中,人工智慧的應用可以大略分為五個面向:風險、行銷、服務、市場及作業流程。
風險面向就是對未來風險盡可能的精準預測,這裡提到的風險,
- 在行銷及服務面向,發送廣告文宣及個人化文宣設計就是一例。
- 再進一步,以文字或語音客服機器人來提供理財顧問,或保單規劃的服務,也都在可預測的未來之中,大幅延伸金融業的客戶服務範圍。
- 對於金融市場的掌握度,無論是大眾熟知的投資工具,如股票、基金、ETF、債券,或是與總體經濟息息相關的利率、匯率,無論希望做某種程度的預測,或設計交易策略,或是設計衍生商品,或做市場撮合(market making),機器學習與深度學習都是重要的關鍵技術。
Part 3 迎向未來的準備
- 最理想的做法是,在實驗的各種變化中蒐集資料,建立更好的機器學習模型;
2021年6月23日 星期三
2021年6月20日 星期日
數位「真」轉型:來自全球五大數位轉型銀行的實戰案例
Doing Digital: Lessons from Leaders
1.獲客
--藉由更廣泛的通路增加獲客率--降低獲客成本
2.交易
--少紙化--創造即時滿足客戶需求
--降低成本
3.參與
--推動增加「黏著度」的客戶行為--透過情境行銷進行交叉銷售--增加每位客戶的收益
4.生態系統
--從管路企業到平台企業--資料--以洞察力為導向
2021年6月12日 星期六
認識資料科學的第一本書
Data Analytics Made Accessible
Ch01|資料分析概觀
名目資料(Nominal)、次序資料(Ordinal)、區間資料(Interval)、比值資料(Ratio Data)。
Ch02|商業智慧
- 極大化行銷活動的回報
- 增進客戶留存率(流失分析)
- 極大化客戶價值(交叉、追加銷售)
- 找出高價值客戶,並滿足他們
- 管理品牌形象
- 最佳化不同區域的庫存水準
- 改善商店陳列與銷售宣傳
- 為季節效應安排最佳物流
- 減少因有限賞味期的損失
- 自動化借貸申請流程
- 偵測詐欺交易
- 極大化客戶價值(交叉、追加銷售)
- 運用預估做出最佳現金準備
- 預測債券與股票價格的變動
- 評估事件影響對市場造成的移動
- 預估索賠成本以利更好的商業規劃
- 決定最佳利率計畫
- 對特定客戶進行最佳行銷
- 發現並避免詐欺行為
- 客戶流失管理
- 行銷與產品規劃
- 網路故障管理
- 詐騙管理
Ch04|資料探勘
- 分類技術的共同衡量標準便是預測精確度。
預測精確度 = (正確預測) / 預測合計
- 混淆矩陣(Confusion Matrix)
- TP,True Positive:當一個真的正類資料點被分類為正值。- TN,True Negative:當一個真的負類資料點被分類為負值。- FP,False Positive:當一個真的正類資料點被分類為負值。- FN,False Negative:當一個真的負類資料點被分類為正值。
Ch06|決策樹
1.決策樹對於分析人員與管理者而言,都一樣容易了解與使用。它亦具有高度預測準確度。
2.決策樹會從所有可用的決策制定變數中,自動選擇最相關的變數。
3.決策樹容許資料品質的問題,並且不需要使用者準備太多資料。
4.即使非線性關係,決策樹也能處理得很好。
- 較受歡迎的演算法有:C5、CART、CHAID。
- 分支準則(Splitting Criteria)
- 停止條件
- 修剪
Ch07|迴歸 Regression
作為因變數的轉換版本。
- 迴歸模型的不足:
1.迴歸模型無法掩蓋不良資料品質的問題,如果資料沒有好好整理,移除遺失的數值,
2.迴歸模型受共線性問題而拖累。
3.如果迴歸模型中包含大量變數,模型也可能變得笨重、難以信賴。所有加入模型中的變數,
4.迴歸模型不會自動處理非線性,使用者得自行想像需要加入何種額外條件才能改善迴歸模型的適合度。
5.迴歸模型只適合數值資料,而不適合類別資料。不過還是可以藉由建立多個帶有是/否值的新變數,來處理類別變數。
Ch08|類神經網路 ANN,Artificial Neural Network
- ANN的好處:
1.ANN的使用限制並不多。它可以自行處理(辨識/模型)高度非線性的關係,
2.他們可以處理各種問題類型,包括分類、群集、關聯...等。
3.ANN可容許資料品質問題,並不會限制資料必須遵守嚴格的常態與/或獨立假設。
4.他們可以兼具處理數值與類別變數。
- ANN的缺點:
1.它們被視為黑盒子解決方案,缺乏解釋力。
2.處理大量的變數可能十分困難(特別是豐富的名目屬性)。
3.訓練ANN需要大量的資料集。
Ch09|群集分析 Cluster Analysis
Ch10|關聯規則探勘 Association Rule Mining
Ch11|文字探勘 Text Mining
Ch12|單純貝式分析 Baive-Bayes
Ch13|支援向量機 SVM,Support Vector Machines
- SVM的優點:
1.即使特徵數量比起實例數量大很多,也能夠運作良好。它能運用在含有大量特徵空間的資料集上,
2.即使最佳決策邊界為非線性曲線,SVM會轉換變數以建立新的維度。
- SVM的限制:
1.它只在實數(Real Number)上運作良好。
2.它只能處理二元分類問題。不過我們可以建立一系列階層式SVM來解決此限制。
- SVM適用於文字探勘,例如過濾垃圾郵件以及詐騙偵測。
Ch14|網路探勘
- 網路使用探勘有許多商業上的應用。它可依據先前學習的規則與用戶特寫,(1)協助預測使用者行為,並可協助決定客戶的生命週期價值。藉由觀察網站中各頁面的(2)關聯規則,也有助於設計跨產品間的交叉行銷策略。網站使用分析可協助(3)評估促銷活動,觀察使用者是否受網站吸引,並使用與活動相關的頁面。網站使用探勘可依據用戶的興趣與特寫,(4)對用戶展現動態的資訊。這包括依據用戶存取模式,對用戶群組發布特定的線上廣告與優惠券。
Ch15|社群網路分析
- 影像力流模式(Influence Flow Model)
2021年6月5日 星期六
Bank4.0:金融常在,銀行不再?
Bank4.0:金融常在,銀行不再?
- 如果現在的銀行只是將分行及人員轉型以數位化的方式執行,你將會錯失最後機會。
第一章 回到第一原理
第二章 監管者的兩難
或是我們無法在未來證明這個產業的價值,好讓我們的機構保持全球競爭力。
第三章 內嵌式銀行業務系統
第四章 從產品、通路到體驗
- 數據科學家
- 機器學習專家
- 體驗設計師/體驗創作人(storyteller)
- 行為心理學家
- 區塊鏈整合工程師
- 合規與風險管理程式工程師
- 社群行銷專家
- 身分代理機構
第六章 金融科技和科技金融:是敵是友?
- 銀行需要面對和處理其根本缺陷:欠缺執行速度和專注力。說到底,我們還是要回到一個事實,
第七章 人工智慧在銀行業務的角色
- 銀行應用AI的能力面向和誘因
第九章 適應或死亡
- 我們不能用我們製造問題時的思維來解決問題。
第十章 結論:銀行4.0的發展路線圖
- 銀行在與科技金融和金融科技玩家爭奪營收和客戶關係時,產品本身不會創造關係或信任,
2021年5月23日 星期日
行銷資料科學
行銷資料科學|大數據x市場分析x人工智慧
PART 1 概論篇
- 何謂資料科學?
- 行銷資料科學家的工作包括:
- 產生規範性見解-包含戰略和戰術見解,以提高行銷效率。
- 探索性資料分析。
- 度量和方法選擇。
- A/B測試。
- 為管理層和其他專業人員提供諮詢,培訓和協助,幫助他們處理和理解各項組織數據。
- 行銷資料科學家所需的技能包括:
- SQL
- 資料視覺化
- 熟悉Python或R語言
- 能夠預測與建立模型(統計和機器學習方法)
- 人際關係技能-能和資料工程師、業務管理和其他人員協同合作
Chapter 02 行銷資料的類型、來源與管理
- 研究資料
- 資料的整理
--遺漏值的填補
稱為「預測均值匹配」(PMM,Predictive Mean Matching)。
2.二元變數:羅吉斯迴歸(Logistic Regression)進行預測。
3.超過二元以上的分類變數:貝氏多元迴歸(Bayesian Polytomous Regression)來處理。
Chapter 03 行銷資料科學技術概念
- 資料蒐集
利用R或Python等語言來開發爬蟲工具。
- 網路使用探勘(Web Usage Mining):企圖發現使用者的瀏覽特徵。
- 資料分析
在操作上,使用降維(Dimensionality Reduction)技術,來減少所考慮變數的有效數量。
分類(Classification)、分群(Clustering)、關聯(Association)等分析方法。
* 常見的機器學習演算法
- 類神經網路(ANN,Artificl Neural Network)
--激發函數(Activation Function)
--前向傳播法(Forward Propagation)
--反向傳播法(Backward Progagation)
-線性可分支持向量機
-非線性可分支持向量機
--核函數(Kernel Function)、特徵空間(Feature Space)
Chapter 04 整合行銷資料科學與行銷研究
- 行銷研究主要將資料分成「初級資料」與「次級資料」。初級資料的蒐集方式,又可分成:
調查法(Survey Research)、實驗法(Experimentation)、觀察法(Observation)、深度訪談法(Depth Interview)。
PART 2 大數據篇
Chapter 06 大數據行銷分析工具
- 大數據行銷分析工具
- 行銷分析階層
- 行為定向(Behavioral Targeting)是指網站和廣告商使用一系列技術蒐集與分析個人的搜尋
* 推薦系統
提出推薦。舉例來說,A顧客購買A產品,而A產品與B產品有相似性,此時,系統就自動推薦B產品給A顧客。
- 使用者基處的協同過濾(User-Based Collaborative Filtering Recommendation)
- 項目基礎的協同推薦(Item-Based Collaborative Filtering Recommendation)
- 模型基礎的協同推薦(Model-Based Collaborative Filtering Recommendation)
- 成交路徑(Path to Purchase)
- 網站分析(Web Analytics)目前主要有兩種方法:
1. 日誌分析(Log Analysis)即分析使用者瀏覽器與網站伺服器互動歷程中,所產生的網站日誌檔(web log files)以判斷點擊數(hits)、網頁檢視(page views)、網站停留時間(time on site)等,以了解網站的使用狀況與經營成效。
某些頁面已被瀏覽器所讀取。
--要分析或比較網頁內容好不好,有許多的衡量指標可參考,常見的指標除了上述提到的點擊數(hits)、網頁檢視(page views),還包括訪問量(Visits)、訪客(Visitor)、新訪客(New Visitor)、重複訪客(Repeat Visitor)等等。
- 歸因分析(Attribution Analytics)
最具有成本效益和影響力,以提升廣告支出回報率(Return on Ad Spend,ROAS)或者
取得有效的名單(Cost Per Lead,CPL)等。
-- 網路廣告的快速資增長,企業也同步獲得更多的數據來追蹤廣告的有效性,並且發展出更多評估廣告效果的方式,例如每次點擊成本(Cost Per Click,CPC),每千次曝光成本(Cost Per 1000 impression,CPM),每次完成行動成本(Cost Per Action,CPA)和點擊轉換率(Conversion Rate,CVR)...等。
- 趨勢分析(Trend Analytics)
- 定性法(Qualitative Method):判斷法、調查法。
- 定量法(Quantitative Method):時間序列分析法、因果分析法(迴歸模式、計量經濟模式)
PART 3 行銷篇
Chapter 07 市場分析與行銷資料科學
- 文章字詞矩陣(DTM,Document Term Matrix)
深度類神經網路(卷積式網路Convolutional Neural Network,如CNN,RCNN,Resnet)。
- 行銷漏斗(The Marketing Funnel)模型
反之則是「流失率」(Churn Rate) 。
「接觸點」意指顧客會接觸到企業產品或服務的任何機會,從消費者尚未購物的平常生活即已開始,到實際接觸的購買體驗,一直到售後的各種可能場景。
- RFM模型可協助公司找出「新客(近期曾經前來公司消費的客人)」、「常客(經常前來消費的客人)」,以及「貴客(消費金額大的重要客人」。
Chapter 08 STP 理論與行銷資料科學
- 企業在經過評估各種市場區隔後,接下來就是從中選定一個或多個「區隔市場」,以作為目標市場。依據哈佛大學教Derek F. Abell的研究,在目標市場選擇策略中,可以選用以下五種方式來進行。
- 單一市場集中化(Single-Segment Concentration)
- 選擇性專業化(Selective Segment Specialization)
- 產品專業化(Product Specialization)
- 市場專業化(Market Specialization)
- 全市場涵蓋(Full Market Coverage)
Chapter 10 價值溝通與行銷資料科學
- 行銷管理學裡,將傳統行銷方式區分成所謂的「推式策略(Push)」與「拉式策略(Pull)」兩大類。
- 拉式策略(Pull):意指企業透過於廣告、銷售促進等方式,引發消費者的購買慾望,將消費者「拉」到企業手上;推式測略(Push):則是由企業藉由人員推銷、銷售促進等方式,將產品透過一層層的配銷通路,「推」到最終消費者的手上。
- Outbound Marketing議為「推播式行銷」,是指企業透過電視、電話、報紙、電台、看板、
PART 4 策略篇
Chapter 11 行銷資料科學與策略
- 關於資料科學的分析,常見的分類有以下三種:
- 描述性分析(Descriptive Analytics)
- 預測性分析(Predictive Analytics)
- 指式性分析(Precriptive Analytics)
- 「預測性分析」能協助企業解決可能發生的事,
- 「指示性分析」則能指導實際執行時該如何做,
- 除此之外,尚有提出「診斷性分析(Diagnostic Analytics)」、
分析1.0
分析2.0
- 屬於大數據時代,統計分析以「預測性分析(Predictive)」為主,亦即「使用過去資料預測未來」。
分析3.0
分析資料以結合大量結構化與非結構化資料為主。
- 顧客流失(Customer Curn)分析的應用包含:
- 顧客獲得(Customer Acquisition)
- 顧客關係發展(Relationship Development)
- 顧客留存(Customer Retention)
- 顧客流失率分析(Customer Churn Rate Analytics)