2022年4月9日 星期六

因果經濟學:數據氾濫時代,不可或缺的商業教養

因果經濟學:數據氾濫時代,不可或缺的商業教養

- 掌握因果關係的五步驟
1.「原因」是什麼?
2.「結果」是什麼?
3.確認三項要點
   (1)是不是「純粹的巧合」?-- 偽關係
   (2)是否存在著「第三變數」?-- 是否存在同時影響原因、結果雙方的「第三變數」,
其專有名詞為「混淆因素」。會讓單純只有相關關係的事物,看起來彷彿具有因果關係。
   (3)是否存在著「反向因果關係」?
4.創造出反事實
- 為了證明因果關係的存在,必須試圖比較原因發生時、「事實」情況下的結果;
以及原因未發生時、「反事實」情況下的結果。
5.調整至具可比較性
若在兩個群組之間,人口、平均所得、對流行的敏銳度等可能會影響珠寶飾品營業額的所有特徵都相差無幾,兩個群組之間的唯一差異就是「有沒有刊登廣告」的話,我們就可以稱此兩群組具有「可比較性」。
- 所有方法的共同目標都是「創造出具可比較性的群組,並用近似值代入反事實」。

第三章 男性醫師是否比女性醫師更優秀? 
- 隨機對照試驗在證據等級上的可信度很高,但是要實際執行隨機對照試驗並不是件容易的事。
- 使用隨機對照實驗,收集而來的數據稱為「實驗數據」,
而像這樣從日常經濟活動的結果中得到的數據,則稱為「觀察數據」。
- 自然實驗:是指透過法律或制度的變更、自然災害等「外部衝擊」的影響,
自然地讓研究對象被分為受干預的群組(實驗組)與未受干預的群組(對照組),
研究者利用這樣的狀況,進而檢驗因果關係。

第四章 增設合法保育所,母親就能去上班嗎? 
- 模擬實驗的「準實驗」:
是利用觀察數據與統計方法,創造出與隨機對照試驗非常相似的狀態。
將介紹以下四種「統計方法」:
1.差異中之差異法
2.工具變數法
3.斷點回歸設計
4.配對法
-改良事前事後比較研究的「差異中之差異法」:和事前事後比較研究不同的是,
差異中之差異法必須具備充當反事實的「對照組」。
- 差異中之差異法:是在受干預的群組(實驗組)未受干預的群組(對照組)之中,
取出干預前後的結果差異、以及干預後實驗組和對照組的差異;再取上述兩項差異的差。
但是,這項方法必須滿足兩項先決條件才會有效。
第一項條件:是實驗組與對照組在干預前的「趨勢」結果必須相同
也就是「趨勢」必須具「可比較性」。
第二項條件:是在干預的時間點,實驗組與對照組之中並未個別出現其他可能會影響結果的變化。

第五章  看電視會降低孩子的學習力嗎?    
- 工具變數法:利用「只能透過影響原因、間接影響結果」的工具變數,
讓受到干預的群組(實驗組)與未受干預的群組(對照組)具可比較性。
若要讓這個方法有效,必須滿足兩項先決條件。
第一項條件:是具變數雖然會影響原因,但不能直接影響結果;
第二項條件:則是這其中不存在會同時影響工具變數與結果的第四變數。

第六章 和會讀書的朋友來往,學習力就能提升嗎? 
- 斷點回歸設計:將任意決定的閥值兩側分為實驗組與對照組,藉此推斷因果效應的方法。
要讓斷點回歸設計成立的先決條件,是確保閥值附近沒有任何其他可能會影響結果的事件

第七章 就讀偏差值高的大學,收入就會提升嗎? 
- 「傾向分數」是將複數的共變量統整為一個分數,再利用該分數進行配對。
所謂的傾向分數,就是指「能對應到實驗組的機率」。
- 所謂的共變量,指的是扣除原因與結果之後剩下的所有變數。
比方說,在你手邊已有數據時,除了原因與結果以外的變數皆是共變量。
混淆因素則是共量變之中「同時對原因與結果帶來影響」的變數。
也就是說,在共變量之中,包含混淆因素與並非混淆因素的變數。
- 配對法:這項方法,使用可能會影響結果的共變量,從對照組之中找出與實驗組非常相似的樣本進行配對,並進而比較的方法。
在有許多共變量的情況之下,可將所有共變量統整為一項數值進行配對(傾向分數配對)。
讓配對法成立的先決條件,是必須能夠觀測所有可能對結果造成影響的共變量。

第八章    便於分析現有數據的「回歸分析」
- 以色列裔美籍計算機科學家茱迪亞·珀爾(Judea Pearl)開發出利用DAG圖(因果圖)
來釐清因果關係的方法。在此之後,透過哈佛大學的James Robins,Miguel Hernan以及
加州大學洛杉磯分校的Sander Greenland等人的努力,因果圖開始被醫學與流行病學所廣泛接受。
- 由於混淆因素是「對原因與結果雙方帶來影響的第三變數」,
因此,當劃出同時往原因與結果的雙向箭頭時,這個第三變數就能被視為混淆因素。
- 一旦確定出混淆因素,就必須使用配對法複迴歸分析來去除混淆因素的影響,
否則就無法正確定評估因果關係。
相對地,若從原因指向第三變數的箭頭方向顛倒時,我們就能得這個第三變數並非混淆因素(由於他位於因果關係的中途點,又被稱為「中介變數」。
萬一用複迴歸分析處理中介變數,就會低估原因本來會造成的影響。

延伸閱讀:
-哈佛大學經濟系知名計量經濟學家圭多·因本思Guido Imbens、
麻省理工學院的勞動經濟學家約書亞·安格里斯特,和唐納德·魯賓合著-
魯賓因果推論模型(Rubin Causal Model)。
-魯彬與因本思共著-Causal Inference for Statistics,Social,and Biomedical Sciences:An Introduction

分析的「效度」與「極限」
- 內部效度指的是兩個變數之間,具有因果關係的可信度。
也就是當同一批研究對象群組再次受到相同的干預時,就能夠在多大的程度上得到相同的結果。
相對地,外部效應是指當不同於原先研究對象的群組受到相同干預時,能夠在多大的程度上得到相同的結果。