2020年2月8日 星期六

一次看懂小數據

一次看懂小數據:MIT經濟學家帶你搞懂生活中的統計數字,聰明做決定

第一章、生活無處不數據
第二章、挑戰者號的挑戰(抽樣如何影響結果)
- 要更完整檢視自行提報數據的缺失,請讀英國科學基金會經營的部落格「腦波」(Brainwaves)
上的一篇文章<自行提報的危險>。
Rob Hoskin,"The Dangers of Self-Report",British Science Association Brainwaves website,
March 3,2012,http://www.sciencebrainwaves.com/te-dangers-of-self-report/.
- 問題並不在於抽樣本身,也非抽樣造成,反之,
如何解讀結果,以及找到結果的意義,才是關鍵

第三章、你比其他人聰明嗎?(加總、平均與離群值)
- 從統計上來說,在思考平均時你要知道三個不同的詞彙:平均數、中位數和眾數。
- 許多平均實際上是加權平均,在計算結果時,看看是否所有數值都受到相同的待遇。
- 找出離群值,並了解它會對平均造成什麼影響。

第四章、你比用iPhone、聽電台司令的人更聰明嗎?
(區別相關性與因果關係)
- 代理變數是你認為和另一個因素密切相關的因素,但兩者其實並不相等。
比方說,智商就是一個人天生能力的代理變數。智商測驗無法衡量你實際的能力,
只是能知道在一個應該可以測出智力高低的測驗中,你的表現有多好。

第五章、我們信仰統計(眼見真的為憑嗎?)
- 統計顯著性指的是某件事為真的機率,這個指標是用來衡量我們看到的結果為真
(而不是湊巧發生)的可能性有多高,也因此,通常以「p值」來衡量。
「p」指的就是probability,機率。如果你認同p值是衡量統計顯著性的指標,
那麼,當p值越小,你看到的結果就越不可能是巧合。
- 統計影響只是說,真的,這當中存在著或強或弱的關係。
但是,我們在日常生活中不會以統計關係來做決定。
反之我們看的是經濟影響-這個絕對會對我們的時間、金錢、
健康或其他資源帶來多大成本?

第六章、縮小的非洲(錯誤表述與錯誤解讀)
第七章、當心採櫻桃的人(選擇性表述)
第八章、明天太陽依舊會升起嗎?(預測)
- 擲硬幣是過去數據並不重要的範例之一。因為擲硬幣是真的隨機事件,
面對真正的隨機事件,你無法用過去作為模型。
如果你擲十次硬幣,十次都出現人頭,下一次人頭潮的機率依舊是50%。
沒錯,你不太可能連續擲出十次人頭,
但是這和未來無關。長期下來,會出現50%對50%的機率,
但每一次擲硬幣都是獨立事件,和過去發生的事完全分開。


沒有留言:

張貼留言