2014年8月15日 星期五

大數據

大數據
2013/05/30

第1章 現在 該讓巨量資料說話了

第2章 更多資料 「樣本=母體」的時代來臨

第3章 雜亂 擁抱不精確,宏觀新世界

第4章 相關性 不再拘泥於因果關係

第5章 資料化 當一切成為資料,用途無窮無盡

第6章 價值 不在乎擁有,只在乎充分運用

第7章 蘊涵
資料價值鏈的三個環節:資料技術思維
- 資料價值鏈環節之一:資料持有人
資料是指擁有資料、或至少能夠存取使用資料的公司。(ex.推特,MasterCard Advisors)。
- 資料價值鏈環節之二:資料專家
技術是指顧問公司、技術供應商和分析提供商,擁有實際操作的技能。
(ex.天睿Teradata, Accture, Farecast)(微軟的Amalga軟體)
- 資料價值鏈環節之三:有巨量資料思維者

- 資料科學家結合了統計學家軟體工程師資訊圖表設計師的技能,而且擅長講故事,樂於宣揚資料科學。
-現在,資料已經可以如此廣泛取得,又具有重要策略意義,缺少的則是能夠找出並取得其中價值的智慧。正因如此,統計學家資料庫管理人員機器學習這幾項專業,可說都已經站穩了未來的夢幻位置。
- 現在,各種資料庫管理資料科學資料分析機器學習演算法之類的專業知識,都還處於求才若渴的狀態。
- 巨量資料的先驅常常來自其他領域,原本的專長是資料分析人工智慧數學或統計資訊
- 現代職場的基本能力要求:數學統計學,或許再加一點程式設計網路科學
- 在巨量資料時代,除了學科專業知識的深度,寬度也很重要。想解決某個生物學難題,很有可能需要和天文物理學家、或是資料視覺化設計師攜手合作。

第8章 風險 巨量資料也有黑暗面
- 除非妳拿出東西給顧客看,不然他們也不知道自己要什麼。

第9章 管控 打破巨量資料的黑盒子
- 巨量時代興起的新專業,會是電腦科學數學、以及統計學領域。
由於演算學家了解演算法統計方法資料集,便能夠調查清楚,決定究竟是如何產生的。

第10章 未來 巨量資料只是工具,勿忘謙卑與人性