2015年12月5日 星期六

大數據@工作力:如何運用巨量資料,打造個人與企業競爭優勢

大數據@工作力:如何運用巨量資料,打造個人與企業競爭優勢
Thomas H. Davenport
2014/11/25

第一章 為何企業與個人都需要大數據?
第二章 大數據將如何改變工作、企業與產業
第三章 發展大數據策略
- 你希望應用大數據實現什麼目標?
降低成本、縮短時間、發展新產品、支援內部事業決策
-如果公司內部缺乏資源做這樣的評估,幾家大數據導向的企業,
像是勤業眾信(Deloitte)埃森哲(Accenture)以及IBM的全球服務事業群,
應該都會很樂意派出他們的顧問提供協助。

第四章 大數據的人才面
F資料科學家的特質:
1.駭客
會寫程式;(Python,Hive,Pig,Java,MapReduce/Hadoop)
能理解大數據技術架構
2.科學家
能提供佐證支援決策;即興;性急
3.可靠的顧問
良好的溝通能力與人際技巧;能設計決策架構;了解決策流程
4.量化分析師
能做統計分析;能做視覺資料分析機器學習;能分析文字、影片或圖像等非結構資料
(數學,統計,自然語言處理NLP,Natural Language Processing)
- 有了大數據,組織會直接分析整個母體的資料。假如你不是根據樣本的結果推論母體情形,就不必再擔心什麼統計顯著性(觀察到的結果能否代表母體)的問題。
5.商業專家
懂得企業如何運作、如何賺錢;對於要把資料分析與大數據應用在哪些層面很有看法

C垂直型的資料科學家:
對於某些較狹隘的領域擁有很深入的知識。他們可能是熟知各種排序法則之運算複雜性電腦科學家;可能是對特徵值、奇異值分解及其數值穩定性等無所不知的統計學家;可能是有幾年時間為應用程式介面API的開發及網路爬行技術撰寫Python程式碼(包括繪圖函式庫)軟體工程師;可能有個出色的資料建模、資料倉儲、圖形資料庫、Hadoop與NoSQL專業知識資料庫高手;也可能是專精貝式網路(Bayesian Network)、SAS與SVM模型預測師
C水平的資料科學家:
是商業資料分析師、統計學家、電腦科學家,以及特定領域專家的混合體。他們結合了願景與技術知識。他們或許不是特徵值、一般線性模型及其他辦過時的統計技術專家,卻懂得一些能應用未結構化資料、串流資料及大數據的更現代、更資料導向的技術...他們能設計出穩健、有效能、簡單、可複製、可擴充的程式碼與演算法則。

F資料科學家何處尋?
1.來自大學的資料科學家
資料科學學位->課程主要是碩士等級的課程;例如,加州大學、柏克萊大學,以及紐約大學。
線上課程->史丹佛與麻省理工學院等學校在線上提供大數據、機器學習、Python等腳本語言設計等課程。
商業資料分析課程(已加入資料科學內容)->北卡羅萊納州立大學(是所有這課程的始祖)、西北大學、紐約大學、史蒂芬斯理工學院、路易斯安納州立大學、田納西大學、巴拉馬大學、辛辛那提大學,以及舊金山大學等學校。
2.大學以外的來源
EMC,IBM,勤業眾信(Deloitte)(和印第安納大學的凱來商學院Kelly School of Business合作),埃森哲(Accenture)

第五章 大數據的技術
圖5-1 大數據技術概述

IBM,Oracle,SAP,Teradata,SAS,SPSS,R,機器學習
圖5-2大數據技術堆疊

儲存、平台基礎架構、資料、應用程式碼、商業觀點、應用程式
圖5-4大數據技術的生態系統

第六章 大數據的成功條件
第七章 我們可以從新創和線上企業學到什麼?
第八章 大企業怎麼做?

國際數據分析研究所、天睿Aster


沒有留言:

張貼留言