2014年11月30日 星期日

IT DNA - 資深 IT 人現身說法‧20 年的實戰心得與趨勢觀察

IT DNA
2008/5/20

第一篇:工作與實戰
- 好的IT人員在職場中,尤其是系統管理人員,就個人認為所花的時間比例由多到少應該如下:
充實自我(佔絕大多數時間)、規劃正確的系統、操作與設定系統、處理突發狀況。
- Agile方法論裡,連加班都反對,因為疲勞時所撰寫的BUG,要花十倍精神好的時間去尋找

第三篇:閱讀與觀點
#引用前人智慧,提高思考層級 -《設計模式入門》
#提升軟體品質的必經之路 -《軟體測試理論與實作》
- 軟體生命週期,大可分為分析、設計、開發、測試、上線、維護數個階段。
#遞迴修正,直至滿意 -《規劃極致軟體製程》
- 加班不是一個好主意...即使程式設計人員願意加班,也不是一個好主意。長時間的工作會令人感到疲累,疲累的人容易犯錯,而錯誤需要花更長的時間來找尋與修正。
- 軟體專案的四個變數中:成本(Cost)、品質(Quality)、時間(Time)和規模(Scope),時間和規模是較好控制的...必須讓時間成為可見的。
- 自己炒的菜再難吃,自己也會捧場。
#軟體工程與 Microsoft Visual Studio Team System
#簡化設計、開發與維護的圖形化工作流程模型-
《Microsoft Windows Workflow Foundation Step by Step》
-定義使用者圖形介面的WPF(Windows Presentation Foundation)
- 程式間標準溝通方式WCF(Windows Workflow Foundation)
- 設計與撰寫工作流程邏輯的WF(Windows Workflow Foundation)
- 認證個人身分用的WCS(Windows CardSpace)
#平凡中見偉大-《電學之父:法拉第的故事》
#營造集體的智慧-《Peopleware:腦力密集產業的人才管理之道》
- 現今,大部分對於腦力密集產業所持有的管理概念多襲自工業革命後的大量製造,只會緊緊控制眾多勞力的「身體時間」,未能激發「腦力時間」。但從事知識工作,應在專案規畫時,嘗試評估所需的「有效腦力時間」,而非粗糙的勞力時間-「人/月」,這種只要人在就有產出的生產模式,不適用於腦力工作。
- 多數管理者視提升腦力素質的費用為支出,而非投資,導致不珍惜已經養成的團隊成員,任意裁撤或驅使其離職,以降低成本。但罔顧一再在新人身上重複支出的養成費用,低估未進入狀況的大腦對團隊之殺傷力。
- 若管理者緊掐著同仁出現在眼前的工作時數,只計較省了多少培育或激勵士氣的費用,只想準時完工卻不了解品質,讓工作氣氛是莫可奈何聽命行事,則不用奢求有創意。
- 管理者的工作並不是叫人去工作,而是創造讓人想去工作的情境。
- 管理者須提升的是正常工作時間的「質」,而非延長工作時間的「量」。在延長的時間中工作,只會讓人妥協,放棄理想與品質,並因勞累、渙散而埋下更多錯誤,諸此種種都將增加更多的工作量。
#資訊專案管理的迷思與管理之道-《人月神話》
- 「人月」是個危險並很容易就遭到誤解的迷思,因為他假設人力和工時是可以互換的。
- 在一個時程已經落後的軟體專案中增加人手,只會使它更落後。
#資訊世界的挑戰與機會-《資訊經營法則》
#管理的創新,企業的創新-《管理大未來》
#從誠懇出發,邁向自我實現-《做最好的自己》

第四篇:創新與價值
- 日式管理重視風險控管,較少嘗試新領域,也少冒險創業,但變動是消費性電子產品的底蘊。


2014年11月15日 星期六

從資料中挖金礦:找到你的獲利處方籤

從資料中挖金礦:找到你的獲利處方籤
2010/03/12

- 資料採礦是一種行為的總稱,其中存在著許多分析技巧,根據分析的目的不同而被選擇使用:
分類-群集分析(Cluster),決策樹分析(Desision Tree),自我組織映射圖(Self-OrganizingMap,SOM)
發現關聯-關聯法則(Association Rule)
預測-迴歸分析(Regression Analysis),類神經網路(Neural Network)
- 傳統上統計分析其一個弱點是,必須先建構分析才有辦法開始蒐集資料。在這個過程中會篩選資料,但畢竟資料蒐集需要時間,於是會有時間上的落差。
- 資料量和演算能力就像是車子的兩輪,缺了一個就無法適當的利用資料。
- 可使用的資料在質與量的大幅提升,使得資料採礦偏向預測未來,有別與傳統統計分析偏向於對既有定律的事後驗證。
- 資料採礦雖然可以發現各種情況下的各種定律,卻不會說明其中原因。

-資料採礦的步驟
先決定想知道什麼 / 資料的蒐集方法 / 某些資料在使用上的困難 / 捨棄不需要的資訊 /
線索在哪裡? / 先從單一資料下手 / 失敗經驗有助於往後的分析 / 下一個屬性 / 異常值的處理 /
根據單一屬性設定假說的極限 / 發現橫跨好幾個屬性的隱藏定律
- 過度培育決策樹會造成「過度學習」


2014年11月8日 星期六

改變世界的九大演算法

9 Algorithms That Changed the Future
2014/08/07

搜尋引擎的索引(Search engine indexing)
網頁排序(Page Rank)
公鑰加密(Public-Key cryptography)
錯誤更正碼(Error-Correcting Codes)
模式辨識(Pattern Recognition)
資料壓縮(Data Compression)
資料庫(Database)
數位簽章(Digital Signature)
什麼是可計算的?
結論:未來會如何呢?


資料來源與延伸閱讀:
第1章 引言:讓今日電腦威力無窮的神奇概念
- A.K. Dewdney著<The New Turing Omnibus>,電腦科學概念
- Juraj Hromkovic著<Algorithmic Adventures>
- 大學程度的演算法教材:
Dasgupta,Papadimitriou,Vazirani合著<Algorithms>
Harel,Feldman合著<Algorithms:The Spirit of Computing>
Cormen,Leiserson,Rivest,Stein合著<Introduction to Algorithms>

第2章 搜尋引擎的索引
- Croft,Metzler,Strohman合著<Search Engines:Information Retrieved in Practice>

第3章 網頁排序
- 佩吉與布林合著<The Anatomy of a Large-Scale Hypertextual Web Search Engine>,
是Google架構的原始論文,對於網頁排序做了精簡的描述與分析
- 技術性且廣泛的分析可參考Langville,Meyer合著<Google's PageRank and Beyond>,
但最好具備大學程度的線性代數知識
- John Battelle所著<搜尋未來>
- Fetterly,Manasses,Najork合著<垃圾,討厭的垃圾和統計學:利用統計分析來找出垃圾網頁>
(Spam,Damm Spam,and Statistics:Using Statistical Analysis to Locate Spam Web Pages)

第4章 公鑰加密
- Simon Singh所著<The Code Book>針對加密做了精闢易懂的說明


第5章 錯誤更正碼
- 湯普森(Thomas M. Thompson)著<從糾錯碼到球狀包裝到簡單群組>
(From Error-Correcting Codes through Sphere Packings to Simple Groups)
- A.K. Dewdney所著<The New Turing Ominibus>書中有兩個章節提到編碼理論(coding theory)

第6章 模式辨識
- 米契(Tom Mitchell)著作<機器學習>(Machine Learing)
- 克李維爾(Daniel Crevier)著<人工智慧:尋找人工智慧之騷動史>
(AI:The Tumultuous History of the Search for Artifical Intelligence),
當中對達特茅斯人工智慧大會做了有趣的說明。
- 麥克道克(Pamela McCorduck)所著<思考的機器>(Machines Who Think)

第7章 資料壓縮
-馬凱(David Mackay)所著<資訊理論、推論和學習演算法>
(Information Theory,Inference and Learning Algorithms)

第8章 資料庫:追求一致性
- Garcia-Molina,Ullman,Widom合著<資料庫系統>(Database Systems)

第9章 數位簽章:這軟體到底是誰寫的?
- Gail Grant著<了解數位簽章>(Understanding Digital Signature)

第10章 什麼是可計算的?
-Christos Papadimitriou著<圖靈:關於計算的一本小說>(Turing:A Novel about Computation)

第11章 結論:未來會如何呢?