領導者的數位轉型
第三章 人工智慧工廠
第三章 人工智慧工廠
▷即使生產的工業化已然實現,但分析與決策大致上然仍然是傳統且高度個人化的流程。隨著人工智慧時代的到來,促使公司展開新的一波的根本性轉變,將資料蒐集、分析與決策予以工業化,改造了現代公司的核心,使其轉變為我們所謂的「人工智慧工廠」(AI factory)。
▷人工智慧工廠是個能夠促進規模化的決策引擎,驅動二十一世紀公司的數位型營運模式,越來越多經營管理決策被內建在軟體之中,將許多以往由員工執行的流程數位化。在Google或百度,再也不用由拍賣官管理每天數百萬筆搜尋廣告的進架流程;在滴滴出行、客來吧(Grab)、來福車或優步,在也不用由派車原來決定該派哪輛車往顧客指定地點;在亞馬遜,高爾夫球的每日價格不再是由運動服飾零售商訂定;在螞蟻集團,每筆貸款的審核不再是由行員執行。
上述流程都已經轉交由人工智慧工廠以數位方式執行,把決策視納入工業化生產流程,有系統的把內部及外部資料轉化成預測、洞察及選擇,指引種種營運行動,甚至把這些營運行動自動化。這使得數位型公司具有更優異的規模、範疇及學習能力。
▷數位型營運模式有多形式,在一些案例中可能只是管理資訊流(例如螞蟻集團、Google、臉書),在另外一些案例中則是引導公司建造、傳遞或操作實體產品的方式(例如奧凱多、亞馬遜、從Google獨立出來的自動駕駛車Waymo)。不論採取何種形式,人工智慧工廠都是數位營運模式的核心、指引著最重要的流程及營運決策,而人員則從價值傳遞的主要途徑中移出,移至邊緣。
▷從本質上來看,人工智慧工廠能夠創造出使用者互動、資料蒐集、演算法設計、預測與改進之間的良性循環,包括:
- 更多的資料:人工智慧匯總來自多個不同源頭的資料,這些資料可能來自公司內部或外部。
- 更好的演算法:組織可以用這些資料去訓練與精進演算法,這些演算法不僅能夠做出預測,也能夠用資料去改進自身準確性。
- 更好的服務:這些預測結果可以透過通知人類從中獲得洞察,也可以透過自動化流程做出反應,從而影響組織的決策與行動,提供更符合顧客需求的服務。
- 更高的使用量:透過嚴謹的實驗規則來檢驗先前有關顧客型態變化、競爭者反應、流程變動等各方面的假設,這些規則可以辨別各種變數間的因果關係,用來改善系統。
▷最終,顧客實際使用情形、預測的準確度、所帶來的效益等相關資料會被輸送回系統中,進一步增進系統學習及預測能力,並且不斷重覆這樣的良性循環。
▷顯然地,上述資料無法交由少數分析師用人工方式處理,甚至無法用一般組合語言進行分析。但人工智慧工廠能夠解決這個問題,它將規模化生產方式應用在資料處理及分析上,藉此打造一個以數位型營運模式為核心的組織。接下來以網飛為例,深入探討人工智慧工廠的本質。
△網飛也透過更進階的分析,預測影響顧客忠誠度的因子。為了增加訂閱戶的看片時間,降低顧客流失率,網飛使用人工智慧推出一種功能,自動播出一部影集的下一集,或推薦同類型的電影。如今,類似這樣的客製化及個人化服務已經變得非常普遍。
△網飛也使用資料及演算法來決定自家公司的創作內容。該公司首次於2013年運用預測性分析功能,評估與獨立製片商媒體權資本公司(Media Rights Capital)合作推出<紙牌屋>(House of Cards)得客群潛力,這部影集是描述一位參議員如何進軍白宮的虛構故事。網飛的原創內容副總荷蘭(Cindy Holland)在受訪時指出:「我們運用預測模型幫助我們了解一個構想或特定議題的潛在觀眾群有多大。我們有一個作品體裁結構模型,能幫助我們知道哪些領域的節目有商機。」
△網飛及其它領先公司的經驗,凸顯出人工智慧工廠的一些基本組件的重要性
- 資料匯流(data pipeline):此流程以有系統、可持續、可規模化的方式,蒐集、輸入、清理、整合、處理與保全資料。
- 開發演算法(algorithm development):演算法產生有關於事業的未來狀態或行動的預測,這些演算法及預測是數位型公司運作的心臟,驅動一家公司最重要的營運活動。
- 實驗平台(experimentation plaftform):透過實驗平台機制,人工智慧工廠可以檢驗有關預測及決策的各種假設,以確定演算法建議的改變方案。
- 軟體基礎設施(software infrastructure):這些系統把資料匯流嵌入一個堅實的模組化軟體和運算基礎設施裡,並視需要及適切性,把它連結至內部及外部使用者。
▶若說資料是人工智慧工廠的燃料,那麼基礎設施就是傳送燃料的管路,演算法就是執行工作的機器,實驗平台則是把新燃料、新管路與新機器連結至現有營運系統的閥門。
△資料匯流(data pipeline)
- 「資料化」是指有系統的從任何事業自然進行的活動與交易中取得資料。
- 試圖建立人工智慧工廠的傳統型企業往往會發現,它們手中擁有的資料不僅片斷零散、缺乏完整性,而且經常是分散而孤立的存放在各部門IT系統。
△開發演算法(algorithm development)
- 蒐集與準備資料後,使資料變得有用的工具是演算法。演算法是機器處理資料時所遵循的一套規則,用以做出決策、產生預測或解決特定問題。
- 請想像一下,我該如何分辨分析顧客是否可能棄用某服務(例如取消網非會員資格)。首先,預測演算法將顧客流失率視為各種變數的函數(這些變數包括:使用率、滿意度、人口統計特性、其它用戶的關係或相似性等等),接著根據以往顧客資料做出調整,測試哪些變像可以準確預測顧客的目標行為。最後,演算法被部屬成經理人的一項分析工具,或是營運流程中的一個步驟(例如自動對可能流失的顧客提供特別優惠)。
- 網飛在各種情境中使用監督式機器學習。在影片與節目推薦方面,該公司使用一個群集的行動與結果(例如挑選及按讚表示喜歡的電影)構成的標注資料集,對一個被演算法視為與這個群集相似的特定用戶做出推薦。根據用戶及決策脈絡等等特徵來建立一個用戶選擇大資料集,可以產生有效的推薦。這種協調過濾演算法(collaborative filtering algorithm)被用於種種推薦,包括亞馬遜的購物引擎及Airbnb的媒合引擎。
- 非監督式學習法與監督式學習法有兩個最大的不同:
- 監督式學習是訓練系統去識別已知的結果;非監督式學習則是在沒有任何成見、沒有任何假設的情況下,從資料中獲得洞察。
- 在監督式學習中,輸入機器的是一些被加上特定結果標註的資料;非監督式學習的目的則是從未經標註資料中找出自然群集、發現那些觀察者沒有意識到的隱藏結構。因此,非監督式演算法的工作是顯示資料中的型態,在由人或其它的演算法標註特徵或群體、研判可能的後續行動。
- 非監督式學習能夠透過社群媒體貼文辨識顧客群及情感型態,作為產品開發的指引。對顧客進行的態度與人口統計結構問卷調查結果可以被用來建立顧客區隔,顧客流失原因也可以拿來讓非監督式學習演算法去做出分類,製造廠可以使用非監督式演算法來辨識與分類機器故障或訂單延遲的情況。
- 非監督式學習可區分為三大類:
- 第一類是把資料區分成群集(cluster)的演算法。時裝零售商可以使用這種方式來了解如何根據購買的產品種類、商品訂價與獲利率、把顧客引來商店的種種管道等等來區隔顧客群。老練的零售商可能擁有更多其它資料(例如顧客的社會網絡圖、顧客與哪些人有密切的互動聯繫、顧客在社群媒體上的發文等),能夠在簡單的人口統計資料之外,發現獨特的市場區隔方式。
- 第二類是關聯規則探勘(association rule mining)。一個常見的例子是根據線上購物車的品項,來預測並推薦購物者可能會想購買的更多其它商品。亞馬遜擅長關聯規則探勘,這類演算法探索一群商品共同出現的頻率與機率,然後建立各種商品之間的關聯性。
- 第三類非監督式學習演算法是異常偵測(anomaly detection)。這類演算法檢視每一筆新觀察或資料,判斷它是否吻合之前的型態,若不吻合,演算法就標註它為異常。這類演算法常被用於金融的詐欺偵測、醫療保健服務業的病患資料、系統和機器的維修等。
△強化學習
- 監督式學習需要使用專家對結果的觀點的資料,非監督式學習需要使用型態及異常辨識系統。而強化學習只需要一個起始點和一個執行功能。我們從某處作為起點,開始探索我們的周遭空間,看看我們的情況是改善了,抑或變差了,關鍵取捨是要花更多時間去探索我們周遭的複雜世界,還是直接運用目前已經建立的模型來進行決策與行動。
- 這與我們尋找下山途徑的情況相似,網飛將部分時間花在探索選擇,也將部分時間用於開發模型提供的解決方案。為探索視覺選擇,網飛有系統的把呈現給用戶的視覺隨機化,藉此所新增的可能性並調整預測模型;然後利用改善後的模型,以調整後的視覺影像向用戶呈現影片推薦。
- 將「多臂式吃角子老虎機問題」概念應用在實務上,可以提醒我們每一個流程會帶來不同的報酬,所以需要在不同流程之間分配有限資源。分配資源的基本原則就是:透過使後悔盡可能達到最小,來讓營運績效盡可能達到最大。
- 在營運模式中部署人工智慧時,「多臂式吃角子老虎機問題」非常重要,當我們致力於優化及改善各個流程的營運績效時,必須妥善選擇「探索」與「利用」之間的取捨。這類演算法被廣泛用於管理各項營運流程,包括選擇要推薦的產品、訂單產品價格、規劃臨床試驗、挑選數位廣告等等。
- 使用實驗平台前,必須先將業務改進方案轉化為假設,並會用隨機對照試驗(randomized control trial,又稱為A/B測試)來檢驗每一個假設。測試時先將用戶樣本隨機分配為兩組,實驗組(treatment group)接觸預定要推動的新服務,而對照組(control group)則接觸一如往常的服務。然後對兩組實驗結果進行比對,若兩組實驗結果存在統計上的顯著差異,就可以證實改進方案確實能夠達到預期效果,而非假設性相關。這樣一來就可以確保演算法產生的預測與實際結果之間確實具有因果關係。
- 實驗平台是人工智慧工廠的一個必要組件。假設我們用演算法預測顧客流失情形,得知顧客流失和特定的年齡群有關,但我們仍不知道這群顧客是普遍傾棄用我們的服務,還是如果提供特殊優惠方案就能讓他們積極考慮繼續使用。在付出高昂代價向數百萬用戶提供特殊優惠之前,我們可以先對小部分用戶進行A/B測試並蒐集統計上的證據,來證明有多少比例顧客會因為特殊優惠而選擇續用。相同的邏輯也可以大規模應用在檢驗人工智慧工廠所推薦的各種事業改善方案。



















