希捷——沖擊制造業AI最前沿

希捷制造工廠中的機器人
大數據、分析與人工智能(AI)早已在金融服務及電子商務領域得到廣泛應用,但在制造業企業中卻鮮見蹤影。除了預測性維護等少數用例之外,很少有制造企業擁有將分析及AI應用于關鍵業務流程的數據儲備與分析人才。
希捷技術公司是一家市值超100億美元的數據存儲與管理解決方案供應商,他們的表現為制造業企業的前沿科技應用之路奠定了基礎。希捷在制造工廠中部署有大量傳感器,并在過去五年中一直使用這部分數據保障并改善制造流程的運行質量與效率。
希捷制造分析體系中的一大核心,在于對硅晶片進行視覺檢測自動化,確保使用良好的元件制造磁盤驅動器磁頭及芯片。在整個晶圓制造過程中,希捷會收集到大量顯微鏡圖像,能夠借此檢測晶圓內部瑕疵并監控制造工具集的運行情況。由全球晶圓系統高級總監Sthitie Bom領導的工廠控制團隊,使用這些圖像素材中的數據建立起一套自動故障檢測與分類系統,能夠直接從圖像當中檢測并分類晶圓制造缺陷。此外,希捷還使用多種圖像分類模型檢測顯微鏡圖像中的失焦情況。
基于深度學習算法,這些ADC(自動缺陷分類)模型于2017年底首次完成部署。在此之后,圖像檢測功能被大規模推向美國及北愛爾蘭的晶圓制造工廠,幫助希捷通過節約人力成本、提升良品率獲得數百萬美元的收益。除了減少人員需求之外,這項技術的引入還幫助希捷提高了制造流程效率。幾年之前,希捷的視覺檢測準確性還僅為50%,但現在已經超過90%。
希捷的另一項成功嘗試,是將整個工廠內的傳感器數據整合起來。Bom及其全球晶圓系統小組一直傾向于采用開源解決方案;但這一次,他們選擇與智能運營平臺廠商Savigent Software合作,將來自各處工廠內多臺機器上的傳感器數據集成起來以供分析使用。Bom的小組也成為希捷內部第一個使用Hadoop存儲數據、以供分析及AI應用程序使用的團隊。
模型可解釋性方面的挑戰
雖然希捷在制造分析與AI應用等多個領域取得了實質性進展,但仍有一大難題始終得不到解決。考慮到工廠內部署有大量傳感器與計量工具,工程師往往會在警報中發現一些難以避免的誤報。傳感器讀數中的瞬態故障往往難以察覺,而且由于大多數生成警報的圖像識別功能源自深度學習模型,導致工程師根本無法理解這些復雜的系統到底如何、以及為何發出警告。因此,唯一的辦法就是投入大量時間進行全面的傳感器與故障讀數調查。為此,分析小組目前開始向工程師提供警報評分,借此預測傳感器發生故障的概率。然而,這種評分本身是如何得來,又成了新的謎團。
Bom的小組正在努力增強模型的可解釋性。事實上,這類問題在其他深度學習環境中同樣屢見不鮮。為此,她的小組希望在數據科學層面探索AI模型可解釋性的答案。在適用的場景下,該小組會使用Shapley值,一種評估博弈論模型中某些特征所產生的具體影響的方法。這種方法在相對簡單的模型中效果不錯,但目前要將其應用于深度學習模型,仍會造成高昂的額外計算成本。
第二種方法是在現實場景中對可解釋性進行更實際的處理,包括建立治理框架——使用三種不同的性能指標將標準軟件工程實踐擴展為模型行為控制方法。這三種指標分別為:
- 運行時錯誤監控——在生產部署的模型中監控、診斷、解釋及警告運行時錯誤的標準日志記錄系統;
- 模型性能監控——人機回圈界面,供領導專家對算法決策結果做出驗證,并在數據集上尋找可能解釋模型決策合理性的支持證據;
- 后果指標監控——這些指標將衡量在采用機器學習決策后,可能受到負面影響的其他因素——例如元件良品率。
這三大治理支柱能夠幫助我們解釋并理解現有模型做出錯誤決策后可能引發的后果,了解模型性能何時下降,并在必要時及時執行人機回圈驗證。
除了采用數據科學與可解釋性治理方法之外,Bom的團隊還與希捷創新中心Lyve Labs開展合作。位于以色列的Lyve Labs是希捷公司的創新中樞,于2020年2月正式啟動,負責與初創企業生態系統建立合作伙伴關系以實現外部技術創新。他們還與美國及英國各學術機構緊密合作,開發出能夠在各類狀況間建立因果關系的模型。即使未能實現全面自動化,其仍然能夠顯著加快對問題根本原因的分析速度。
引領明尼蘇達州各高科技制造企業間的AI合作
Bom意識到,她的團隊在實際工作中遇到的不少AI與分析挑戰,絕非希捷公司的特例。為此,她開始與明尼蘇達州各高科技制造商合作(希捷在這里擁有廣泛的制造業務布局),希望確定對方如何應對這些問題。希捷于2019年10月聯手Savigent同各合作伙伴組織了一場為期兩天的基準會談,專門探討AI技術對于制造業企業運營方式的影響。
Bom介紹稱,在本次會議上,她從其他公司身上學到了兩大基本觀念。首先就是“將數據分析融入血液”,這也是希捷長期以來的運營理念。去年,IDC發布的一項調查顯示,企業錯失可用數據信息的比例高達68%。在她看來,憑借以往在數據結構化、清洗與大眾化推廣方面投入的資金,希捷擁有“非常強大的數據基礎設施”,因而能夠建立起更精簡高效的模型開發流程。Bom還認為,與其他參會企業相比,希捷擁有更多樣化的AI產品組合。希捷目前在視覺檢測、時間序列領域以及軟件感知(即同時測量并分析來自多個傳感器的數據時)方面都已經有所部署。
其他參會者也對希捷的AI探索贊賞有加。憑借著將基于深度學習的視覺檢測機制集成到晶圓制造工廠內,希捷贏得了2018年由明尼蘇達州技術協會頒發的Tekne新興技術大獎。希捷還在其晶圓工廠中部署了云AI動態故障檢測方案,借此在2019年獲得愛爾蘭制造業研究獎。憑借一系列大獲成功的概念驗證,整個制造行業開始認真關切并投資于AI領域。但在實際推行中,企業往往發現AI擴展總會帶來意外難題——希捷成功實現AI部署的巨大價值正在于此。希捷公司制程工藝與系統副總裁Matt Johnson總結道,“將AI/ML技術整合至核心晶圓監控系統當中,有助于加快發現問題的速度,同時也減少了持續監控所需要的人力資源,最終顯著提高我們為下游部門提供的晶圓質量。”
Sthitie Bom將團隊的成功歸結于大家追求價值、不斷創新以及遠見卓實的堅毅精神。小組正一心一意推動AI技術在制造體系內的應用,并不斷將其拓展到更多具體工程領域。
Bom和她的小組無疑代表著正確的前進方向,也用真實案例證明企業在探索及動用AI力量方面的不懈追求,將給高科技制造業帶來何等巨大的變革。
本文章選自《AI啟示錄》雜志,閱讀更多雜志內容,請掃描下方二維碼