156
機器人
昆侖數據首席科學家田春華:人工智能降低了工業大數據分析的門檻
機器之心原創
作者:高靜宜
在剛剛結束的國際 PHM 數據競賽中,昆侖數據的 K2 代表隊以絕對優勢一舉奪冠,成為 PHM Data Challenge 十年競賽史上首個完全由中國本土成員組成的冠軍團隊。團隊由昆侖數據首席數據科學家田春華博士帶領四名成員組成,在業餘時間完成了本次競賽的任務。
PHM(Prognostics & Health Management,即故障診斷與健康管理)學會從 2008 年成立一直專注於工業設備故障診斷領域,其每年舉辦的「PHM 數據競賽」是國際上高水平的同類賽事之一。首屆競賽由國際 PHM 學會和 NASA 共同舉辦,此後賽事成為一項傳統,受到來自歐美工業界乃至軍工界的追捧,至今已經有 10 屆。往年的競賽題目包括「渦輪發動機的剩餘壽命預測」、「齒輪箱異常檢測」、「晶圓化學機械平坦化異常分類」等,今年則聚焦於「城軌車輛懸掛係統異常檢測」。
本次競賽包括兩個問題:
1)健康診斷:判斷城軌車輛懸掛係統是否處於故障狀態
2)故障定位:從故障車輛的 22 個部件中識別出 1~2 個故障部件
這個題目具有重要的現實意義,可以延伸至高鐵、地鐵以及汽車等應用領域。
圖為懸掛係統模型,分為一級減震和二級減震,由 22 個部件組成(彈簧/阻尼),共安裝 18 個振動傳感器(紅色標識)
本次競賽分兩個階段,階段一為模型的訓練與測試,訓練集為 200 個健康車輛軌道運行數據,測試集為 200 個待判軌道車輛運行數據;階段二是模型的驗證,驗證集為 200 個待判軌道車輛運行數據。
「這裏的難點在於,訓練數據集中都是健康樣本,沒有異常。」田春華說,「可是往往有價值的則是異常數據,這是工業場景中普遍存在的現象。」實際工業場景中的異常數據較少,而且工業係統進行過多次調優,所以絕大部分工業數據均為正常數據,這與研究人員進行大數據分析的過程中希望具備全模態樣本的期望相背。「比如近萬台風機中,三年內可能隻有個位數的風機出現過重大故障。想想樣本得有多麼不均衡吧。」他補充道。
解決這個問題有兩種思路,一是用數據模型精確刻畫所有的正常情形,隻要脫離正常情形就判定為異常,這需要進行細致入微的建模,但會存在誤判的情況;二是讓模型具備通用性,考慮軌道、速度、負載等外生變量對係統產生的影響,同時考慮係統運行是一個動態的過程,要尋找到不變量。
K2 團隊在 PHM 競賽中的解題思路
「好在我們拿到了 18 個傳感器的數據,係統內部的相關性非常強,所以可通過信號上下前後的一致性來增加一些判斷。」田春華表示,團隊為此加工了減振比等特征。「我們過去在這個問題上積累了很多經驗,所以一開始就抓住了問題的基本麵。在選擇了正確的特征加工路徑之後,精度可以達到 80% 以上,接下來再進行算法的調整和優化。」此外,團隊還使用了基於相似度的軌道位置匹配減弱軌道不平整的影響。
在判斷出係統處於正常還是異常狀態後,團隊麵臨著第二個考驗,即指出到底是哪些彈簧或阻尼發生了故障。據田春華介紹,由於訓練集全部為正常樣本,所以這裏需要結合自動控製理論中頻域分析的知識:彈簧可以控製振幅,阻尼會使振幅衰減。在這個機理的基礎上,數據驅動才能實現。
「其實當初在第二個問題上,我們也隻是有一個大概的想法,沒有必勝的把握。後來使用了多模型才有了一點突破,這都是我們意料之外的。而且跟往年的題目相比,今年的題目機理較強。雖然過去我們有很多經驗,但是為了進行佐證,團隊仍然查閱了大量的文獻。」田春華回憶道。
K2 團隊在 PHM 競賽中的調優曲線圖
事實上,競賽的兩個問題原本的分值比重各占 50%。各領先團隊在第一個問題上的分數相差不多,但由於第二個問題難度較大,K2 團隊占據了絕對領先優勢。組委會出於競賽趣味性的考量,更改了規則,把兩個問題的分值比重改為 3:1。
「我們還是處於領先,隻是優勢沒有那麼大了。」田春華說道。最終,K2 團隊的模型在第一個問題上的準確率達到 82.5%,在第二個問題上的靈敏度達到 53.5%,以 0.762 的總成績摘得桂冠。
在談到團隊奪冠經驗時,田春華表示,在短時間內把數據和機理有效結合,這對選手的專業性要求極高。K2 團隊成員來自不同的領域,如自動化、統計、計算機,實現了優勢互補。特征加工為後續研究奠定了基礎,機理確定則幫助團隊瞄準了方向。
在工業領域,企業希望最大程度地挖掘工業大數據的潛在價值並將其高效延伸至實際的細分場景,進而實現對工業業務理解的加深、降低實際決策所帶來的不確定性。換言之,這些企業需要一個「醫生」,這位「醫生」需要通過「望聞問切」掌握工業機器的健康狀況,不僅要能診斷出機器是否「生病」以及「病因」,並且對症下藥,還要具備預測機器什麼時候將會「生病」的能力。
舉例來說,風機葉片受到低溫環境因素的影響,可能會麵臨結冰的問題,這不僅存在安全隱患,也會對風機的效率與健康帶來不良的後果。由於許多風機部署於較為偏遠的地區,單純依靠人力難以實現對風機狀況的監測。如果可以使用傳感器采集風機的數據指標,然後傳輸回機控中心加以分析,那麼企業員工就能夠遠程掌控每一個風機的狀態信息。因此,一個能夠適應複雜地形、複雜氣象條件的數據分析模型就十分必要了。
在人工智能技術興起之後,工業大數據領域的研究人員就開始嚐試使用新技術處理問題,並將其應用於一些數據量較大的工業應用案例。田春華介紹,公司在風機結冰問題上就曾使用過深度學習技術進行自動識別,而且表現不錯。「在做風機結冰項目的時候,利用深度學習上來就取得 70% 的精度,這樣我們對模型精度有了一個基準。然後我們加工特征後,通過白箱模型讓精度提升至 80% 以上。」他解釋道,「在處理實際工業問題時,我們通常先用深度學習快速得到一個基準,然後再做一個白箱模型,因為工業界的一線操作人員還是希望模型具有可解釋性。某種程度上,人工智能技術降低了加工特征的工作量和數據分析的門檻。」
「當前人工智能存在一定的封閉性,雖然具有巨大的發展空間。在工業大數據領域,基於統計的數據分析方法並不是唯一的技術手段。」昆侖數據 CTO 王晨解釋道,「我們認為,工業領域人工智能突破的方向在於,如何把統計模型與領域內的知識與機理模型深度融合。這也是我們研究的一個重要方向。」
「具體到工業領域中的實際問題,遠比競賽複雜和有趣得多,從大數據分析應用領域來說,除了 PHM 之外,大數據還可以在生產效率提升、產業互聯網等方麵發揮相當大的價值。」
在 SMT(印刷電路板)產線,SPI 機台利用光學檢測自動研判錫膏塗抹質量,但往往過於嚴格,導致很多符合工程設計要求的產品被判定不合格。對於高價值產品,SPI 研判為不合格的板子還需要大量的人工複判。使用機器學習方法自動識別,部分篩選出合格品,這將大大降低人的工作量。
但在石油管道泄漏檢測中,機器學習的重點就是降低虛假預警。利用負壓波檢測是否存在泄漏相對容易,但造成壓力下降的因素較多,除了泄漏,還有不同油品輸送壓力不同、油罐更換等正常工況變化的影響。幸運的是,我們發現不同原因造成的壓力下降曲線形狀存在細微差別,有的曾現底部震蕩,有的曲線光滑但間雜毛刺。利用模式識別技術可自動匹配出識別出的壓力下降的真正故障原因,降低了虛假預警給實際運維帶來的困擾。
工業大數據的三大典型方向
「一個完整的工業大數據分析要整個流程打通,從開始的接入管理、規劃、數據整合、深度分析,到後來的應用、業務流程,以及誰是工業產品的目標用戶、選擇工業產品的原因及利好等等,這些問題都是工業大數據平台要給出的答案。」田春華說道。
昆侖數據專注於做工業企業的大數據合夥人,成立於 2014 年底,創始團隊來自 IBM、華為、西門子等科技企業,公司於 2015 年 1 月完成天使輪融資,同年 9 月獲得來自達晨創投的數千萬人民幣 A 輪融資,2016 年 8 月完成 1 億人民幣 B 輪融資,如今團隊有 100 餘人。目前,昆侖數據已推出工業大數據平台產品 KMX,著眼於管理分析海量機器數據,挖掘展現數據價值,幫助企業為數據賦能、實現業務洞察、形成行動閉環。
以風機的運維場景為例,KMX 平台可以把風機附近的氣象信息、地理信息、包含曆史養護信息的設備日誌等關聯起來,為接下來的數據分析提供有力支持。在沒有大數據平台的情況下,這些數據是散落在各個係統中的,無法為數據分析提供上下文信息,可能導致數據挖掘和分析結果較為片麵。
目前,昆侖數據主要聚焦於能源行業、裝備製造以及電子製造這三個領域。王晨介紹,為了保障企業的數據安全,昆侖數據會施行事前及事後的權限管理策略,設定了嚴格的訪問權限及痕跡追蹤管理。王晨表示:「工業大數據領域正處於方興未艾階段,市場空間較大,我們也正在積極探索的過程中。」
今年,昆侖數據參與舉辦了首屆中國工業大數據創新競賽,該賽事由工信部指導、信通院主辦,吸引了來自海內外 1000 多支參賽團隊。昆侖數據受邀承擔出題任務並擔任決賽評審專家。此次競賽的兩道競賽題目分別為「風機葉片結冰檢測」和「風機齒形帶斷裂預警」。談及投入不少精力來推動中國自己的工業大數據競賽,「也是希望大家能多關注這個領域,這裏麵的確有許多有意思的問題。」田春華笑道。
至於未來,人工智能是否能在工業大數據領域有所突破?遷移學習是否能在強機理的現實世界中找到落點?工業大數據還隱藏著哪些未被挖掘出的潛力?
想必隨著時間的推移,這些專攻工業大數據的科學家們一定會在實踐中找到令人驚喜的答案。
最後更新:2017-11-01 16:37:51
上一篇:
90後女工程師駐守草原:這個雙11我的同事是“機器人”
下一篇:
人工智能會消滅市場,把我們帶往計劃經濟嗎?
日本大學入學考試,AI成績超八成學生,人工智能真能超越人類?
人工智能第一龍頭股跌至3元,主力暗中吸籌11億,17年目標60元
機器人行業盛會卻引來一眾家長是為何?
機器人索菲亞問世,AI技術的發展是否會對人類造成威脅呢?
馬雲:我最艱難的時刻去了延安;馬斯克:人工智能恐引爆第三次世界大戰;外交部長:希望朝方不要再一意孤行
機器人裁縫降臨中國,22秒生產一件T恤,除了衣服物美價廉,恐萬人失業威脅中國製造,如何看待利害關係?
營銷迎來下一個拐點,人工智能可以找回浪費的那一半廣告費嗎?
未來十年,人工智能將顛覆華爾街
人工智能VS民航界!你們有信心應戰入侵民航領域的AI嗎?
機器人接管世界的開始?人工智能首次完成對人類的“屠殺”