近年來(lái),隨著(zhù)企業(yè)所擁有的數據日益豐富,以及數據驅動(dòng)意識的不斷提升,越來(lái)越多的制造企業(yè)加強了大數據應用探索,并已有一些成功的應用實(shí)例。然而,對于很多制造企業(yè)而言,在推進(jìn)工業(yè)大數據的應用過(guò)程中仍面臨著(zhù)以下難題:采集了很多數據,如何來(lái)分析和利用這些數據,找到與自身業(yè)務(wù)融合的應用場(chǎng)景以解決實(shí)際問(wèn)題?如何務(wù)實(shí)推進(jìn)工業(yè)大數據的實(shí)施與落地?本文將圍繞著(zhù)以上問(wèn)題進(jìn)行討論和分析,希望為企業(yè)開(kāi)展工業(yè)大數據的實(shí)施與應用提供啟示與借鑒。
一、合適的場(chǎng)景是工業(yè)大數據落地的關(guān)鍵
當前,工業(yè)大數據在制造企業(yè)已形成加速產(chǎn)品創(chuàng )新、生產(chǎn)工藝優(yōu)化、生產(chǎn)流程優(yōu)化、質(zhì)量監測、能耗管理、設備故障預測、銷(xiāo)量預測、供應鏈優(yōu)化、智能化服務(wù)、個(gè)性化定制等典型應用場(chǎng)景,不僅幫助企業(yè)優(yōu)化了現有業(yè)務(wù),如指導產(chǎn)品設計、監控與優(yōu)化生產(chǎn)過(guò)程、推動(dòng)精準營(yíng)銷(xiāo)、優(yōu)化供應鏈管理、快速服務(wù)響應等,還促進(jìn)了企業(yè)的轉型升級,為產(chǎn)品、服務(wù)和商業(yè)模式的創(chuàng )新提供了有力支撐。

工業(yè)大數據典型應用場(chǎng)景
(來(lái)源:《工業(yè)大數據白皮書(shū)(2019版)》)
以上應用場(chǎng)景與突出價(jià)值為制造企業(yè)推動(dòng)工業(yè)大數據提供了參考,并加快了其大數據探索的決心。但是,工業(yè)大數據能否落地,不在于技術(shù)的先進(jìn)性,關(guān)鍵是企業(yè)能否找到與自身業(yè)務(wù)融合的應用場(chǎng)景。
然而,工業(yè)大數據應用具有非常強的個(gè)性化特征,不同企業(yè)基于不同的產(chǎn)品、制造工藝、數據基礎、應用需求等,便會(huì )產(chǎn)生不同的應用方式和層次;同時(shí),工業(yè)大數據的門(mén)檻較高,應用場(chǎng)景的效果產(chǎn)出需要企業(yè)具備一定的行業(yè)知識和數據應用能力與經(jīng)驗,且當前缺少統一、規范化的工具、標準和流程來(lái)支撐。因此,如何找到合適的場(chǎng)景和融合方式成為了眾多制造企業(yè)推進(jìn)工業(yè)大數據應用的首要難題。
在筆者看來(lái),企業(yè)應用工業(yè)大數據的核心目標是創(chuàng )造價(jià)值,合適的應用場(chǎng)景一定是能為企業(yè)持續帶來(lái)價(jià)值的,是擁有比較理想的投入產(chǎn)出比的。
基于此,企業(yè)在明確自身核心需求與痛點(diǎn)的基礎上,可以從以下三個(gè)方面著(zhù)手確定應用場(chǎng)景的選擇是否合適。
1、業(yè)務(wù)價(jià)值較高。
數據驅動(dòng)價(jià)值已成為企業(yè)共識,但并非所有的數據,都值得去深入開(kāi)展分析挖掘,如一些變化維度低的“死”數據,根本沒(méi)有分析價(jià)值;也不應為了一些微不足道的性能指標提升而投入大量資源去應用大數據技術(shù)。
建議可以從那些采樣頻率高、變化維度多的數據或者高價(jià)值、關(guān)鍵的設備/工序等著(zhù)手,探究業(yè)務(wù)應用場(chǎng)景,并基于已有的歷史數據資產(chǎn),來(lái)估算潛在價(jià)值高低。

比如,某重汽動(dòng)力部機加單元有100多臺機加設備,收集了大量的設備運行使用數據,并計劃通過(guò)大數據技術(shù)提高設備的運維質(zhì)效。通過(guò)初步分析,該機加設備運行故障頻次較少,但機加生產(chǎn)過(guò)程所需的刀具卻是易耗品,需頻繁更換,且刀具在加工過(guò)程中出現一定程度磨損時(shí),會(huì )影響產(chǎn)品的整體加工質(zhì)量。
針對這一突出性問(wèn)題,該工廠(chǎng)詳細評估了刀具的損耗率和因刀具問(wèn)題導致的產(chǎn)品不良率影響,有效估算了智能刀具管理場(chǎng)景應用大數據分析的潛在價(jià)值。最后,通過(guò)與產(chǎn)品技術(shù)服務(wù)商、高校研究團隊的有效協(xié)作,構建了刀具狀態(tài)在線(xiàn)監測、使用壽命評估等分析應用,提高了產(chǎn)品良率和刀具使用效率與價(jià)值。因此,具備較高的業(yè)務(wù)應用價(jià)值,是大數據技術(shù)應用的首要條件。
2、復制性強。
如果項目選定的大數據應用場(chǎng)景,只適用于單個(gè)或少數的產(chǎn)品,不具備較強的復制性或推廣空間,很可能會(huì )因為項目邊界成本高難以持續。建議企業(yè)選擇復制性強的應用場(chǎng)景和應用模式。如上例中,無(wú)論是100臺還是更多的機加設備,基于統一的技術(shù)架構和模型,采集各設備運行的數據,就能實(shí)現同樣的場(chǎng)景擴展應用,大大降低項目成本。
3、數據可支撐。
由于大數據分析應用類(lèi)項目,在早期對業(yè)務(wù)場(chǎng)景、影響因素的認識很難完備,現有數據資產(chǎn)可否支撐、實(shí)際分析結論與假設是否相符等均有待隨著(zhù)實(shí)施深化來(lái)驗證。這些不確定性需要在后面的階段,通過(guò)強化數據資產(chǎn)(如增加數據采集點(diǎn)、加大現有數據采集頻率/維度等),多次迭代數據模型,并從多個(gè)維度去論證建模思路合理性,才有可能形成相對完備的問(wèn)題理解與目標達成。
二、八步實(shí)施法助推工業(yè)大數據項目有序推進(jìn)
企業(yè)在確定了工業(yè)大數據應用主要方向的前提下,具體的實(shí)施可參考如下步驟,該步驟基于CRISP-DM(Cross-Industry Standard Process for Data Mining,跨行業(yè)數據挖掘應用標準流程)并補充了新的內涵。
1、業(yè)務(wù)理解
從業(yè)務(wù)角度理解項目目標,并將其轉化為一個(gè)可解且可達成的數據分析問(wèn)題,包括厘清關(guān)鍵因素,確定分析問(wèn)題的范圍和目標等。工業(yè)數據分析需要將專(zhuān)業(yè)領(lǐng)域的知識和數據模型有機融合,才能得到有價(jià)值的分析結果。而數據分析師通常對工業(yè)過(guò)程缺乏深入了解,業(yè)務(wù)人員則對數據分析的技術(shù)方法與思路了解不深。因此,業(yè)務(wù)理解的過(guò)程需要企業(yè)的業(yè)務(wù)專(zhuān)家和數據分析師通力合作。
2、數據理解與數據的可采集性分析
在理解業(yè)務(wù)的基礎上,準確建立數據和業(yè)務(wù)間的關(guān)聯(lián)關(guān)系,包括需要哪些數據、這些數據是從哪兒來(lái),是生產(chǎn)設備、智能產(chǎn)品、復雜裝備等產(chǎn)生的工業(yè)物聯(lián)網(wǎng)數據,還是來(lái)自ERP、MES、SCM等的信息化數據,還是設備在運行過(guò)程中所處的環(huán)境數據等?是否需要線(xiàn)上、線(xiàn)下相結合的數據等。同時(shí),確定制造企業(yè)當前的歷史數據存量和可獲取的數據增量,即在不增加采集點(diǎn)、采集頻率、采集維度等的情況下,可以采集到的數據有哪些。
這一階段需要數據分析師根據經(jīng)驗對數據顆粒度、數據質(zhì)與量和數據間的關(guān)聯(lián)關(guān)系等進(jìn)行初步判斷論證,確定當前的數據是否滿(mǎn)足業(yè)務(wù)場(chǎng)景的要求。
3、數據準備
對所需的數據進(jìn)行數據加工與治理,包括原始數據抽取、多數據源融合、數據清洗與質(zhì)量提升等。一般需要企業(yè)成立專(zhuān)項數據治理組織,通過(guò)數據集成和定期運維等方式保證業(yè)務(wù)系統和線(xiàn)下數據準確與完整,包括剔除掉那些假的、錯的、偏差大的、缺失的、不合理的、暫時(shí)性的臟數據等。數據準備與預處理環(huán)節不僅由數據分析師組成,還包括懂行業(yè)know-how的專(zhuān)家,對于一些不合理、不符合物理規律的數據,如燃氣燃煤加熱設備在極短時(shí)間內出現溫度數據的急劇變化是不合理的,數據分析師很難發(fā)現,需要結合行業(yè)專(zhuān)家的經(jīng)驗認知判斷。
4、特征提取
特征提取即借助統計學(xué)方法對數據進(jìn)行轉換、映射、分析,找到數據中的規律,并進(jìn)行特征提取,即最大限度地從原始數據中提取特征以供算法和模型使用。這一步非常重要,只有對數據特征有了清晰的認識,企業(yè)才能更好地完成拓撲數據結構的搭建,開(kāi)展數據建模。部分企業(yè)由于缺乏對數據的深入探索和理解,一有了原始數據就直接著(zhù)手構建大數據模型,結果失敗率非常高。
值得注意的是,針對一些特定領(lǐng)域問(wèn)題 ,特征提取應充分利用行業(yè)已有的專(zhuān)業(yè)知識,不要將時(shí)間過(guò)多浪費在該領(lǐng)域早已熟知的行業(yè)規律發(fā)現上。
5、小數據驗證
如果說(shuō)在實(shí)施工業(yè)大數據項目前,是通過(guò)歷史數據估算場(chǎng)景價(jià)值點(diǎn),來(lái)初步判斷應用場(chǎng)景是否合適。那么,到了具體的應用落地實(shí)施階段,則需要依賴(lài)現有的預處理數據,對業(yè)務(wù)場(chǎng)景的價(jià)值進(jìn)行更具體的計算,得出一個(gè)可量化的值,從而來(lái)驗證數據分析的價(jià)值。
6、數據建模
基于業(yè)務(wù)知識和合適的算法及建模工具,輸出數據分析模型。當前,機器學(xué)習、數據挖掘等分析理論、技術(shù)發(fā)展較成熟,也有很多明確的指導原則和豐富的算法和建模工具,可以幫助企業(yè)優(yōu)選出合適的算法模型。因此,真正的數據建模過(guò)程在項目實(shí)施過(guò)程中花費的時(shí)間并不是最多。但值得一提的是,算法不是越復雜越先進(jìn)越好,應用可解釋、較簡(jiǎn)單的算法去解決業(yè)務(wù)實(shí)際問(wèn)題更值得被關(guān)注。
7、模型的驗證和評估
模型的驗證是對分析模型從數據和技術(shù)的角度進(jìn)行充分檢驗評估,確認數據分析的結果或模型是否滿(mǎn)足具體工業(yè)應用場(chǎng)景的使用需求;任何模型都有一定的適用前提,模型的評估即是從業(yè)務(wù)的角度審視模型在什么范圍內有效,有效程度是什么,在什么情形下不適用,需要分場(chǎng)景去驗證和評估。
8、模型上線(xiàn)與迭代
模型的上線(xiàn)是將模型以便于企業(yè)使用的方式和要求重新固化,形成便于模型服務(wù)調用的形式,如可重復使用的數據挖掘程序、模型服務(wù)程序等。同時(shí),模型在運行過(guò)程中,還應對模型進(jìn)行持續的修正、迭代和完善。
如前文所述,與一般的信息化項目不同,工業(yè)大數據項目的實(shí)施是一個(gè)循環(huán)迭代、螺旋上升的過(guò)程。因此,以上8個(gè)步驟會(huì )存在多處循環(huán)和反復迭代,如在建模階段,假如現有的特征無(wú)法滿(mǎn)足模型的開(kāi)發(fā)或者存在過(guò)擬合的問(wèn)題,則需要返回到數據準備,甚至會(huì )出現業(yè)務(wù)理解的修正調整。另外,即使企業(yè)基于現有數據完成模型的上線(xiàn)后,還需進(jìn)一步評估,是否需要增加現有數據量,是增加數據的采集頻率,還是增加額外數據采集點(diǎn),進(jìn)一步迭代模型,如此反復,從而不斷優(yōu)化模型,得到更可靠的分析結果。
三、實(shí)施案例-水泥生產(chǎn)結緣大數據開(kāi)啟“智控”新時(shí)代
某水泥企業(yè)擁有兩條日采5000噸水泥的熟料生產(chǎn)線(xiàn),每條產(chǎn)線(xiàn)每年的耗電量達到約8千萬(wàn)度,耗煤約20萬(wàn)噸標煤,能耗消耗巨大。該企業(yè)希望通過(guò)大數據優(yōu)化能耗實(shí)現節能減排,降本增效。
通過(guò)初步分析,該企業(yè)水泥產(chǎn)線(xiàn)在工業(yè)場(chǎng)景中工藝機理相對標準化,主要包括“兩磨一燒”環(huán)節,但每一條生產(chǎn)線(xiàn)設備、物料、操作人員習慣不同,導致每條窯的工況都不一樣,控制參數也沒(méi)有通用標準。因此,聚焦“兩磨一燒”的工藝優(yōu)化,通過(guò)自動(dòng)化的生產(chǎn)控制來(lái)實(shí)現節能降耗,成為了該企業(yè)嘗試的解題思路。
該企業(yè)首先結合工藝專(zhuān)家的專(zhuān)業(yè)經(jīng)驗獲取了現有的400多組采樣點(diǎn)的數據,包括來(lái)源于生產(chǎn)系統、控制系統、設備管理系統、能源系統等的質(zhì)檢數據、DCS數據、熒光分析儀數據、環(huán)境數據等,并對歷史數據進(jìn)行清洗和預處理,剔除噪音數據和無(wú)效數據,補充不完整數據或缺失數據;然后,對所收集到的多維度數據進(jìn)行特征提取與數據拓撲結構搭建,并針對生料磨、水泥磨、回轉窯3個(gè)關(guān)鍵設備的“兩磨一燒”工藝,建立了生料電耗優(yōu)化控制模型、回轉窯能耗優(yōu)化控制模型、熟料質(zhì)量預測模型;待模型建立后,對生料磨及熟料燒成流程進(jìn)行工藝參數推薦,并將推薦參數放在生產(chǎn)線(xiàn)上試驗,確定模型的適用范圍,對其準確率與效果進(jìn)行驗證,包括能耗降低了多少、質(zhì)量提升了多少等,再根據反饋優(yōu)化工藝參數,迭代算法模型;待算法模型上線(xiàn)后,參數返回控制系統,自動(dòng)控制生產(chǎn)線(xiàn),避免了人為等因素帶來(lái)的能源消耗不同,達到節能減排穩定質(zhì)量的效果。
據了解,在完成第一輪的模型上線(xiàn)后,該企業(yè)在第二輪的迭代中,又增加了10多個(gè)采集點(diǎn),對算法模型進(jìn)行循環(huán)迭代,如此反復。最終,該企業(yè)實(shí)現了約3%~5%的能耗優(yōu)化。

某水泥企業(yè)實(shí)施路線(xiàn)圖
四、多措并舉讓大數據創(chuàng )造大價(jià)值
工業(yè)大數據實(shí)施路徑為企業(yè)提供了方法指引,但工業(yè)大數據項目的實(shí)施落地并不是一蹴而就,現階段仍存在著(zhù)部分項目投資大產(chǎn)出低、項目周期長(cháng)、人才缺乏、分析結果可靠性差、應用融合不深入等問(wèn)題。那么,制造企業(yè)如何才能更有效地推進(jìn)工業(yè)大數據應用、更充分挖掘數據價(jià)值呢?
1、自上而下形成完善的管理制度與體系
推進(jìn)工業(yè)大數據項目,需要企業(yè)從戰略層面高度關(guān)注和重視,從上往下形成完善的管理制度與體系。首先,工業(yè)大數據是持久性的項目,需要企業(yè)做好打持久戰的準備,且在項目前期投資回報率難以量化,短期效益不明顯的情況下,獲得高層領(lǐng)導的支持與參與就顯得非常關(guān)鍵。其次,工業(yè)大數據解決的是企業(yè)級的應用需求,涉及多部門(mén)跨業(yè)務(wù)的數據融合與工作配合,某個(gè)業(yè)務(wù)目標的實(shí)現需通過(guò)整個(gè)企業(yè)乃至供應鏈上多上相關(guān)方的大范圍協(xié)同,因此需要獲得從管理層到業(yè)務(wù)部門(mén)自上而下的支持,并應形成完善的管理制度與保障體系,以保證項目的有序推進(jìn)。
2、定義明確的項目目標,切忌貪大求全
企業(yè)在實(shí)施工業(yè)大數據之前,必須根據企業(yè)自身的需求,確定解決什么問(wèn)題,能為企業(yè)帶來(lái)哪些價(jià)值。同時(shí),在一個(gè)項目周期內應制定可衡量的實(shí)現目標。與一般的信息化項目不同,如硬件項目?jì)r(jià)值比較直觀(guān),MES、ERP等信息化項目,已有較深的積累,可以明確確定交付邊界和交付周期,工業(yè)大數據項目是一個(gè)持續迭代的過(guò)程,所以項目周期和項目的邊界有時(shí)會(huì )顯得較為模糊。但如果在一定的項目周期內,企業(yè)沒(méi)有明確的主攻方向并向業(yè)務(wù)板塊呈現價(jià)值,項目將難逃厄運。
另外,建議企業(yè)不要一開(kāi)始就貪大求全,甚至花費巨資去構建企業(yè)級大數據平臺??梢詮目傮w架構要合理、小型價(jià)值先推行的思路出發(fā),給予合理規劃與論證分析,并從啟動(dòng)小的項目開(kāi)始,選擇企業(yè)所亟待解決的問(wèn)題入手,再逐步延伸到更多的應用場(chǎng)景。將技術(shù)探索、人才儲備、應用落地等基礎打好后,再考慮打造和完善體系化的大數據應用平臺建設。
3、將重心放在業(yè)務(wù)知識認知、數據治理上
從某種角度來(lái)說(shuō),工業(yè)大數據不是技術(shù)而是業(yè)務(wù),項目的落地從工業(yè)大數據技術(shù)起步,但同時(shí)必須與企業(yè)的業(yè)務(wù)流程、工業(yè)機理等有機結合。包括通過(guò)充分利用業(yè)務(wù)知識,企業(yè)可以了解數據的來(lái)源與采集方式,判斷其是否可信,把握分析項目的主要矛盾;在數據量不夠的情況下,通過(guò)“方法降維”,從有限的數據中分析出足夠可靠的結果;以業(yè)務(wù)經(jīng)驗指導特征提取,提高算法的求解效率,提高模型的可解釋性;更全面客觀(guān)評估模型的適用范圍等。
另外,相比大數據量,工業(yè)領(lǐng)域更注重數據的完整性和高質(zhì)量。數據質(zhì)量的高低直接決定了數據模型的準確性、數據分析的可靠性。此外,數據治理不僅在數據準備階段,為保證模型的持續優(yōu)化,還需要不斷提高數據質(zhì)量,并定期對數據進(jìn)行維護。
4、與其花巨額解決數據采集的充分性數據分析不如從現有數據資產(chǎn)出發(fā)
對于制造企業(yè)來(lái)說(shuō),總期望所有的重要因子數據都能被全量采集,但這是不可能的。一方面,如果不融入領(lǐng)域認識去“消減”因子數量,通常是無(wú)法提供“足夠”的歷史數據去覆蓋所有組合情形 。另外,數據采集成本不低,并且還受制于當前的技術(shù)水平以及安全/環(huán)境等因素。因此,數據準備階段企業(yè)先盤(pán)點(diǎn)現有數據,而不是一開(kāi)始就投入大量的資金開(kāi)展數據采集,更不是在業(yè)務(wù)需求、應用場(chǎng)景尚不明確的情況下,就盲目開(kāi)展各類(lèi)數據采集與治理,不僅成本高,而且很多數據可能并不是未來(lái)數據分析應用所需要的。
5、需要行業(yè)專(zhuān)家戰略合作伙伴的多方協(xié)作
當前,工業(yè)大數據項目還沒(méi)有完全可照搬的模板,技術(shù)與應用場(chǎng)景的深度融合還處在不斷探索、試錯的階段,需要企業(yè)與來(lái)源于高校、科研院所等的行業(yè)專(zhuān)家,以及工業(yè)大數據解決方案提供商通力合作。
例如,工業(yè)大數據分析廠(chǎng)商的優(yōu)勢在算法、數據洞察力以及豐富的實(shí)踐經(jīng)驗,而行業(yè)專(zhuān)家對行業(yè)know-how有較深的理解與積累,高校擅長(cháng)理論算法與機理的深入研究,通過(guò)企業(yè)、行業(yè)專(zhuān)家和廠(chǎng)商配合組隊的模式,可以幫助企業(yè)更高效地找到合適的融合性落地方案,提高場(chǎng)景化數據建模與分析效率,得到高質(zhì)量的分析結果。
6、加強復合型人才培養
工業(yè)大數據實(shí)施落地難,人才缺乏也是很重要的原因,特別是既懂IT,又熟悉業(yè)務(wù),還具有一定數學(xué)功底的復合型人才。另外,據了解在部分大數據項目結束后,技術(shù)實(shí)施方撤離,企業(yè)由于缺乏數據的管理維護、數據模型的迭代完善能力,導致數據的質(zhì)量每況愈下,模型失去生命力,使得項目無(wú)法得到延續。因此,企業(yè)需要加強面向新一代信息技術(shù)的復合型人才培養,以承接模型上線(xiàn)后對其進(jìn)行持續優(yōu)化迭代的能力,并為產(chǎn)業(yè)級的大數據應用推廣儲備人才。
總之,大數據本身并不是目的,如何通過(guò)大數據解決企業(yè)生產(chǎn)、運營(yíng)中的問(wèn)題,為企業(yè)創(chuàng )造價(jià)值,實(shí)現提質(zhì)降本增效才是推進(jìn)工業(yè)大數據的核心目標。工業(yè)大數據的落地離不開(kāi)方法指引,也離不開(kāi)場(chǎng)景選擇、業(yè)務(wù)邏輯的深入理解,更離不開(kāi)高質(zhì)量的數據保障、大數據技術(shù)與業(yè)務(wù)流程的融合、算法模型的持續迭代和專(zhuān)業(yè)的戰略合作伙伴與人才支撐。
?- 參考文獻 -?
【1】工業(yè)大數據白皮書(shū)(2019版)
https://vip.e-works.net.cn/pdfdocumentdetail.aspx?id=753
【2】工業(yè)大數據如何落地,聽(tīng)聽(tīng)一線(xiàn)分析師怎么說(shuō)
http://www.cbdio.com/BigData/2016-01/06/content_4440425.htm
【3】工業(yè)大數據分析實(shí)踐:基于CRISP-DM方法論的再認識
https://zhuanlan.zhihu.com/p/32014381
【4】工業(yè)大數據分析技術(shù)在實(shí)踐應用中的思路與方法
https://www.sohu.com/a/430609315_100125745
【5】工業(yè)大數據項目實(shí)施落地的幾個(gè)潛在挑戰
https://zhuanlan.zhihu.com/p/46904146
【6】為什么多數大數據項目都以失敗而告終
http://www.woshipm.com/it/37218.html
本文轉自:數字化企業(yè)