文/王建民
王建民 清华大学软件学院 教授 博士生导师
清华大学软件学院党委书记副院长智能制造时代的到来,也意味着工业大数据时代的到来。制造业向智能化转型的过程中,将催生工业大数据的广泛应用。工业大数据无疑将成为未来提升制造业生产力、竞争力、创新能力的关键要素,也是目前全球工业转型必须面对的重要课题。
2012年,通用电气公司(GE)首次明确了“工业大数据”的概念,该概念主要关注工业装备在使用过程中产生的海量机器数据。同年,麦肯锡的报告中给出的一个事实也颇为有趣,那就是在虚拟经济占主导地位的美国,其工业界蕴含的数据总量反而是最大的。
文中指出,制造业存储了比任何其他一种行业都多的海量数据——仅2010年,制造业就存储了将近2EB的新数据。工业已经进入“大数据”时代,而他们所控制的数据的体量、多样性和复杂程度,也正以前所未有的速度不断激烈地爆发式发展。
其实,工业大数据就是在工业领域相关信息化应用中所产生的海量数据。需要格外注意的是,工业大数据的“相关应用”不仅应包括生产企业内部和产业链,还应包括客户、用户,以及互联网上产生的相关数据。
同时,通用电气公司的报告在阐述工业大数据的概念之外,还揭示了工业大数据所蕴含的巨大价值。
那么,基于何种背景下,人们提出了“工业大数据”呢?第一,数字化装备和产品已经普及;第二,装备和产品网络化连接(互联网+)的不断成熟;第三,工业企业正逐步开始向服务型制造转型;第四,“从摇篮到摇篮”制造的必然要求。毫无疑问,无论是中国的《中国制造2025》,还是德国的“工业4.O”,抑或是美国的“先进制造伙伴计划(AMP)”都顺应了工业大数据的发展潮流。三流汇聚而成的工业大数据
工业大数据从何而来?它来源于产品生命周期的各个环节,包括市场、设计、制造、服务、再利用等各个环节,每个环节都会产生大数据。而“全”生命周期的数据汇合起来则更加庞大。当然,企业外、产业链外的“跨界”数据也是工业大数据“不可忽视”的重要来源。因此,企业数据、机器数据和互联网数据这三条数据流汇聚成了工业大数据。
一般来说,产品全生命周期包括三个阶段:开发制造阶段(Beginning of Life,BOL)、使用维护阶段(Middle of Life,MOL)、回收利用阶段(即End of Life,EOL)。BOL和MOL的分离点是产品交付用户的时刻,MOL和EOL的分离点是产品退役的时刻。
那么,工业大数据与传统企业数据之间又有什么关联呢?传统企业信息化的“四大件”,广义产品生命周期管理(Product LifecycleManagement,PLM) 系统(包括CAX[2])主要支持产品开发,企业资源计划系统(Enterprise Resource Plan血g, ERP)负责“人财物、产供销”,供应链管理系统( Supplychain management,SCM)协调供应链,客户关系管理系统(Customer RelationshipManagement,CRM)关照企业客户和用户。过去我们主要关注开发制造阶段(BOL)的信息化,而CRM(包括MR0[3])往往得不到重视,再制造过程更是受到冷落。
传统企业信息化系统一般架构在关系数据库系统之上,也称为SQL数据,这“20%”的部分的价值密度是很高的。别小看这占比仅有20%的SQL小数据,只有它才能引爆那剩余的“80%”,它是工业大数据价值的基础。
工业大数据和业务流程又呈现怎样的关系呢?传统企业信息化项目一般是从梳理业务流程起步的,流程是“主动”的、而数据是“被动”的。在工业大数据环境下,要求企业快速满足个性化的用户需求。企业僵化的“长流程”,难以适应“实时决策”的要求。需要变“流程驱动”为“数据驱动”,或者至少是“混合驱动”,将“流程”与“数据”进行深度融合。上述表现,就是我们所说的“流程碎片化”、 “基于数据的决策”。而此时,数据便成为了连接这些“碎片”的媒介。
工业大数据有没有“交钥匙”工程?新世纪以来,我国工业界经历了轰轰烈烈的信息化浪潮。业界有这样一句口头禅,“不搞信息化等于坐以待毙,搞了信息化也是存亡未卜”。后半句话说明,企业推行“信息化”是有难度和风险的,所以“交钥匙”工程成为广大企业所期望的方式。
但坦白来讲,工业大数据不存在“交钥匙”工程(至少目前是无法实现的),原因有三:
第一,工业大数据项目主要针对的对象不是“既有业务”,而是“未来业务”、“创新业务”,其特点便在于创新性、不确定性;
第二,工业大数据目前尚处于“科学”阶段,人们对数据价值的“提取”方法、技术与工具尚不成熟,特别是以物理规律发现为目标的工业大数据处理更是刚刚起步;
第三,人们普遍认同的“领域专家”、“统计专家”和“软件专家”组成了协同团队,他们构成了当前“大数据”深度应用的核心。
当然,这三个原因不说明工业大数据项目就没有任何共性抓手。比如“端+云”的低成本海量时空数据存储处理平台、基于大数据的装备寿命预测与可靠性分析平台、互联网数据与企业数据集成平台等等,他们都是工业大数据的共性软件工具。
实践出真知
众所周知,产品全生命周期的各个阶段都会产生大数据。设计阶段引入用户社区数据,制造阶段使用机床在线感知与测量数据,在市场营销阶段使用社交网络数据……
上世纪90年代,罗尔斯·罗伊斯公司(Rolls-Royce)率先在发动机上嵌入传感器,监控其运行状态,开创了以销售飞行小时为标志性业务的服务型制造新模式。这些传感器采集的机器数据便可对应GE和麦肯锡报告中所说的工业大数据的主体。
那么,装备生命中期阶段(MOL)机器数据又该如何应用呢?
“十二五”期间,清华大学与国内某装备龙头企业三一重工合作,共同研制装备工况大数据平台。随着应用的深入,系统需要将工况数据的处理分析结果向企业服务(MRO)、制造(ERP)甚至设计(PLM)系统进行反馈,因此需要将这些系统与工业大数据系统进行集成。
如果说互联网业务往往是全新的,工业大数据则需要与遗留的系统进行集成,甚至替换“旧”的系统,这是工业大数据项目区别于互联网大数据项目的重要内容,在实践中我们形成了“四阶段”的切换方案。
一个例子是装备时空监管。企业在得到工况数据以后,首先是对装备运营进行监管。不同于传统的运营监管,在大数据技术支持下,运营是成套设备互相协同的运营。以搅拌站为例,通过收集位置数据、油位数据可以对搅拌车运输的过程进行优化调度,从而避免拥堵、减少等待、降低能耗。
以杭深高铁沿线装备的故障分析为例。液压系统是工程机械的核心系统之一,导致其发生故障的原因很多,比如密封套腐蚀、内壁刮花、密封环损坏、阀块受损等等。但有了机器大数据,情况就不一样了,我们可以寻找发生故障的深层次原因。
我们通过大规模比对开工指标,从典型取值、波动幅度、回传密度多个维度进行分析,自动筛选与故障车辆关系密切的特征工况,发现这些故障车辆的每分钟换向次数在变化幅度上高度相关。
再通过引入互联网上的行政区划数据和历年高铁建设数据(企业外部数据),可以得出这样一个结论,这些典型故障均发生在2012-2013年期间在建重大工程“杭深高铁”沿线,这为我们寻找更深层次的原因提供了重要线索。
还有一个例子是备件预测。通过大规模工况数据透视宏观装备应用情况,我们根据这些信息进行易损配件需求的预测,优化调配相关服务资源。装备开工情况也同样可以反映出各地区宏观经济情况。
工业大数据在路上
由互联网数据、机器数据和企业数据汇聚而成的工业大数据,蕴藏着巨大价值。例如,通过分析用户使用数据改进产品、通过分析现场测量数据提高加工水平、通过工况数据进行产品健康管理等。工业大数据的应用,将成为未来提升制造业生产力、竞争力、创新能力的关键要素,也是目前全球工业转型必须面对的重要课题。
工业大数据刚刚起步,我们需要冷静思考,坚持应用驱动,最终实现中国制造强国之梦。