登录

工业AI有哪些障碍需要突破?

2020-04-10 09:38 来源:说东道西 宋华振

感慨于AI的声势浩大,千军万马进工业,希望复制其巨大的商业积累,然而,工业AI与商业仍然大的不同,缺乏对工业的了解,会遇到很多坑,工业AI往往是在有具体的物理对象的机器或系统上运行,这与很多纯软件形式的语音、图像类的识别的商业AI还是有比较大的差别,物理对象是否能够如你所愿的执行或反馈,那本来就依赖于其自身的机理模型,包括一些不确定的、干扰因素会导致的潜在问题,都是工业AI无法像商业AI那样对待的原因。由于工业AI场景中物理对象的存在使得其本身在数据采集、特征提取、模型训练、部署等方面存在着较大的困难,因此,必须冷静的看待AI在工业的发展,才能厘清问题,让我们避开那些坑,并且知道该如何看待AI的工业发展,不仅是技术,在企业认知、人才培养等多个方面都需要予以考虑,才能系统的发展工业AI的应用。

1.工业AI与商业AI的差异

工业数据与商业数据仍然是有较大的差别,这主要体现在以下几个方面:

 

比较项

商业数据

工业数据

数据特点

追求数据量大

追求对问题的还原性

质量需求

用于较为模糊的计算,质量要求不高

数据要求极高,需清洗

用途

关联性分析

寻求模型基础上的关联性

结果

准确性要求低

高容错率

数据类型

非实时数据

实时数据

可解释性

低可解释性

高可解释性

数据源

声音、视频、文本、图像图片

电流、电压、振动、能源…

安全性

信息安全(Security)需求

信息安全+功能安全性(Safety)

可靠性

高可靠性

准确性

高精度需求:控制精度要求

鲁棒性

高鲁棒性需求:

综上所述,工业AI与商业AI相比,还是有很多难度的,但是,而驱动工业AI发展的因素也在于AI芯片、软件方面的成本下降,工业AI本身是有需求的,只是受制于工业领域的市场容量,在商业的芯片与软件不能降低到合理的成本时,工业AI就无法真正崛起,发挥其价值。

可解释性在于用户对于“机器”进行决策背后的原因需要建立“信任”,而很多AI算法却是一种“黑盒”机制,使得其不具有透明性,这使得很难被接受,因为“风险”仍然是存在的,如果商业AI需要90%准确性,那么工业需要的99.99%的准确,而这个潜在的“不可解释”使得模型的信任度降低。

安全性:如果用户要求供应商一起承担因为技术所需承担的潜在安全风险—这无论对工业还是商业来说都是一个风险,因为,你可能是赚的面粉的钱,操着白粉的心,这你也不敢接受吧?但是,客户不管这么多,你说你的系统很好,但是,如果出现了安全事故—那我是不是要找你呢?或者,你愿意承担这个风险,我才能接受这个产品。

2.模型驱动与数据驱动的优缺点

数据驱动与模型驱动的优缺点分析,传统的工业生产通常是基于物理或化学的已有机理建模,并经过上百年大量生产的测试验证,那么具有一定的成熟性,但是,由于考虑更多是经济性,因此做了非常多的线性化、安全值设定,使得其仍然有挖掘的潜力空间,另一方面,由于模型驱动往往需要非常专业的人经过大量的时间进行积累,这个过程本身的成本也是非常高的,只是在很多年中进行了分布,似乎成本很低,而数据驱动的方式,在于发现新的模型—那些在传统的机理方法中无法进行挖掘的模型,数据驱动的对于数据是饥渴的,而这不依赖于人的经验和大量的积累,就像通过数据进行预测性维护,可以在短时间积累大量的数据,并挖掘出导致质量问题的相关性分析,而这在过去可能需要数年、数十年的积累。

比较项

模型驱动

数据驱动

复杂性

复杂-机电软一体化融合

依靠数据学习

数据需求

小数据验证接近于大数据分析

大数据

领域知识需求

成本

经验

 

比较有效的方法当然是数据与模型驱动相互结合,在模型基础上构建学习的过程,进而来优化模型,而相辅相成,才能各自发挥其优势,机理模型的人不愿意尝试数据驱动的模型,而认为学习的人不懂工艺。

3.工业AI场景

3.1流程工业与离散工业的不同

工业按照生产的连续性、控制对象大致分为流程与离散制造业,离散制造业主要以机器与产线的控制为主,例如食品饮料、塑料、电子、造船等工业,而流程工业从产业来说更倾向于连续型的过程生产,如石化、制药、冶金等。

 

机器控制

流程控制

加工任务

物理

化学反应

参数

速度、扭矩、位置

温度、压力、液位、流量

循环周期

μS/mS

10mS/100mS

控制系统

嵌入式系统

DCS/SCADA

安全性

IEC61508

IEC61511/IEC61513

高可用性

冗余需求较少

双机热备/网络冗余

生产连续性

离散制造

连续生产

 

就AI的应用来说,流程工业由于是连续生产,本身具有“自动”的需求,优化的效果很显著,因为1%的能耗降低都是有效的,但是,流程工业本身的空间也是很难挖掘的—请你相信我,流程工业在上百年的时间里,已经用了各种方法在挖掘它的潜力—传统的机理模型方式已经干了超出AI所能想象的工作,离散制造业相对比较分散,现在却像着“连线”生产的模式进发,传统所谓的机器已经由机器人、输送系统进行了“连接”,使得其具有了不停机生产的能力。

3.2工业AI场景

无论是流程工业还是离散制造,针对流程的各个部分,其实都是有通过AI方式来进行的优化与改善:我们不以具体的技术或场景,而以宏观的场景来看待整个工业AI的空间—这也是传统机理的空间:

(1)数字化设计环节

通过数据的闭环迭代,来反映生产中的质量、成本的不断约束下的降低,这也是AI算法可以干的事情。

为个性化生产带来数据的支撑能力,无论是早期验证还是数字孪生对于工艺的智能挖掘,形成新的制程工艺决策支持,这些都是代替了“人的经验”和隐性知识的功能,否则,人们仍然不能带来质量的稳定性、良品率的上升。

第一次就做对,是精益生产里的理想状态,对于工艺来说,开机浪费不可避免,如何让机器最快的进入稳定的质量工艺状态,也是一个可以通过大量的学习来获取的,经过累积,形成一个稳定的工艺模型,就是一种很好的应用。

生产数据对于设计端的反馈,无论对于流程还是离散制造业来说,现场数据对于设计端的反馈是一个非常重要的提升办法—这些决策支持具有很大的商业价值。

(2)数字化运营环节

--数据驱动的优化:质量优化、参数寻优、作业调度,这些都是可以为AI所发挥力量的场景,在质量优化方面自然有极大的空间,无论是通过视觉的缺陷检测来寻找质量改善的空间,还是通过视觉导引为机器人、AGV等提供快速的定位与指引,都是AI可以发挥空间的地方。降低能耗,提高原料使用效率,优化生产工艺中的参数匹配,自适应能力;

--参数优化,包括了在静态和动态系统建模以便应对环境的不确定性,实现更为有效的控制工艺,在线过程控制和优化。

--因果关系和相关性(例如质量缺陷),在缺陷检测中,可以实现对质量相关性分析来对影响质量的关键因素进行“发现”并对其进行有效的调节、控制,或者根据模型实施更为节省成本的控制策略。

 

 

--工艺参数匹配:制造业无论是流程还是离散,其本质都是对材料进行各种化学与物理的反应,这个难点在于各种材料所具有的物理化学特性,这些在生产产品中与工艺流程、控制参数会形成无数种组合,传统上建模本身也是一个难题,但是,即使有模型也需要大量的验证,而这种验证基于物理方法的显然不如通过数据的方法积累,分析,提供工艺人员以决策支持。

--决策支持:信息可用性的提高带来了决策的支持能力,并且,在更多的AI场景中,我们可以看到工厂的资源如机器、设备、材料都有了节省的空间。

(3).数字化维护

对于工厂的设备来说,通过数据驱动可以形成大量的应用积累,使得对于产线的未来状态进行早期状态预测,能够维护较高的生产可用性(OEE指标提升)。

 

传统的预测性维护往往基于机理模型,对于重值设备如飞机、大型空压机组、鼓风机、风力发电机组等具有很高的必要性,因为这个投入是合算的,但是,对于生产线上的轻值设备,但是,个性化生产时代机器与产线的健康状态又会对生产品质、交付能力造成较大的影响,这个时候就必须寻找更为经济的运营维护方式,针对复杂多变的生产场景寻找更为经济的数据驱动解决方案,代替传统的基于专家多年积累的方法。

4.工业AI目前需要突破的障碍

尽管我们描述了AI在工业的众多场景和可能性,但是,要达到产业应用,我们还必须对它有更为清晰的认识,知道困难在哪里,知道它的潜在风险和它自身发展的规律,才能更好的应用,以下几个方面是未来工业AI需要突破的障碍。

4.1数据本身的难题需要跨越

(1).数据采集就是需要突破的Know-How:

鉴于AI方法通常都是基于大规模数据并且这些数据必须具有高的可靠性,因此数据的产生,数据鲁棒性、数据质量和数据访问,对于流程工业来说需要较大的改善,而另一方面,对于工业来说,从大数据到智能数据方法,这必须将大数据的方法与模型驱动方法结合。

 

就像振动信号的采集,就是在复杂的小信号中捡取有用的信号,而且需要经过一些快速傅里叶变换,包络曲线的分析才能检出有用信号。

数据源带来的信号干扰,包括信号检出方式本身就包含了很多工业Know-How在里面,很多智能传感器其实就是依赖于对信号的处理方式为核心竞争力,如果纯粹原始的信号拿来,就相当于给了你一把面粉和白石灰混合在一起的数据。

(2).你不要以为你有机会迭代:

商业是大数据,而工业是小数据,有很多故障数据只有在故障发生的时候才能有,而这个故障的发生—就意味着设备质量的问题—而这个不被接受,就是在工业里有一个问题,商业AI说我们可以设定一个期望然后来迭代,但是,工业的用户说“如果你达不到这个精度,请不要来测试”—这个可能是两个很大的差别,商业客户可以接受迭代的过程,比如识别图片的能力、语音识别的能力不断迭代提升,但是,工业的问题就是你如果出现了判断错误—那么,这个炉子里的材料就废了,在很多场景里,可能你连测试的几乎都不会有。

就像图中所示,在商业AI里你就识别一个狗和拖把的区别,在工业里你可是要识别一个产品是否合格,这两件事情是完全不同的两件事情。

(3).在数据工程基础工作方面:工业数据在网络连接、数据模型、数据安全方面尚需更多的工作。

就目前而言,在工业数据的获取方面,包括网络连接的统一规范、信息模型、数据安全方面尚未有统一规范,OPC UA一直致力于这一工作,然而,目前OPC UA本身的市场完成度也并不高,在国内也仅有少数的企业开发了OPC UA,如果不开发基于OPC UA的规范,那么,各个公司形成的规范仍然会成为障碍,因为大家肯定没法具有统一性,导致需要大量的接口与转换工作。

(4).数据源喂入到AI的质量仍然不够高,更多的数字化和数据集成仍需努力。

工业AI与商业AI还有就是在数据的需求“价值”方面,对于工业AI来说,如果获得的数据到信息过程出现不可用、不完备的情况,也即,这些数据模型无法精确的描述一个物理或化学过程,那么,这个数据就是无法真正使用或发挥价值的,不是单一的数据而是数据集,必须具有一定的完备性。

4.2在工业AI应用实现过程中的难题

(1).缺乏数据处理的流程,从源头获取数据的质量问题、数据验证、特征提取整个过程而言,目前AI尚未有比较好的自动化方法建立。仍然需要人工对数据进行特征提取、降维、标定等工作。即使现有的AI软件已经非常容易使用,但是,对于工业场景而言,仍然有很多不适用的情况。

(2).语义互操作问题:由于数据来源于不同的设备,那么就需要统一的语义互操作规范支持。不仅包括了M2M的数据,还包括了OT与IT系统的接口问题,这些都是目前尚未能够很好解决的问题,对于传统的模型驱动控制而言,都尚未有完整的解决方案,因此,AI的应用就更需时日。

在工业里OPC UA即扮演这样一个角色,提供结构性的数据,为数据在地址空间的存储提供了统一的结构、类型、属性等标准,并支持各种通信模式,以及提供了行业信息模型的集成。

(3).数据安全性问题:在整个数据的采集、传递、处理、运行、部署过程中,数据的安全性(Security),以及对生产运营的安全性(Safety)都是工业企业必须予以考量的要素。

4.3就企业本身对于AI的障碍

对于AI企业和用户而言,尚有一些障碍

(1).用户过高的期望,以及不可计量的AI期望值

对于用户而言,AI是个好东西,但是,客户需要先验性的收益分析—就是“不见兔子不撒鹰”的投资方式,收益不明确、缺乏有说服力的案例、业务模式的匹配、对AI的局限性缺乏了解,较难以说服用户。 

(2).即或AI,也需要AI的运行机制和体系支撑

AI并非像买一个轴承,即使是轴承也需要维护人员专业的知识,而AI同样如此,总不能就像买个东西装上即可使用,而在应用中如何调整、迭代本身也需要用户自身来完成,否则,花费一笔钱就得到供应商无限的服务支持,或者如果需要支持服务费用,这也是一笔不小的长期开销,必须予以考虑。

因此,对于AI而言,必须要有清晰的认识,要有长期的规划和人才培养计划与之匹配,否则,可能就是一个项目,为了获得一些所谓的资金支持,拿到一些补贴,但是,相对于企业所投入来说,往往也是得不偿失。

(3).企业文化对于AI应用的支持:在一些企业中存在着对AI的抵触,因为,他们会认为AI会代替他们的工作,就像在高速公路休息站地方的自动售货机总是会无缘无故的故障一样,因为自动售货机里2.5一瓶的矿泉水和商店里5块一瓶的水相比,他们更希望机器有故障。

AI的应用本身也是一种创新,需要跨学科融合的团队合作,一是创新文化,二是团队合作的文化,如果大家藏着掖着,那么这个计划就无法实现,因为,AI需要工艺人员将隐藏在其大脑中的知识拿出来分享,并形成不依赖于人的模型与算法,这本身就是有难度,而且在整个项目中的贡献如果无法良好评价,就会产生对抗与抵触情绪。

4.4法律伦理与商业上的问题

除了4.1-3所述的问题,在商业上,目前对于工业AI还缺乏“标准化”的应用,以解决可复用的问题,而这是商业AI与工业人必须共同解决的问题。AI在项目质量上、标准化方面还需要借助于软件工程来实现更好的复用性,包括在上行和下行的互操作方面—因为采集和部署都是要跨平台来实施的。

数据的归属权也是要考虑的问题,就像你来自End User的数据,那么这个数据用来训练了模型,那么这个数据的所有权、模型的所有权就是问题,或者利益的划分问题如何解决,是否有法律保障?

工业领域还有非常多的安全、审计追踪等特殊的行业需求,这些都是工业AI应用时所需考虑的,而这些在商业AI中可能不会出现。 

相关新闻

编辑精选