日前有机会和一位德美的双料博士交流了工业大数据的应用问题,有些感想。
美德在工业大数据的理论研究、工程应用方面已有多年的探索,并形成了一批可观的成果。在国内,工业大数据的应用还刚刚启步,这其中有许多问题需要思考和应对。
对大数据的定义可谓五花八门,笔者认为:
大数据是用数字表征现实世界和描述虚拟世界的数据集合。它具有以下的特征:
在时间、空间和特征等维度上使现实世界表征的颗粒度极度细化
有可能任意描述虚拟世界
很明显,大数据是超维度的,其在时间维、空间维、特征维上的超越将改变我们对现实世界的认知和表征,并有可能从根本上改变我们的思维方法。
大数据的这些特征,在工业领域的大数据实践中,已显端倪。
在工程现场我们经常会发现许多看似无法解释的现象,这种所谓的无法解释是我们对系统理解的不到位。大数据能帮我们从全新的角度去理解系统
基于假设(包括模型)构建的数字执行系统(一级系统),也许并不能实现最优操作。在今天的工程实践中,许多时候是用人的参与在进行优化决策。如果能基于大数据和人工智能,就能形成全新模型优化控制系统(MOS:Model optimization system)(二级系统)
对虚拟世界的描述,将实现虚实对应、虚实互动,以及虚实相驱。这更有可能让我们超越时间维、空间维和组合方法,在前所未有的维度上构建、分析和评估系统
现代工业,可以说没有机会犯错误,或者说是不允许犯错误。它更是质量、成本、效率综合最优的融合体,在这一点上,大数据将大展身手。
更细的颗粒度,使我们不仅能对现有模型的精准程度有更深的了解,更有可能对质量和缺陷的趋势有更为精准的掌控,即对系统不确定性的掌控
大数据分析将促使基于知识的控制模型得以重构,这是一个面向系统不确定的优化控制模型和面向细化特征维度的全新控制和表述模型
基于大数据的分析和建模工具应用,将实现控制和表述模型的个性化
但是,大数据的分析更多地会依赖人工智能,其决策过程的内在基理从某种角度对应着风险,正是由于新的控制和表述模型会在许多时候修正甚至颠覆我们现有的知识和知识体系,因此,如何控制大数据的应用风险,特别是极致指标下的应用风险,将是目前工业大数据应用的一个软肋,因为未来工业不允许出错,这也许是企业应用中最为关心的一个问题。
大数据应用的风险来源于数据的精准与不确定性、数据的安全性、数据分析和建模方法的内在基理、特征识别和参数界定的不确定性,以及验证方法及不确定性。在这一点上,《ISO 18238 Space systems-Closed Loop Problem Solving Management(航天质量问题归零管理)》的思路也许可以借鉴。
总之,工业大数据的应用还刚刚开始,有太多的问题需要去思考。
此文是对上述相关问题的不专业和初步的研讨,以期引起相关讨论,特别是应用层面的讨论。
文章来源:点滴方圆