探索数字孪生中的机器学习管道:Function+Data Flow框架的革命性应用
摘要
本文介绍了一种名为Function+Data Flow (FDF)的领域特定语言(DSL),旨在简化数字孪生(DT)中机器学习(ML)管道的描述和验证。数字孪生技术在物理系统的开发中越来越依赖于人工智能,特别是在数据源的整合和计算效率高的降维模型创建方面。尽管数字孪生在不同应用领域中采用了类似的技术,如模型阶数减少和混合数据模型化,但当前的开发实践往往是临时的,使得设计AI管道变得复杂且耗时。FDF通过将函数视为一等公民,使得学习到的模型能够被有效操作,从而简化了数字孪生的设计和验证过程。本文通过两个不同领域的具体案例——结构塑性应变预测和电磁轴承行为建模——展示了FDF的优势。
原理
FDF的核心创新在于将函数作为数据流的一部分,这使得在ML管道中可以灵活地操作和重用这些函数。FDF通过扩展传统的数据流,引入了函数流的概念,允许用户在学习函数(如如何将数据投影到PCA降维基)和使用函数(实际将数据投影到降维基)之间进行解耦。此外,FDF允许模型被显式操作,从而可以根据需要使用和重用这些模型。自动类型推断功能进一步增强了FDF的实用性,它允许在管道中自动推断和跟踪每个函数的数据类型,从而提供隐式类型检查,帮助用户避免潜在的不兼容性和错误。
流程
FDF的工作流程通过定义一系列的“盒子”来表示不同的处理步骤,每个盒子有多个输入和输出端口。这些盒子包括处理器、编码器和训练器,分别用于数据处理、学习降维基和监督学习。每个盒子通过不同的多边形形状在视觉上进行区分。FDF管道通过有向无环图(DAG)来定义执行顺序,确保每个盒子在其所有直接前驱盒子执行完毕后才能执行。这种设计使得FDF能够直观地描述数据流,同时保持灵活性和可定制性。
应用
FDF的提出为数字孪生中的ML管道设计提供了一个灵活且强大的工具,适用于各种复杂的物理系统,如智能电网、智能制造和航空领域。通过简化ML管道的设计和验证过程,FDF有望加速数字孪生技术在工业界的应用,特别是在需要高度定制化和实时更新的场景中。未来,FDF还可以扩展以支持控制应用和在线学习,进一步增强其在数字孪生领域的应用潜力。
