"基础模型工程：引领AI软件开发的新纪元"

Posted on 2024-07-11 in CS.AI • 14 words • 1 minute read

Last updated on 2024-07-12

摘要

本文由Dezhi Ran等人撰写，探讨了基础模型（Foundation Models, FMs）作为新型软件的工程化问题。随着FMs的复杂性不断增加，作者提出了“基础模型工程”（Foundation Model Engineering, FME）的概念，旨在通过引入声明性、自动化和统一的编程接口来简化数据和模型管理，从而应对即将到来的FM危机。文章强调了FME在数据管理、模型管理以及声明性编程接口方面的重要性，并探讨了其在软件工程领域的研究机会和应用前景。

原理

基础模型工程（FME）的核心在于将数据和模型视为源代码，通过声明性、自动化和统一的编程接口来管理这些复杂的FMs。FME通过引入弱监督的数据管理策略，利用有限的标记数据和大量未标记数据，通过算法推断标签并提高数据质量，从而有效减少数据准备的时间和资源需求。在模型管理方面，FME采用工作流和持续集成的方法，自动化模型开发、训练、评估和部署过程，同时利用类似Git的分布式版本控制系统来跟踪和管理模型的更新。此外，FME还通过声明性规范的编程接口，简化FM的开发过程，使开发者能够以高层次语言指定目标，而无需深入了解实现细节。

流程

FME的工作流程包括数据管理和模型管理两个主要部分。在数据管理中，开发者通过声明性接口指定数据标记和清洗功能，FME则选择合适的模型（如代码生成模型或SQL生成模型）来解析和理解这些规范，并大规模执行数据标记或清洗。在模型管理中，FME通过自动化选择和微调模型，智能地从可用数据池中选择微调数据，并执行微调，最终合并冗余模型并解决合并冲突。例如，FME可以自动选择适合交互式GUI故障检测的FM，并使用LORA进行增量微调。

应用

FME的应用前景广泛，涵盖了从数据清洗、模型微调到模型部署的多个环节。通过提供一个强大、自动化和可扩展的框架，FME不仅简化了FM的开发和应用，还加速了创新步伐，促进了智能应用的发展。FME的引入有望在多个行业中推动更高效、更可靠的AI应用开发，特别是在需要大规模数据处理和复杂模型管理的场景中。