6G边缘智能:低延迟协作微调基础模型的资源管理创新
摘要
本文探讨了在网络边缘部署大规模基础模型(FoMo)进行低延迟协作微调的资源管理问题。随着人工智能(AI)技术的发展,特别是像ChatGPT这样的生成式AI对话模型,基础模型在移动网络中的应用越来越广泛。为了克服单个设备的内存和计算限制,本文提出了一种多设备协作的微调范式(DEFT),其中边缘设备协同优化基础模型中的不同部分,边缘服务器负责协调和梯度聚合。文章详细介绍了深度感知块分配问题,并提出了一种低复杂度的算法CRUNCH来解决最优块-设备匹配问题,以及联合带宽和块分配(JBBA)问题的解决方案。实验结果表明,通过这种低延迟的DEFT(LoLa-DEFT)框架,可以在GLUE基准上显著减少微调RoBERTa模型的延迟。
Read more...








