面向边缘智能的协同训练研究进展王睿1)✉,王岩1),尹朴1),齐建鹏1),孙叶桃1),李倩1),张易达1),张梅奎2)✉1)北京科技大学计算机与通信工程学院,北京1000832)中国人民解放军总医院,北京100039✉通信作者,王睿,E-mail:wangrui@ustb.edu.cn;张梅奎,E-mail:zmk301@126.com摘要随着万物互联时代的快速到来,海量的数据资源在边缘侧产生,使得基于云计算的传统分布式训练面临网络负载大、能耗高、隐私安全等问题.在此背景下,边缘智能应运而生.边缘智能协同训练作为关键环节,在边缘侧辅助或实现机器学习模型的分布式训练,成为边缘智能研究的一大热点.然而,边缘智能需要协调大量的边缘节点进行机器模型的训练,在边缘场景中存在诸多挑战.因此,通过充分调研现有边缘智能协同训练研究基础,从整体架构和核心模块两方面总结现有的关键技术,围绕边缘智能协同训练在设备异构、设备资源受限和网络环境不稳定等边缘场景下进行训练的挑战及解决方案;从边缘智能协同训练的整体架构和核心模块两大方面进行介绍与总结,关注边缘设备之间的交互框架和大量边缘设备协同训练神经网络模型参数更新问题.最后分析和总结了边缘协同训练存在的诸多挑战和未来展望.关键词云计算;边缘智能;协同训练;边缘计算;机器学习;分布式训练分类号TP311Surveyofedge–edgecollaborativetrainingforedgeintelligenceWANGRui1)✉,WANGYan1),YINPu1),QIJian-peng1),SUNYe-tao1),LIQian1),ZHANGYi-da1),ZHANGMei-kui2)✉1)SchoolofComputerandCommunicationEngineering,UniversityofScienceandTechnologyBeijing,Beijing100083,China2)ChinesePLAGeneralHospital,Beijing100039,China✉Correspondingauthor,WANGRui,E-mail:wangrui@ustb.edu.cn;ZHANGMei-kui,E-mail:zmk301@126.comABSTRACTWiththerapidarrivaloftheInternetofEverythingera,massivedataresourcesaregeneratedonedgesides,causingproblemssuchaslargenetworkload,highenergyconsumption,andprivacysecurityintraditionaldistributedtrainingbasedoncloudcomputing.Edgecomputingsinkscomputingpowerresourcestotheedgeside,formingacollaborativecomputingsystemthatintegrates“cloud,edge,andend,”whichcanmeetthebasicneedsofreal-timeoperations,intelligence,security,andprivacyprotection.Withthehelpofedgecomputingcapabilities,edgeintelligenceeffectivelypromotestheintelligentdevel...