实验技术与管理第40卷第4期2023年4月ExperimentalTechnologyandManagementVol.40No.4Apr.2023收稿日期:2022-09-15作者简介:陈春燕(1982—),女,江西高安,硕士,高级工程师,主要研究方向为飞行器电气总体设计,20843198@qq.com。引文格式:陈春燕,王红春,王小辉.基于强化学习的TTE网络调度规划方法设计与实现[J].实验技术与管理,2023,40(4):52-61.Citethisarticle:CHENCY,WANGHC,WANGXH.Designandimplementationofreinforcementlearning-basedschedulingpanningmethodforTTEnetwork[J].ExperimentalTechnologyandManagement,2023,40(4):52-61.(inChinese)ISSN1002-4956CN11-2034/TDOI:10.16791/j.cnki.sjg.2023.04.007基于强化学习的TTE网络调度规划方法设计与实现陈春燕1,王红春2,王小辉1(1.中国运载火箭技术研究院研究发展部,北京100076;2.西安云维智联科技有限公司,陕西西安710025)摘要:为了给时间触发以太网中的事件触发类消息合理地提供时隙、获得更均衡的消息调度时刻,该文提出了基于Q学习的调度规划算法,将消息调度在时间轴上的求解转化为在三维空间上的多宝箱探索问题,实现基于强化学习的网络调度规划算法求解调度时刻表。针对提出的算法进行了仿真实验,并对实验结果进行分析验证,与传统的基于可满足性模理论(SMT)的调度规划算法相比,基于Q学习的调度算法对TTE网络负载均衡性的优化显著超越SMT算法,能更合理地分配网络资源。关键词:时间触发以太网;强化学习;调度规划中图分类号:TP393文献标识码:A文章编号:1002-4956(2023)04-0052-10Designandimplementationofreinforcementlearning-basedschedulingpanningmethodforTTEnetworkCHENChunyan1,WANGHongchun2,WANGXiaohui1(1.R&DDepartment,ChinaAcademyofLaunchVehicleTechnology,Beijing100076,China;2.Xi’anYunweiZhilianTechnologyCo.,Ltd.,Xi’an710025,China)Abstract:Inordertoprovidereasonabletimeslotsforevent-triggeredmessagesintime-triggeredEthernetandobtainmorebalancedmessageschedulingmoments,thispaperproposesaQ-learning-basedschedulingplanningalgorithm,whichtransformsthesolutionofmessageschedulingonthetimeaxisintoamulti-bucketexplorationproblemonthethree-dimensionalspace,andimplementsareinforcementlearning-basednetworkschedulingplanningalgorithmtosolvetheschedulingschedule.Simulationexperimentsareconductedf...