·研究与分析·电器与能效管理技术(2023No.3)卢恒光(1969—),男,高级工程师,主要从事电力安全生产工作。林碧琳(1997—),女,硕士研究生,研究方向为基于强化学习的暂态稳定切机控制。温步瀛(1967—),男,教授,博士,研究方向为电力系统优化运行和风电并网技术。*基金项目:福建省自然科学基金项目(2022J01113)基于深度强化学习的切机控制策略研究*卢恒光1,林碧琳2,温步瀛2(1.福建华电万安能源有限公司,福建龙岩364000;2.福州大学电气工程与自动化学院,福建福州350116)摘要:电力系统受到大扰动后会进入紧急运行状态,必须及时采取紧急控制措施使系统恢复稳定运行。切机控制是维护系统稳定最有效且最常用的控制措施。针对传统基于策略表的控制方法在实际应用中存在故障不匹配的问题,提出了一种基于深度强化学习的电力系统暂态稳定切机控制决策方法。首先,引入深度确定性策略梯度(DDPG)算法,结合等面积定则,对算法各要素重新设计。其次,建立基于DDPG算法的切机控制决策模型。最后,利用PSA-BPA软件和Pycharm软件搭建单机-无穷大系统和IEEE39节点系统切机控制仿真模型,通过算例验证了所提方法的有效性。关键词:暂态稳定;切机控制;深度强化学习;深度确定性策略梯度中图分类号:TM712文献标志码:A文章编号:2095-8188(2023)03-0011-05DOI:10.16628/j.cnki.2095-8188.2023.03.002ResearchonGeneratorTrippingControlStrategyBasedonDeepReinforcementLearningLUHengguang1,LINBilin2,WENBuying2(1.FujianHuadianWan’anEnergyCo.,Ltd.,Longyan364000,China;2.SchoolofElectricalEngineeringandAutomation,FuzhouUniversity,Fuzhou350116,China)Abstract:Thepowersystemwillenteranemergencystateafterbeinggreatlydisturbed.Theemergencycontrolmeasuresmustbetakenintimetorestorethesystemtostableoperation.Generatortrippingcontrolisthemosteffectiveandcommoncontrolmeasuretomaintainsystemstability.Aimingattheproblemoffaultmismatchinpracticalapplicationofthetraditionalcontrolmethodbasedoncuretable,adecisionmethodofpowersystemtransientstabilitygeneratortrippingcontrolbasedondeepreinforcementlearningisproposed.Firstly,thedeepdeterministicpolicygradient(DDPG)algorithmisintroduced.Everyelementofthealgorithmisredesignedincombinationwiththeequalareacriterion.Secondly,...