反映实时供需互动的Stackelberg博弈模型及其强化学习求解

作者:包涛; 张孝顺; 余涛; 刘希喆; 王德志

摘要:为充分挖掘供给侧发电机和需求侧柔性负荷的联合优化调度空间,实现分布式自律计算与集中协调的互动框架,满足供需互动快速决策的需求,最大化系统的整体效益,搭建了基于stackelberg博弈的电力系统实时供需互动模型,并提出了一种全新的深度迁移强化学习(deep transfer reinforcement leaming,DTRL)算法。该算法通过对历史优化任务的有效信息进行知识存储,利用深度学习实现高精度的非线性迁移学习,并借助分布式计算优势,可快速获得高质量的最优解。算例仿真表明:DTRL在保证最优解质量的同时,其求解速度可达其他6种对比算法的419倍以上,适合求解大规模电力系统的供需互动快速决策问题。

分类:
  • 期刊
  • >
  • 自然科学与工程技术
  • >
  • 工程科技II
  • >
  • 电力工业
收录:
  • 北大期刊(中国人文社会科学期刊)
  • CSCD 中国科学引文数据库来源期刊(含扩展版)
  • 维普收录(中)
  • 万方收录(中)
  • EI 工程索引(美)
  • 国家图书馆馆藏
  • 上海图书馆馆藏
  • 知网收录(中)
  • JST 日本科学技术振兴机构数据库(日)
  • 统计源期刊(中国科技论文优秀期刊)
关键词:
  • 深度学习
  • 迁移学习
  • 强化学习
  • 实时供需互动
  • stackelberg博弈

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

期刊名称:中国电机工程学报

期刊级别:北大期刊

期刊人气:8571

杂志介绍:
主管单位:中国科学技术协会
主办单位:中国电机工程学会
出版地方:北京
快捷分类:电力
国际刊号:0258-8013
国内刊号:11-2107/TM
邮发代号:82-327
创刊时间:1964
发行周期:半月刊
期刊开本:A4
下单时间:1-3个月
复合影响因子:3.5
综合影响因子:4.31