摘要:为了解决无线射频识别(RFID)系统中多阅读器与标签通信的碰撞问题,文中将此问题建模为马尔可夫决策过程,并提出了一种基于Q-learning的防碰撞算法。该算法通过智能体agent不断与周围环境进行交互和学习,从而产生Q值函数,得到最佳信道分配策略;取消了HiQ算法中复杂的分层结构,简化了系统模型,引入ε贪婪策略以得到全局最优解,改进奖赏函数以得到最优状态。仿真结果表明,与HiQ算法和EHiQ算法相比,该智能算法能够自适应地为阅读器分配不同的信道来进行数据传输,从而有效降低碰撞率,提高信道利用率和吞吐率。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社