机构检索 - 北京工业大学机构库

1

不依赖初始容许控制的非对称约束零和博弈智能评判设计

期刊论文 | 2025 , 40 (4) , 1347-1356 | 控制与决策

Abstract & Keyword Cite

Abstract ：

利用自适应评判控制方法研究具有非对称约束的连续时间零和博弈问题.首先,建立一种新颖的非二次型函数处理非对称约束问题,以降低对控制矩阵的限制.其次,推导最优控制、最坏扰动,以及Hamilton-Jacobi-Isaacs方程.然后,建立一种自适应评判控制方法以近似最优代价函数,从而获得近似最优控制以及近似最坏扰动.针对具有非对称约束的零和博弈问题,提出一种新型评判学习准则来强化学习过程并消除对初始容许控制的依赖.此外,利用Lyapunov方法证明系统状态和评判网络权值近似误差的稳定性.最后,利用F-16战斗机和倒立摆两个实例验证所提算法的有效性.同时,给出传统学习算法下的仿真结果,进一步说明所提新型学习准则的可行性.

Keyword ：

连续系统自适应评判设计非对称约束零和博弈初始容许控制自适应动态规划

Cite：

Copy from the list or Export to your reference management。

GB/T 7714	李梦花 , 王鼎 , 赵明明 et al. 不依赖初始容许控制的非对称约束零和博弈智能评判设计 [J]. \| 控制与决策 , 2025 , 40 (4) : 1347-1356 .
MLA	李梦花 et al. "不依赖初始容许控制的非对称约束零和博弈智能评判设计" . \| 控制与决策 40 . 4 (2025) : 1347-1356 .
APA	李梦花 , 王鼎 , 赵明明 , 乔俊飞 . 不依赖初始容许控制的非对称约束零和博弈智能评判设计 . \| 控制与决策 , 2025 , 40 (4) , 1347-1356 .
Export to	NoteExpress RIS BibTex

2

迁移增量启发式动态规划及污水处理应用

期刊论文 | 2025 , 51 (3) , 277-283 | 北京工业大学学报

王鼎 | 李鑫

Abstract & Keyword Cite

Abstract ：

针对污水处理系统中的溶解氧(dissolved oxygen,DO)质量浓度控制问题,提出一种迁移增量启发式动态规划(transferable incremental heuristic dynamic programming,TI-HDP)算法.针对污水处理过程的特性,该算法通过将控制变量的更新方式改进为增量形式,提升了算法的抗干扰能力,并弱化了与增量式比例-积分-微分(proportional-integral-derivative,PID)算法之间的结构差异.基于数据驱动的思想,通过利用PID算法所产生的历史数据,成功地将传统控制领域中的专家经验迁移到TI-HDP算法框架中,保证了TI-HDP算法前期控制策略的稳定性.仿真结果表明:与PID算法和传统的启发式动态规划算法相比,所提算法对DO质量浓度具有更高的控制精度.

Keyword ：

HDP) 神经网络知识迁移污水处理启发式动态规划(heuristic dynamic programming 非线性系统智能控制

Cite：

Copy from the list or Export to your reference management。

GB/T 7714	王鼎 , 李鑫 . 迁移增量启发式动态规划及污水处理应用 [J]. \| 北京工业大学学报 , 2025 , 51 (3) : 277-283 .
MLA	王鼎 et al. "迁移增量启发式动态规划及污水处理应用" . \| 北京工业大学学报 51 . 3 (2025) : 277-283 .
APA	王鼎 , 李鑫 . 迁移增量启发式动态规划及污水处理应用 . \| 北京工业大学学报 , 2025 , 51 (3) , 277-283 .
Export to	NoteExpress RIS BibTex

3

Transferable Incremental Heuristic Dynamic Programming With Wastewater Treatment Applications; [迁移增量启发式动态规划及污水处理应用] Scopus

期刊论文 | 2025 , 51 (3) , 277-283 | Journal of Beijing University of Technology

Wang, D. | Li, X.

Abstract & Keyword Cite

Abstract ：

A transferable incremental heuristic dynamic programming (TI-HDP) algorithm is proposed for the control problem of the dissolved oxygen (DO) mass concentration in the wastewater treatment system. Considering the characteristics of the wastewater treatment process, this algorithm improved the anti-interference ability and weakened the structural disparity with the incremental proportional-integral-derivative (PID) algorithm by improving the updating method of the control variable into the incremental form. Based on the data-driven idea and by utilizing the historical data generated under the action of the PID algorithm, the expert experience in the traditional control field was successfully integrated into the framework of the TI-HDP algorithm, which ensured the stability of the control strategy of the TI-HDP algorithm in the early stage. Simulation results show that the TI-HDP algorithm achieves a higher control accuracy for the DO mass concentration than the PID algorithm and the traditional heuristic dynamic programuing (HDP) algorithm. © 2025 Beijing University of Technology. All rights reserved.

Keyword ：

heuristic dynamic programming (HDP) wastewater treatment intelligent control knowledge transfer nonlinear systems neural networks

Cite：

Copy from the list or Export to your reference management。

GB/T 7714	Wang, D. , Li, X. . Transferable Incremental Heuristic Dynamic Programming With Wastewater Treatment Applications; [迁移增量启发式动态规划及污水处理应用] [J]. \| Journal of Beijing University of Technology , 2025 , 51 (3) : 277-283 .
MLA	Wang, D. et al. "Transferable Incremental Heuristic Dynamic Programming With Wastewater Treatment Applications; [迁移增量启发式动态规划及污水处理应用]" . \| Journal of Beijing University of Technology 51 . 3 (2025) : 277-283 .
APA	Wang, D. , Li, X. . Transferable Incremental Heuristic Dynamic Programming With Wastewater Treatment Applications; [迁移增量启发式动态规划及污水处理应用] . \| Journal of Beijing University of Technology , 2025 , 51 (3) , 277-283 .
Export to	NoteExpress RIS BibTex

4

一种基于计算机视觉的钢筋加工智能优化方法及系统 zhihuiya

专利 | 2024-06-28 | CN202410860210.1

孙哲 | 蔡志勇 | 司典浩 | 孙旭菲 | 吕金彪 | 李星晨 | 赵骥洲 | 王家祺

Abstract & Keyword Cite

Abstract ：

本说明书实施例提供了一种基于计算机视觉的钢筋加工智能优化方法及系统，其中，方法包括：通过摄像头采集钢筋堆的截面图像及横向图像；对所述端面图像和横向图像进行预处理，基于所述端面图像和横向图像分别获取钢筋数量和钢筋长度，得到钢筋数据；基于现有的料单需求和所述钢筋数据，输入训练好的动态规划模型，得到钢筋下料切割方案；基于所述横向图像对钢筋下料切割方案进行超限判断，根据判断结果优化切割方案，得到最终切割方案，实现精准化切割。本发明能够更高效、更精准的完成钢筋加工切割项目订单，提高效率、减少余料、降低人工成本。

Cite：

Copy from the list or Export to your reference management。

GB/T 7714	孙哲 , 蔡志勇 , 司典浩 et al. 一种基于计算机视觉的钢筋加工智能优化方法及系统 : CN202410860210.1[P]. \| 2024-06-28 .
MLA	孙哲 et al. "一种基于计算机视觉的钢筋加工智能优化方法及系统" : CN202410860210.1. \| 2024-06-28 .
APA	孙哲 , 蔡志勇 , 司典浩 , 孙旭菲 , 吕金彪 , 李星晨 et al. 一种基于计算机视觉的钢筋加工智能优化方法及系统 : CN202410860210.1. \| 2024-06-28 .
Export to	NoteExpress RIS BibTex

5

一种信号交叉口智能网联车辆双模式最优速度轨迹控制方法 zhihuiya

专利 | 2023-07-27 | CN202310930885.4

陈艳艳 | 卢凯明 | 仝瑶 | 张健 | 罗莹 | 陈宁 | 张云超

Abstract & Keyword Cite

Abstract ：

本发明涉及一种信号交叉口智能网联车辆双模式最优速度轨迹控制方法，属于智能交通领域领域。本发明能够基于交叉口入口排队实时状态及预测的交通参数，识别可被引导的目标车辆；基于动态规划算法求解生成可参考的初始优化轨迹；基于模型预测控制框架构建模式Ⅰ、模式Ⅱ两种控制模式，分别用来跟踪初始优化轨迹和前车轨迹，根据实时预测的目标车辆及其前车之间的相对运动状态切换两种速度控制模式，实现智能网联车辆最优速度控制。本发明不仅能够通过模式Ⅰ实现节能控制目标，同时通过模式Ⅱ来保证高效和安全目标，有利于提高智能网联车辆在通过信号交叉口时的自适应最优控制能力。

Cite：

Copy from the list or Export to your reference management。

GB/T 7714	陈艳艳 , 卢凯明 , 仝瑶 et al. 一种信号交叉口智能网联车辆双模式最优速度轨迹控制方法 : CN202310930885.4[P]. \| 2023-07-27 .
MLA	陈艳艳 et al. "一种信号交叉口智能网联车辆双模式最优速度轨迹控制方法" : CN202310930885.4. \| 2023-07-27 .
APA	陈艳艳 , 卢凯明 , 仝瑶 , 张健 , 罗莹 , 陈宁 et al. 一种信号交叉口智能网联车辆双模式最优速度轨迹控制方法 : CN202310930885.4. \| 2023-07-27 .
Export to	NoteExpress RIS BibTex

6

混合车流下基于车路协同的交通信号与车辆轨迹优化方法 zhihuiya

专利 | 2023-12-22 | CN202311779704.9

张利国 | 张健愉 | 徐舒畅 | 陈子然 | 邓恒

Abstract & Keyword Cite

Abstract ：

本发明公开了混合车流下基于车路协同的交通信号与车辆轨迹优化方法，包括基于车路协同的交通信息整理与控制系统建模；基于双层优化模型的信号灯及车流优化。本方法采用双环和屏障结构对上层的信号灯配时进行优化，其中所有车辆的行驶延迟在动态规划中作为子优化问题被最小化。CAV和HDV的释放时间作为上层的输入参数计算。优化后的到达时间传输给下层。CAV根据判断最优到达时间是否超过截止时间，采用两种不同的优化目标进行经济性驾驶，因此随着CAV在车流中占比的增加，模型对于行驶时间与油耗的优化效果都将会更加富有成效。本发明基于混合车流情况下的道路信号灯与车辆轨迹的协同优化方法，提出更加高效且更加环保的信号灯和轨迹优化方案。

Cite：

Copy from the list or Export to your reference management。

GB/T 7714	张利国 , 张健愉 , 徐舒畅 et al. 混合车流下基于车路协同的交通信号与车辆轨迹优化方法 : CN202311779704.9[P]. \| 2023-12-22 .
MLA	张利国 et al. "混合车流下基于车路协同的交通信号与车辆轨迹优化方法" : CN202311779704.9. \| 2023-12-22 .
APA	张利国 , 张健愉 , 徐舒畅 , 陈子然 , 邓恒 . 混合车流下基于车路协同的交通信号与车辆轨迹优化方法 : CN202311779704.9. \| 2023-12-22 .
Export to	NoteExpress RIS BibTex

7

未知不匹配互联系统的非对称输入约束分散控制器设计

期刊论文 | 2024 , 46 (12) , 2269-2278 | 工程科学学报

王鼎 | 范文倩 | 刘奥

Abstract & Keyword Cite

Abstract ：

基于自适应动态规划算法研究了具有未知不匹配互联和非对称输入约束的连续时间非线性系统分散控制问题.首先,根据孤立子系统的局部状态和耦合子系统的参考状态,采用径向基函数神经网络近似未知互连项,从而消除了互联项满足匹配条件且存在上界的常见假设.然后,基于自适应评判框架,将分散最优控制器设计问题转化为一系列子系统非对称约束下局部最优控制器设计问题.利用Lyapunov稳定性定理,证明了不对称输入约束控制器能够迅速地镇定大规模分散系统.其中,引入状态观测器估计大规模非线性互联子系统状态并保证了观测误差满足一致最终有界.另外,利用评判神经网络近似改进后的代价函数,以近似求解Hamilton-Jacobi-Bellman方程,获得满足非对称输入约束的最优分散控制策略.基于评判网络权值更新规则,通过选择合适的Lyapunov函数保证了权值近似误差满足一致最终有界.最后,通过仿真实例验证了该算法的有效性,并通过与未改进代价函数的传统方法对比,体现了该方法的先进性.

Keyword ：

状态观测器非对称输入约束分散控制神经网络自适应动态规划未知不匹配互联最优控制

Cite：

Copy from the list or Export to your reference management。

GB/T 7714	王鼎 , 范文倩 , 刘奥 . 未知不匹配互联系统的非对称输入约束分散控制器设计 [J]. \| 工程科学学报 , 2024 , 46 (12) : 2269-2278 .
MLA	王鼎 et al. "未知不匹配互联系统的非对称输入约束分散控制器设计" . \| 工程科学学报 46 . 12 (2024) : 2269-2278 .
APA	王鼎 , 范文倩 , 刘奥 . 未知不匹配互联系统的非对称输入约束分散控制器设计 . \| 工程科学学报 , 2024 , 46 (12) , 2269-2278 .
Export to	NoteExpress RIS BibTex

8

基于多目标粒子群优化的污水处理系统自适应评判控制

期刊论文 | 2024 , 46 (5) , 908-917 | 工程科学学报

王鼎 | 赵慧玲 | 李鑫

Abstract & Keyword Cite

Abstract ：

考虑到城市污水处理系统存在保证出水水质达标和降低能耗的需要,将其运行过程视为一个多目标优化控制问题.针对此问题,提出一种基于多目标粒子群优化(Multi-objective particle swarm optimization,MOPSO)算法的污水处理系统自适应评判控制方案,该方案分为上层优化和底层跟踪控制两部分.首先,污水处理过程存在非线性、多变量、大时变等特点,结合数据驱动思想对入水及出水组分数据进行分析,构建关于出水水质和运行能耗的多目标优化模型.采用径向基函数(Radial basis function,RBF)神经网络进行建模,并与反向传播(Back propagation,BP)神经网络进行了对比.然后,结合MOPSO算法强大的优化能力,采用MOPSO算法对优化目标进行求解,并设计一个决策方式从最优解集中选出偏好解,作为溶解氧与硝态氮浓度的最优设定值.接下来,底层跟踪控制部分采用基于自适应动态规划的辅助控制器对比例-积分-微分算法的控制策略进行补充,弥补了传统控制算法自适应能力差的不足.此外,比例-积分-微分算法也为自适应动态规划算法提供了初始的稳定控制策略,克服了学习算法前期控制效果差的缺陷,保证了污水处理过程的安全性和可靠性.最终,该控制器成功实现了对最优设定值的跟踪控制.将所提算法在污水处理基准仿真平台上进行验证,结果表明所提算法能有效地提高污水处理过程的运行性能,不仅能保证出水水质达标,同时能有效地降低污水处理过程产生的能耗.

Keyword ：

神经网络污水处理自适应评判跟踪控制多目标优化

Cite：

Copy from the list or Export to your reference management。

GB/T 7714	王鼎 , 赵慧玲 , 李鑫 . 基于多目标粒子群优化的污水处理系统自适应评判控制 [J]. \| 工程科学学报 , 2024 , 46 (5) : 908-917 .
MLA	王鼎 et al. "基于多目标粒子群优化的污水处理系统自适应评判控制" . \| 工程科学学报 46 . 5 (2024) : 908-917 .
APA	王鼎 , 赵慧玲 , 李鑫 . 基于多目标粒子群优化的污水处理系统自适应评判控制 . \| 工程科学学报 , 2024 , 46 (5) , 908-917 .
Export to	NoteExpress RIS BibTex

9

一种基于Q学习的污水处理硝态氮浓度控制方法 incoPat zhihuiya

专利 | 2023-06-15 | CN202310713223.1

王鼎 | 王元 | 赵明明

Abstract & Keyword Cite

Abstract ：

本发明涉及一种基于Q学习的污水处理硝态氮浓度控制方法。在污水处理系统中，使硝态氮浓度跟踪上期望轨迹是污水处理过程的一个重要控制目标。本发明针对硝态氮浓度的期望值跟踪问题，提出一种基于Q学习的轨迹跟踪控制方法，降低对系统模型信息要求，并用于实现污水处理过程中硝态氮浓度的跟踪控制设计。根据自适应动态规划算法，建立Q学习算法框架，训练神经网络来解决最优跟踪控制问题，并在BSM1(Benchmark Simulation Model No.1)仿真模型上进行方法验证。本发明能够保证硝态氮浓度更精准地跟踪上期望轨迹，从而实现污水处理过程的有效控制。

Cite：

Copy from the list or Export to your reference management。

GB/T 7714	王鼎 , 王元 , 赵明明 . 一种基于Q学习的污水处理硝态氮浓度控制方法 : CN202310713223.1[P]. \| 2023-06-15 .
MLA	王鼎 et al. "一种基于Q学习的污水处理硝态氮浓度控制方法" : CN202310713223.1. \| 2023-06-15 .
APA	王鼎 , 王元 , 赵明明 . 一种基于Q学习的污水处理硝态氮浓度控制方法 : CN202310713223.1. \| 2023-06-15 .
Export to	NoteExpress RIS BibTex

10

一种响应分时电价的空气源热泵供暖水温动态规划方法 zhihuiya

专利 | 2023-09-15 | CN202311198941.6

王伟 | 李欣田 | 孙育英 | 魏文哲

Abstract & Keyword Cite

Abstract ：

一种响应分时电价的空气源热泵供暖水温动态规划方法，属于空气源热泵供热系统优化控制领域。包括以下步骤；S1：准确预测不同室外环境不同供水温度下未来24小时室内温度及供暖负荷变化。S2：准确预测不同室外环境不同供暖水温下未来24小时空气源热泵能耗及供暖运行成本变化。S3：以响应分时电价为目标，动态规划未来24小时空气源热泵供水温度设定值。利用建筑自身围护结构、内墙及家具等进行蓄热，有效提高空气源热泵供暖系统的电力调峰能力，并通过响应分时电价显著降低供暖系统运行成本，为空气源热泵供暖系统响应需求侧管理、促进可再生能源电力消纳及降低用户供暖费用提供了必要的理论保障和技术支撑。

Cite：

Copy from the list or Export to your reference management。

GB/T 7714	王伟 , 李欣田 , 孙育英 et al. 一种响应分时电价的空气源热泵供暖水温动态规划方法 : CN202311198941.6[P]. \| 2023-09-15 .
MLA	王伟 et al. "一种响应分时电价的空气源热泵供暖水温动态规划方法" : CN202311198941.6. \| 2023-09-15 .
APA	王伟 , 李欣田 , 孙育英 , 魏文哲 . 一种响应分时电价的空气源热泵供暖水温动态规划方法 : CN202311198941.6. \| 2023-09-15 .
Export to	NoteExpress RIS BibTex

Type
Departments

All Years Choose Year From to