Query:
学者姓名:阮晓钢
Refining:
Year
Type
Indexed by
Source
Complex
Co-Author
Language
Clean All
Abstract :
针对结构固定认知模型中存在的学习浪费与计算浪费问题,在具有内发动机机制的感知行动认知模型基础上,根据操作条件反射学习特性,借鉴潜在动作原理,建立起一种具有发育机制的感知行动认知模型D-SSCM (Development-sensorimotor cognitive model),具体为一个14元组,包含离散学习时间集、内部可感知离散状态集、可输出动作集、有效输出动作空间集、潜在动作关系集、可输出动作空间探索率集及发育算法等.针对模型发育过程,分别设计了模型结构扩展式发育方法和算法以及缩减式发育方法和算法,定义了模型的发育式学习过程.使用两轮机器人自平衡任务对设计的学习模型进行验证,实验结果表明...
Keyword :
操作条件反射 操作条件反射 感知行动认知 感知行动认知 两轮机器人 两轮机器人 发育 发育 潜在动作 潜在动作
Cite:
Copy from the list or Export to your reference management。
GB/T 7714 | 张晓平 , 阮晓钢 , 王力 et al. 一种具有发育机制的感知行动认知模型 [J]. | 自动化学报 , 2021 , 47 (02) : 391-403 . |
MLA | 张晓平 et al. "一种具有发育机制的感知行动认知模型" . | 自动化学报 47 . 02 (2021) : 391-403 . |
APA | 张晓平 , 阮晓钢 , 王力 , 李志军 , 闫佳庆 , 毕松 . 一种具有发育机制的感知行动认知模型 . | 自动化学报 , 2021 , 47 (02) , 391-403 . |
Export to | NoteExpress RIS BibTex |
Abstract :
Q-learning作为一种无模型的值迭代强化学习算法,被广泛应用于移动机器人在非结构环境下的导航任务中。针对Q-learning在移动机器人导航中环境探索和利用存在矛盾关系导致收敛速度慢的问题,该文在Q-learning算法的基础上,受啮齿类动物可以利用嗅觉线索来进行空间定向和导航的启发,提出一种基于气味奖励引导的Q-learning环境认知策略。该算法通过改善Q-learning中的动作选择策略来减少对环境的无用探索,在动作选择策略中融入了环境气味奖励的引导,并提出了嗅觉因子来平衡动作选择策略中Q-learning和气味奖励引导的权重关系。为了验证算法的有效性,在Tolman老鼠实验所用的...
Keyword :
嗅觉因子 嗅觉因子 机器人导航 机器人导航 环境认知 环境认知 Q-learning Q-learning
Cite:
Copy from the list or Export to your reference management。
GB/T 7714 | 阮晓钢 , 刘鹏飞 , 朱晓庆 . 基于气味奖励引导的Q-learning环境认知方法 [J]. | 清华大学学报(自然科学版) , 2021 , 61 (03) : 254-260 . |
MLA | 阮晓钢 et al. "基于气味奖励引导的Q-learning环境认知方法" . | 清华大学学报(自然科学版) 61 . 03 (2021) : 254-260 . |
APA | 阮晓钢 , 刘鹏飞 , 朱晓庆 . 基于气味奖励引导的Q-learning环境认知方法 . | 清华大学学报(自然科学版) , 2021 , 61 (03) , 254-260 . |
Export to | NoteExpress RIS BibTex |
Abstract :
基于深度强化学习的区域化视觉导航方法
Keyword :
分布式环境 分布式环境 区域化模型 区域化模型 奖励预测 奖励预测 景深避障 景深避障 深度强化学习 深度强化学习
Cite:
Copy from the list or Export to your reference management。
GB/T 7714 | 李鹏 , 阮晓钢 , 朱晓庆 et al. 基于深度强化学习的区域化视觉导航方法 [J]. | 李鹏 , 2021 , 55 (5) : 575-585 . |
MLA | 李鹏 et al. "基于深度强化学习的区域化视觉导航方法" . | 李鹏 55 . 5 (2021) : 575-585 . |
APA | 李鹏 , 阮晓钢 , 朱晓庆 , 柴洁 , 任顶奇 , 刘鹏飞 et al. 基于深度强化学习的区域化视觉导航方法 . | 李鹏 , 2021 , 55 (5) , 575-585 . |
Export to | NoteExpress RIS BibTex |
Abstract :
基于气味奖励引导的Q-learning环境认知方法
Keyword :
嗅觉因子 嗅觉因子 环境认知 环境认知 机器人导航 机器人导航 Q-LEARNING Q-LEARNING
Cite:
Copy from the list or Export to your reference management。
GB/T 7714 | 阮晓钢 , 刘鹏飞 , 朱晓庆 et al. 基于气味奖励引导的Q-learning环境认知方法 [J]. | 阮晓钢 , 2021 , 61 (3) : 254-260 . |
MLA | 阮晓钢 et al. "基于气味奖励引导的Q-learning环境认知方法" . | 阮晓钢 61 . 3 (2021) : 254-260 . |
APA | 阮晓钢 , 刘鹏飞 , 朱晓庆 , 清华大学学报:自然科学版 . 基于气味奖励引导的Q-learning环境认知方法 . | 阮晓钢 , 2021 , 61 (3) , 254-260 . |
Export to | NoteExpress RIS BibTex |
Abstract :
融合卷积神经网络与VLAD的闭环检测方法
Keyword :
词袋模型 词袋模型 特征提取 特征提取 卷积神经网络 卷积神经网络 闭环检测 闭环检测
Cite:
Copy from the list or Export to your reference management。
GB/T 7714 | 李昂 , 阮晓钢 , 黄静 et al. 融合卷积神经网络与VLAD的闭环检测方法 [J]. | 李昂 , 2021 , 38 (1) : 135-142 . |
MLA | 李昂 et al. "融合卷积神经网络与VLAD的闭环检测方法" . | 李昂 38 . 1 (2021) : 135-142 . |
APA | 李昂 , 阮晓钢 , 黄静 , 朱晓庆 , 计算机应用与软件 . 融合卷积神经网络与VLAD的闭环检测方法 . | 李昂 , 2021 , 38 (1) , 135-142 . |
Export to | NoteExpress RIS BibTex |
Abstract :
基于目标导向行为和空间拓扑记忆的视觉导航方法
Keyword :
碰撞预测 碰撞预测 目标导向行为 目标导向行为 深度强化学习 深度强化学习 时间相关性网络 时间相关性网络 动作网络 动作网络 空间拓扑地图 空间拓扑地图
Cite:
Copy from the list or Export to your reference management。
GB/T 7714 | 阮晓钢 , 李鹏 , 朱晓庆 et al. 基于目标导向行为和空间拓扑记忆的视觉导航方法 [J]. | 阮晓钢 , 2021 , 44 (3) : 594-608 . |
MLA | 阮晓钢 et al. "基于目标导向行为和空间拓扑记忆的视觉导航方法" . | 阮晓钢 44 . 3 (2021) : 594-608 . |
APA | 阮晓钢 , 李鹏 , 朱晓庆 , 刘鹏飞 , 计算机学报 . 基于目标导向行为和空间拓扑记忆的视觉导航方法 . | 阮晓钢 , 2021 , 44 (3) , 594-608 . |
Export to | NoteExpress RIS BibTex |
Abstract :
一种具有发育机制的感知行动认知模型
Keyword :
感知行动认知 感知行动认知 发育 发育 潜在动作 潜在动作 两轮机器人 两轮机器人 操作条件反射 操作条件反射
Cite:
Copy from the list or Export to your reference management。
GB/T 7714 | 张晓平 , 阮晓钢 , 王力 et al. 一种具有发育机制的感知行动认知模型 [J]. | 张晓平 , 2021 , 47 (2) : 391-403 . |
MLA | 张晓平 et al. "一种具有发育机制的感知行动认知模型" . | 张晓平 47 . 2 (2021) : 391-403 . |
APA | 张晓平 , 阮晓钢 , 王力 , 李志军 , 闫佳庆 , 毕松 et al. 一种具有发育机制的感知行动认知模型 . | 张晓平 , 2021 , 47 (2) , 391-403 . |
Export to | NoteExpress RIS BibTex |
Abstract :
基于海马体位置细胞的认知地图构建与导航
Keyword :
移动机器人 移动机器人 海马体位置细胞 海马体位置细胞 老鼠绕道实验 老鼠绕道实验 Tolman Tolman 环境认知 环境认知 导航 导航
Cite:
Copy from the list or Export to your reference management。
GB/T 7714 | 阮晓钢 , 柴洁 , 武悦 et al. 基于海马体位置细胞的认知地图构建与导航 [J]. | 阮晓钢 , 2021 , 47 (3) : 666-677 . |
MLA | 阮晓钢 et al. "基于海马体位置细胞的认知地图构建与导航" . | 阮晓钢 47 . 3 (2021) : 666-677 . |
APA | 阮晓钢 , 柴洁 , 武悦 , 张晓平 , 黄静 , 自动化学报 . 基于海马体位置细胞的认知地图构建与导航 . | 阮晓钢 , 2021 , 47 (3) , 666-677 . |
Export to | NoteExpress RIS BibTex |
Abstract :
针对在具有动态因素且视觉丰富环境中的导航问题,受路标机制空间记忆方式启发,提出一种可同步学习目标导向行为和记忆空间结构的视觉导航方法.首先,为直接从原始输入中学习控制策略,以深度强化学习为基本导航框架,同时添加碰撞预测作为模型辅助任务;然后,在智能体学习导航过程中,利用时间相关性网络祛除冗余观测及寻找导航节点,实现通过情景记忆递增描述环境结构;最后,将空间拓扑地图作为路径规划模块集成到模型中,并结合动作网络用于获取更加通用的导航方法.实验在3D仿真环境DMlab中进行,实验结果表明,本文方法可从视觉输入中学习目标导向行为,在所有测试环境中均展现出更高效的学习方法和导航策略,同时减少构建地图所需...
Keyword :
空间拓扑地图 空间拓扑地图 目标导向行为 目标导向行为 深度强化学习 深度强化学习 动作网络 动作网络 时间相关性网络 时间相关性网络 碰撞预测 碰撞预测
Cite:
Copy from the list or Export to your reference management。
GB/T 7714 | 阮晓钢 , 李鹏 , 朱晓庆 et al. 基于目标导向行为和空间拓扑记忆的视觉导航方法 [J]. | 计算机学报 , 2021 , 44 (03) : 594-608 . |
MLA | 阮晓钢 et al. "基于目标导向行为和空间拓扑记忆的视觉导航方法" . | 计算机学报 44 . 03 (2021) : 594-608 . |
APA | 阮晓钢 , 李鹏 , 朱晓庆 , 刘鹏飞 . 基于目标导向行为和空间拓扑记忆的视觉导航方法 . | 计算机学报 , 2021 , 44 (03) , 594-608 . |
Export to | NoteExpress RIS BibTex |
Abstract :
自适应轨迹任务模仿的模仿学习方法研究
Keyword :
机器人 机器人 性能评价 性能评价 动态系统 动态系统 非线性函数 非线性函数 模仿学习 模仿学习
Cite:
Copy from the list or Export to your reference management。
GB/T 7714 | 于建均 , 姚红柯 , 左国玉 et al. 自适应轨迹任务模仿的模仿学习方法研究 [J]. | 于建均 , 2021 , 28 (2) : 266-274 . |
MLA | 于建均 et al. "自适应轨迹任务模仿的模仿学习方法研究" . | 于建均 28 . 2 (2021) : 266-274 . |
APA | 于建均 , 姚红柯 , 左国玉 , 阮晓钢 , 控制工程 . 自适应轨迹任务模仿的模仿学习方法研究 . | 于建均 , 2021 , 28 (2) , 266-274 . |
Export to | NoteExpress RIS BibTex |
Export
Results: |
Selected to |
Format: |