Indexed by:
Abstract:
本发明公开了一种基于深度学习的中文电子病历文本语义分割方法,主要包括语义字典构建及文本语义特征向量表示、整体特征融合、深度神经网络训练以及预测优化部分。利用预训练语言模型表示文本上下文语义特征,并加入了字符语义位置特征,将融合后的整体特征输入到深度神经网络中进行模型训练。相比于现有的语义分割技术,本发明构建字符间融合全局的上下文语义特征,捕获并学习序列每个字符的语义类别特性,最后找到每个字符的最佳语义类别标签,从而实现精细化的文本语义分割,在数据集较小情况下实现了文本语义分割较高的准确性,发展了EMR文本语义分割的新方法。
Keyword:
Reprint Author's Address:
Email:
Patent Info :
Type: 发明申请
Patent No.: CN202210052863.8
Filing Date: 2022-01-18
Publication Date: 2025-02-11
Pub. No.: CN114417836B
Applicants: 北京工业大学
Legal Status: 授权
Cited Count:
WoS CC Cited Count: 0
SCOPUS Cited Count:
ESI Highly Cited Papers on the List: 0 Unfold All
WanFang Cited Count:
Chinese Cited Count:
30 Days PV: 21
Affiliated Colleges: