Query:
Refining:
Year
Type
Indexed by
Colleges
Complex
Language
Clean All
Abstract :
目的/意义 探索基于中文电子病历的命名实体识别方法在构建医学知识图谱和相关应用推广方面的技术可行性.方法/过程 采用真实医疗电子病历数据对词嵌入表示模型进行精化,构建医学术语专有嵌入表示,并利用卷积神经网络等多模型提取局部语义特征,实现基于堆叠注意网络的中文医疗命名实体识别.结果/结论 堆叠注意网络模型F1 值达到91.5%,较其他模型具备更强的医疗命名实体识别性能.进一步解决中文医疗命名实体识别难点,在实现全局语义特征全面深入提取的同时降低时间成本.
Keyword :
堆叠注意网络 电子病历 命名实体识别
Cite:
Copy from the list or Export to your reference management。
GB/T 7714 | 陈婕卿 , 竹志超 , 张锋 et al. 中文电子病历命名实体识别方法研究 [J]. | 医学信息学杂志 , 2024 , 45 (4) : 78-84 . |
MLA | 陈婕卿 et al. "中文电子病历命名实体识别方法研究" . | 医学信息学杂志 45 . 4 (2024) : 78-84 . |
APA | 陈婕卿 , 竹志超 , 张锋 , 曾可 , 姜会珍 , 程振宁 . 中文电子病历命名实体识别方法研究 . | 医学信息学杂志 , 2024 , 45 (4) , 78-84 . |
Export to | NoteExpress RIS BibTex |
Abstract :
[研究目的]为提高专利知识图谱构建的自动化水平,并实现知识服务与交易服务的融合,提出了面向供需信息挖掘的供需知识图谱(PSD-KG)的构建思路。[研究方法]知识图谱规划方面,对专利交易涉及实体及关系进行了拓展,规划了共由12类实体和14类关系组成的PSD-KG。知识图谱构建方法上,建立专利领域词典以实现语料自动化标注,并提出了基于BERT-BiLSTM-CRF模型的语义实体识别方法。[研究结论]与传统的CRF、BiLSTM-CRF模型对比发现,该文模型的准确率、召回率和F1指数均高于85%,验证了方法的有效性;以燃料电池领域为例构建PSD-KG,通过技术供需热点识别及演化研究,识别出三类技术热点,包括:持续热门技术点、新兴热门技术点和潜在热点技术;并在交易网络分析、供需信息检索等方面挖掘新应用场景。研究成果也为专利交易推荐提供了知识库。
Keyword :
应用场景 半自动化构建 燃料电池 专利供需知识图谱 语义实体识别 知识图谱 专利交易
Cite:
Copy from the list or Export to your reference management。
GB/T 7714 | 何喜军 , 张佑 , 孟雪 et al. 专利供需知识图谱半自动化构建及应用 [J]. | 情报杂志 , 2023 , 42 (03) : 139-150 . |
MLA | 何喜军 et al. "专利供需知识图谱半自动化构建及应用" . | 情报杂志 42 . 03 (2023) : 139-150 . |
APA | 何喜军 , 张佑 , 孟雪 , 武玉英 . 专利供需知识图谱半自动化构建及应用 . | 情报杂志 , 2023 , 42 (03) , 139-150 . |
Export to | NoteExpress RIS BibTex |
Abstract :
目前针对中医古籍实体识别研究较少,且大多使用有监督学习方法。但古籍数字化程度低、标注语料稀少,且其语言多为文言文,专业术语也不断发展,现有方法无法有效解决以上问题。故而,该文在构建了中医古籍语料库的基础上,通过对中医古籍中实体名的分析研究,提出了一种基于半监督学习和规则相结合的中医古籍实体识别方法。以条件随机场模型为基本框架,在引入词、词性、词典等有监督特征的同时也引入了通过词向量获得的无监督语义特征,对比不同特征组合的识别性能,确定最优的半监督学习模型,并与其他模型进行了对比。之后,结合古籍语言学特点构建规则库对其进行基于规则的后处理。实验结果中最终F值达到83.18%,证明了该方法的有效性...
Keyword :
半监督学习 中医古籍 命名实体识别 条件随机场
Cite:
Copy from the list or Export to your reference management。
GB/T 7714 | 包振山 , 宋秉彦 , 张文博 et al. 基于半监督学习和规则相结合的中医古籍命名实体识别研究 [J]. | 中文信息学报 , 2022 , 36 (06) : 90-100 . |
MLA | 包振山 et al. "基于半监督学习和规则相结合的中医古籍命名实体识别研究" . | 中文信息学报 36 . 06 (2022) : 90-100 . |
APA | 包振山 , 宋秉彦 , 张文博 , 孙超 . 基于半监督学习和规则相结合的中医古籍命名实体识别研究 . | 中文信息学报 , 2022 , 36 (06) , 90-100 . |
Export to | NoteExpress RIS BibTex |
Abstract :
命名实体识别是自然语言处理的一项基本任务,对信息提取、机器翻译等具有重要的意义和价值.目前命名实体识别通常使用序列标注方法对文本中单个句子的实体进行抽取,忽略了句子间的语义信息.基于机器阅读理解的命名实体识别方法借助问题编码了实体类别的重要先验信息,更加容易区分出相似的分类标签,降低了模型学习难度,但仍然只在句子级别建模,忽略了句子间的语义信息,容易造成不同句子中实体标注不一致的问题.为此,文中将句子级别的命名实体识别扩展到文本级别的命名实体识别,提出了一种基于机器阅读理解的BiLSTM-BiDAF命名实体识别模型.首先,为了充分挖掘文本的上下文特征,使用NEZHA获取全文语境信息,并进一步通过BiLSTM提取局部特征,以加强模型对局部依赖信息的捕获能力;然后,引入双向注意力机制学习文本与实体类别之间的语义关联;最后,设计基于门控机制的边界检测器加强实体边界的相关关系,预测出实体在文本中的位置,同时通过建立答案数量检测器,将无答案问题识别出来.在CCKS2020中文电子病历数据集和CMeEE数据集上的实验结果表明,文中构建的模型能有效地识别文本中的命名实体,F1值可分别达到84.76%和57.35%.
Keyword :
命名实体识别 自然语言处理 机器阅读理解 双向注意力机制 双向长短时记忆网络
Cite:
Copy from the list or Export to your reference management。
GB/T 7714 | 王洁 , 夏晓明 . 基于机器阅读理解的BiLSTM-BiDAF命名实体识别 [J]. | 华南理工大学学报(自然科学版) , 2022 , 50 (12) : 80-88 . |
MLA | 王洁 et al. "基于机器阅读理解的BiLSTM-BiDAF命名实体识别" . | 华南理工大学学报(自然科学版) 50 . 12 (2022) : 80-88 . |
APA | 王洁 , 夏晓明 . 基于机器阅读理解的BiLSTM-BiDAF命名实体识别 . | 华南理工大学学报(自然科学版) , 2022 , 50 (12) , 80-88 . |
Export to | NoteExpress RIS BibTex |
Abstract :
Named entity recognition is a fundamental task of natural language processing (NLP) and plays an important role in many downstream NLP tasks, including information extraction and machine translation, etc. The existing named entity recognition methods are usually based on sequence labeling and extract entities within a sentence independently. These methods ignore the semantic information between sentences. Named entity recognition methods based on machine reading comprehension encode important prior information about the entity class. It is easier to distinguish similar classification labels, which reduces the difficulty of model learning, but it still only models at the sentence level, ignoring the semantic information between sentences, which is easy to cause the problem of inconsistent entity labeling in different sentences. To this end, this paper extended the sentence-level named entity recognition to the text-level named entity recognition, and then proposed a BiLSTM-BiDAF named entity recognition model based on machine reading comprehension. First, to utilize the context information within the whole text, NEZHA pre-training language model was used to obtain information of the full text and local features were further captured through BiLSTM, so as to strengthen the model's ability to capture locally dependent information. Then, a bidirectional attention flow was introduce to learn the semantic association between the text and entity category. Finally, to predict the position of entities in the text, a boundary detector based on the gating mechanism was design to strengthen the correlation of the entity boundary. At the same time, an answer count detector was establish to identify the unanswerable questions. Experimental results on the CCKS2020 Chinese electronic medical records dataset and CMeEE dataset show that our model can effectively identify document-level and sentence-level named entities, and F1 can reach 84.76% and 57.35%, respectively. © 2022, Editorial Department, Journal of South China University of Technology. All right reserved.
Keyword :
Bidirectional long short-term memory Bidirectional attention flow Natural language processing Machine reading comprehension Named entity recognition
Cite:
Copy from the list or Export to your reference management。
GB/T 7714 | Wang, J. , Xia, X. . BiLSTM-BiDAF Named Entity Recognition Based on Machine Reading Comprehension; [基于机器阅读理解的BiLSTM-BiDAF命名实体识别] [J]. | Journal of South China University of Technology (Natural Science) , 2022 , 50 (12) : 80-88 . |
MLA | Wang, J. et al. "BiLSTM-BiDAF Named Entity Recognition Based on Machine Reading Comprehension; [基于机器阅读理解的BiLSTM-BiDAF命名实体识别]" . | Journal of South China University of Technology (Natural Science) 50 . 12 (2022) : 80-88 . |
APA | Wang, J. , Xia, X. . BiLSTM-BiDAF Named Entity Recognition Based on Machine Reading Comprehension; [基于机器阅读理解的BiLSTM-BiDAF命名实体识别] . | Journal of South China University of Technology (Natural Science) , 2022 , 50 (12) , 80-88 . |
Export to | NoteExpress RIS BibTex |
Abstract :
本发明公开了基于机器阅读理解的BiLSTM‑BiDAF命名实体识别方法,首先,为了充分挖掘文本的上下文特征,使用NEZHA获取全文语境信息,并进一步通过BiLSTM提取局部特征,以加强模型对局部依赖信息的捕获能力。其次,引入双向注意力机制学习文本与实体类别之间的语义关联。最后,设计基于门控机制的边界检测器加强实体边界的相关关系,预测出实体在文本中的位置,同时通过建立答案数量检测器,将无答案问题识别出来。本发明在CCKS2020中文电子病历和CMeEE数据集上进行了实验,结果表明本发明构建的模型能有效识别文本中的命名实体。
Cite:
Copy from the list or Export to your reference management。
GB/T 7714 | 夏晓明 , 王洁 . 基于机器阅读理解的BiLSTM-BiDAF命名实体识别方法 : CN202210052780.9[P]. | 2022-01-18 . |
MLA | 夏晓明 et al. "基于机器阅读理解的BiLSTM-BiDAF命名实体识别方法" : CN202210052780.9. | 2022-01-18 . |
APA | 夏晓明 , 王洁 . 基于机器阅读理解的BiLSTM-BiDAF命名实体识别方法 : CN202210052780.9. | 2022-01-18 . |
Export to | NoteExpress RIS BibTex |
Abstract :
互联网的普及极大地促进了在线招聘平台的发展,如何利用有效的算法在海量的职位和简历库中自动匹配符合岗位要求的简历,是构建在线招聘系统的难点之一.为解决上述问题,本文融合知识图谱和文本语义相似度算法,提出了一种采用字符搜索寻找符合岗位要求的简历子集和根据文本语义相似度对所得子集进行排序的两阶段方法.实验结果表明,基于BERT和余弦的语义相似度排序方法的平均准确率比基线方法高15.3%,即可显著提高岗位与简历的匹配度.
Keyword :
语义相似度 排序 知识图谱 命名实体识别
Cite:
Copy from the list or Export to your reference management。
GB/T 7714 | 何春辉 , 郭博譞 . 基于知识图谱和语义相似度的岗位匹配与排序方法 [J]. | 湖南城市学院学报(自然科学版) , 2021 , 30 (5) : 59-63 . |
MLA | 何春辉 et al. "基于知识图谱和语义相似度的岗位匹配与排序方法" . | 湖南城市学院学报(自然科学版) 30 . 5 (2021) : 59-63 . |
APA | 何春辉 , 郭博譞 . 基于知识图谱和语义相似度的岗位匹配与排序方法 . | 湖南城市学院学报(自然科学版) , 2021 , 30 (5) , 59-63 . |
Export to | NoteExpress RIS BibTex |
Abstract :
本发明提供基于笔画卷积和词向量的中文命名实体识别方法及系统,涉及命名实体识别技术领域,包括:获取文本中各汉字对应的笔画序列及各汉字的字符特征向量;将笔画序列输入笔画卷积神经网络,获取笔画特征向量;根据文本中实体的最大长度设置滑动窗口,通过自注意力机制获取每个字在滑动窗口内的词向量;拼接文本中各汉字的笔画特征向量、词向量和字符特征向量,并输入BiLSTM网络,获取每个汉字对应每种实体标签的得分;采用CRF模型对文本中每个汉字确定一个最佳的实体标签。本发明考虑到汉字的笔画序列对汉字的影响,结合汉字的笔画特征向量、词特征向量和字符特征向量后,在进行命名实体识别,提高命名实体识别的效果。
Cite:
Copy from the list or Export to your reference management。
GB/T 7714 | 何东之 , 张震 , 王鹏飞 et al. 基于笔画卷积和词向量的中文命名实体识别方法及系统 : CN202111641955.1[P]. | 2021-12-29 . |
MLA | 何东之 et al. "基于笔画卷积和词向量的中文命名实体识别方法及系统" : CN202111641955.1. | 2021-12-29 . |
APA | 何东之 , 张震 , 王鹏飞 , 孙亚茹 , 郭隆杭 . 基于笔画卷积和词向量的中文命名实体识别方法及系统 : CN202111641955.1. | 2021-12-29 . |
Export to | NoteExpress RIS BibTex |
Abstract :
本发明涉及一种基于标签引导的字词融合的命名实体识别方法,用于解决以往分词工具不准确造成的分词错误的问题。具体采用标注信息对句子的分词结果进行分组,并对组内信息进行融合,能够有效的获得这个位置词的信息;将位置词信息与当前字的信息进行融合,增强位置词的信息表达;采用注意力机制,对每个位置词进行分配权重,使其更加关注正确的词的标签;采用Gated Mechanism来动态的权衡字特征与位置词向量特征的比重,最后通过BiLSTM与CRF找到最优序列。本发明改善了词边界识别错误的问题,并能够减少未登陆词(OOV)的产生。
Cite:
Copy from the list or Export to your reference management。
GB/T 7714 | 胡永利 , 于腾 , 孙艳丰 et al. 基于标签引导的字词融合的命名实体识别方法 : CN202110027765.4[P]. | 2021-01-08 . |
MLA | 胡永利 et al. "基于标签引导的字词融合的命名实体识别方法" : CN202110027765.4. | 2021-01-08 . |
APA | 胡永利 , 于腾 , 孙艳丰 , 王博岳 , 尹宝才 . 基于标签引导的字词融合的命名实体识别方法 : CN202110027765.4. | 2021-01-08 . |
Export to | NoteExpress RIS BibTex |
Abstract :
本发明公开了一种专业领域论文的批量实体抽取方法及系统,方法包括:采用开源数据集对联合实体关系抽取模型进行预训练;针对模型输出的实体识别结果中的单个实体加入边界信息;以所要抽取实体的专业领域的文献数据集对模型进行迁移学习;构建专业领域的词典匹配规则,并将匹配结果与迁移学习后的模型预测结果一致的样本数据扩充入训练集中;对训练集进行迭代扩充和反复训练,直至训练结果无明显正收益;将需要抽取实体的文本输入训练完成的模型,得到关系分类的实体信息。通过本发明的技术方案,有效解决了错差累积和关系重叠的问题,减少了人力成本及其所导致的高标注成本,且为跨领域实施带来更多的可能和便利。
Cite:
Copy from the list or Export to your reference management。
GB/T 7714 | 张丽 , 胡雨轩 . 专业领域论文的批量实体抽取方法及系统 : CN202110260658.6[P]. | 2021-03-10 . |
MLA | 张丽 et al. "专业领域论文的批量实体抽取方法及系统" : CN202110260658.6. | 2021-03-10 . |
APA | 张丽 , 胡雨轩 . 专业领域论文的批量实体抽取方法及系统 : CN202110260658.6. | 2021-03-10 . |
Export to | NoteExpress RIS BibTex |
Export
Results: |
Selected to |
Format: |