Indexed by:
Abstract:
中文自然语言处理中专业领域分词的难度远远高于通用领域.特别是在专业领域的分词歧义方面,一直没有找到有效的解决方法.针对该问题提出基于无监督学习的专业领域分词歧义消解方法.以测试语料自身的字符串频次信息、互信息、边界熵信息为分词歧义的评价标准,独立、组合地使用这三种信息解决分词歧义问题.实验结果显示该方法可以有效消解专业领域的分词歧义,并明显提高分词效果.
Keyword:
Reprint Author's Address:
Email:
Source :
计算机应用
ISSN: 1001-9081
Year: 2013
Issue: 3
Volume: 33
Page: 780-783
Cited Count:
WoS CC Cited Count: 0
SCOPUS Cited Count:
ESI Highly Cited Papers on the List: 0 Unfold All
WanFang Cited Count: 16
Chinese Cited Count:
30 Days PV: 0
Affiliated Colleges: