Indexed by:
Abstract:
汉语标点句句首话题缺失是机器翻译、信息抽取准确率不高的原因之一.该文从广义话题理论出发,根据汉语话题结构的特点,提出标点句的话题句识别研究方案,包括两个阶段性任务:单个标点句的话题句识别和序列标点句的话题句序列构建.识别出标点句的话题句也就找到了标点句句首缺失的话题.该文解决单个标点句的话题句识别任务,主要采用语义泛化和编辑距离两种手段.实验中开放测试的准确率比基线高出12.51个百分点.该结果说明,运用广义话题理论进行单个标点句的话题句识别可产生明显的效果.
Keyword:
Reprint Author's Address:
Email:
Source :
中文信息学报
ISSN: 1003-0077
Year: 2012
Issue: 5
Volume: 26
Page: 114-119,128
Cited Count:
WoS CC Cited Count: 0
SCOPUS Cited Count:
ESI Highly Cited Papers on the List: 0 Unfold All
WanFang Cited Count: 13
Chinese Cited Count:
30 Days PV: 2
Affiliated Colleges: