• Complex
  • Title
  • Keyword
  • Abstract
  • Scholars
  • Journal
  • ISSN
  • Conference
搜索

Author:

罗智勇 (罗智勇.) | 宋柔 (宋柔.)

Indexed by:

CQVIP PKU CSCD

Abstract:

专名识别技术是影响中文自动分词精度的一个重要方面,也是自动分词技术的难点之一.本文以人名识别为例,分析了目前流行的基于语料库和统计语言模型的专名识别方法中在概率估值问题上存在的弊端;同时在规则和统计相结合的基础上,提出了一种基于可信度的人名识别方法,并给出了一个渐进式模型训练方法,克服了人工标注语料库规模的限制.从我们对<人民日报>1998年1月、2000年12月(共约379万字)语料的测试结果来看,基于可信度的人名识别方法比传统的概率估值方法识别效果有一定的提高.

Keyword:

中文信息处理 可信度 人名识别 统计方法 自动分词 计算机应用

Author Community:

  • [ 1 ] [罗智勇]北京工业大学
  • [ 2 ] [宋柔]北京语言大学

Reprint Author's Address:

Email:

Show more details

Related Keywords:

Source :

中文信息学报

ISSN: 1003-0077

Year: 2005

Issue: 3

Volume: 19

Page: 67-72,86

Cited Count:

WoS CC Cited Count: 0

SCOPUS Cited Count:

ESI Highly Cited Papers on the List: 0 Unfold All

WanFang Cited Count: 51

Chinese Cited Count:

30 Days PV: 20

Affiliated Colleges:

Online/Total:836/10547911
Address:BJUT Library(100 Pingleyuan,Chaoyang District,Beijing 100124, China Post Code:100124) Contact Us:010-67392185
Copyright:BJUT Library Technical Support:Beijing Aegean Software Co., Ltd.