• Complex
  • Title
  • Keyword
  • Abstract
  • Scholars
  • Journal
  • ISSN
  • Conference
搜索

Author:

许勇 (许勇.) | 宋柔 (宋柔.)

Abstract:

在百科全书条目文本中,往往以几个不同的侧面说明一个条目,一个侧面构成有关这一条目的一个知识点。属于同一个类型的条目文本中总是重复出现有限的几个知识点,这些知识点构成了有关该类型的知识点集合,并且这些知识点在该类型中不同的条目文本中的分布有较强的规律性。在条目文本中划分出这些知识点是百科全书中知识提取过程的重要一环。本文中提出了一种基于隐马尔科夫(HMM)模型的划分方法,利用知识点在条目文本中的转移规律以及知识点的词特征分布来判断每个句子的知识点类别,从而达到划分知识点的目的。实验表明这个方法能取得较好的结果,在《中国大百科全书》地理卷的中国县市类型的条目文本中的实验结果的正确率为91.8%。

Keyword:

HMM 自然语言处理 百科辞典知识获取

Author Community:

  • [ 1 ] 北京工业大学计算机学院
  • [ 2 ] 北京语言大学计算机系

Reprint Author's Address:

Email:

Show more details

Related Keywords:

Related Article:

Source :

Year: 2004

Language: Chinese

Cited Count:

WoS CC Cited Count: 0

SCOPUS Cited Count:

ESI Highly Cited Papers on the List: 0 Unfold All

WanFang Cited Count:

Chinese Cited Count:

30 Days PV: 11

Online/Total:645/10572460
Address:BJUT Library(100 Pingleyuan,Chaoyang District,Beijing 100124, China Post Code:100124) Contact Us:010-67392185
Copyright:BJUT Library Technical Support:Beijing Aegean Software Co., Ltd.