• Complex
  • Title
  • Keyword
  • Abstract
  • Scholars
  • Journal
  • ISSN
  • Conference
搜索

Author:

刘椿年 (刘椿年.) | 宋霞 (宋霞.)

Indexed by:

CQVIP PKU CSCD

Abstract:

为了对半结构化文本实现自动抽取信息,介绍了一种基于Boosting算法的信息抽取方法,它能够自动对一个训练例生成规则,将该规则应用于正例集并改变正例集权重分布,找到权重最大的正例生成下一条规则. 给出了一种能描述不符合英文词法的词的模式匹配约束. 试验表明:在特征简单的抽取规则学习中,该方法精确度与召回率可达100%,在特征比较复杂的抽取规则学习中,该方法F1评估值也能达到80%以上.

Keyword:

半结构化文本 抽取规则 Boosting算法

Author Community:

  • [ 1 ] [刘椿年]北京工业大学
  • [ 2 ] [宋霞]北京工业大学

Reprint Author's Address:

Email:

Show more details

Related Keywords:

Source :

北京工业大学学报

ISSN: 0254-0037

Year: 2005

Issue: 2

Volume: 31

Page: 199-203

Cited Count:

WoS CC Cited Count: 0

SCOPUS Cited Count:

ESI Highly Cited Papers on the List: 0 Unfold All

WanFang Cited Count: 2

Chinese Cited Count:

30 Days PV: 10

Affiliated Colleges:

Online/Total:428/10651464
Address:BJUT Library(100 Pingleyuan,Chaoyang District,Beijing 100124, China Post Code:100124) Contact Us:010-67392185
Copyright:BJUT Library Technical Support:Beijing Aegean Software Co., Ltd.