Indexed by:
Abstract:
为了对半结构化文本实现自动抽取信息,介绍了一种基于Boosting算法的信息抽取方法,它能够自动对一个训练例生成规则,将该规则应用于正例集并改变正例集权重分布,找到权重最大的正例生成下一条规则. 给出了一种能描述不符合英文词法的词的模式匹配约束. 试验表明:在特征简单的抽取规则学习中,该方法精确度与召回率可达100%,在特征比较复杂的抽取规则学习中,该方法F1评估值也能达到80%以上.
Keyword:
Reprint Author's Address:
Email:
Source :
北京工业大学学报
ISSN: 0254-0037
Year: 2005
Issue: 2
Volume: 31
Page: 199-203
Cited Count:
WoS CC Cited Count: 0
SCOPUS Cited Count:
ESI Highly Cited Papers on the List: 0 Unfold All
WanFang Cited Count: 2
Chinese Cited Count:
30 Days PV: 10
Affiliated Colleges: