• Complex
  • Title
  • Keyword
  • Abstract
  • Scholars
  • Journal
  • ISSN
  • Conference
搜索

Author:

翟东升 (翟东升.) (Scholars:翟东升) | 余旸 (余旸.) | 李莉 (李莉.)

Indexed by:

CQVIP PKU CSSCI

Abstract:

研究了一种能够实现对数据型网页中信息实施实时采集的信息技术.该技术能够智能识别表格结构,自动分离数据项,在对数据项的分析判断过程中,采用从单词上分类(By Words)和从表格排列方式(ByStructure)划分相结合的方法,以Ontology思想为支撑,融合支持向量机算法(SVM)和隐马尔可夫模型(HMM)等一系列成熟模型.最后通过测试并将该技术应用于TBT预警信息动态采集子系统中,收到良好效果.

Keyword:

TBT 本体 信息抽取

Author Community:

  • [ 1 ] [翟东升]北京工业大学
  • [ 2 ] [余旸]北京工业大学
  • [ 3 ] [李莉]北京工业大学

Reprint Author's Address:

Email:

Show more details

Related Keywords:

Source :

现代图书情报技术

ISSN: 1003-3513

Year: 2005

Issue: 9

Page: 76-79

Cited Count:

WoS CC Cited Count: 0

SCOPUS Cited Count:

ESI Highly Cited Papers on the List: 0 Unfold All

WanFang Cited Count: 3

Chinese Cited Count:

30 Days PV: 1

Online/Total:515/10572968
Address:BJUT Library(100 Pingleyuan,Chaoyang District,Beijing 100124, China Post Code:100124) Contact Us:010-67392185
Copyright:BJUT Library Technical Support:Beijing Aegean Software Co., Ltd.