Indexed by:
Abstract:
研究了一种能够实现对数据型网页中信息实施实时采集的信息技术.该技术能够智能识别表格结构,自动分离数据项,在对数据项的分析判断过程中,采用从单词上分类(By Words)和从表格排列方式(ByStructure)划分相结合的方法,以Ontology思想为支撑,融合支持向量机算法(SVM)和隐马尔可夫模型(HMM)等一系列成熟模型.最后通过测试并将该技术应用于TBT预警信息动态采集子系统中,收到良好效果.
Keyword:
Reprint Author's Address:
Email:
Source :
现代图书情报技术
ISSN: 1003-3513
Year: 2005
Issue: 9
Page: 76-79
Cited Count:
WoS CC Cited Count: 0
SCOPUS Cited Count:
ESI Highly Cited Papers on the List: 0 Unfold All
WanFang Cited Count: 3
Chinese Cited Count:
30 Days PV: 1
Affiliated Colleges: