Indexed by:
Abstract:
面向敏感网页识别,设计并实现了一种网页内容获取方案.该方案主要包括HTML(Hypertext Markup Language)源文件的获取、文本获取、图像获取及穿插其中的HTML源文件解析等4部分内容.测试结果表明,无论是中文网页还是英文网页,本设计方案均能获得网页上的文本和图像内容信息,所获取的内容可以满足后续敏感网页识别的应用需求.
Keyword:
Reprint Author's Address:
Email:
Source :
测控技术
ISSN: 1000-8829
Year: 2009
Issue: 5
Volume: 28
Page: 24-27
Cited Count:
WoS CC Cited Count: 0
SCOPUS Cited Count:
ESI Highly Cited Papers on the List: 0 Unfold All
WanFang Cited Count: 4
Chinese Cited Count:
30 Days PV: 11
Affiliated Colleges: