• Complex
  • Title
  • Keyword
  • Abstract
  • Scholars
  • Journal
  • ISSN
  • Conference
搜索

Author:

蒋宗礼 (蒋宗礼.) (Scholars:蒋宗礼) | 田晓燕 (田晓燕.) | 赵旭 (赵旭.)

Indexed by:

CQVIP PKU CSCD

Abstract:

海量网页的存在及其量的急速增长使得通用搜索引擎难以为面向主题或领域的查询提供满意结果.本文研究的主题爬虫致力于收集主题相关信息,达到极大降低网页处理量的目的.它通过评价网页的主题相关度,并优先爬取相关度较高的网页.利用一种基于子空间的语义分析技术,并结合贝叶斯以及支持向量机,设计并实现了一个高效的主题爬虫.实验表明,此算法具有很好的准确性和高效性.

Keyword:

子空间 语义分析 支持向量机 主题爬虫

Author Community:

  • [ 1 ] [蒋宗礼]北京工业大学
  • [ 2 ] [田晓燕]北京工业大学
  • [ 3 ] [赵旭]北京工业大学

Reprint Author's Address:

Email:

Show more details

Related Keywords:

Source :

计算机工程与科学

ISSN: 1007-130X

Year: 2010

Issue: 9

Volume: 32

Page: 145-147,151

Cited Count:

WoS CC Cited Count: 0

SCOPUS Cited Count:

ESI Highly Cited Papers on the List: 0 Unfold All

WanFang Cited Count: 19

Chinese Cited Count:

30 Days PV: 13

Online/Total:360/10507294
Address:BJUT Library(100 Pingleyuan,Chaoyang District,Beijing 100124, China Post Code:100124) Contact Us:010-67392185
Copyright:BJUT Library Technical Support:Beijing Aegean Software Co., Ltd.