• Complex
  • Title
  • Keyword
  • Abstract
  • Scholars
  • Journal
  • ISSN
  • Conference
搜索

Author:

蒋宗礼 (蒋宗礼.) (Scholars:蒋宗礼) | 徐学可 (徐学可.) | 李帅 (李帅.)

Indexed by:

CQVIP PKU CSCD

Abstract:

特征抽取是文本分类的重要研究领域,针对原始特征空间的高维性与稀疏性给分类算法带来"维数灾难"问题,探讨了基于词条聚合的特征抽取方法,设计了一种利用词条聚合进行特征抽取的文本分类的方案.该方案利用改进的树型动态自组织映射(TGSOM)进行词条聚合,并根据聚合特征的特点,考虑所包含的词条的文档频率的不同和区分文档类别属性的能力的不同,提出了一种新权重计算方法,最后利用SPR INT决策树算法进行分类,实验表明该方法比普通方法分类精度提高4.32%.

Keyword:

权重计算 词条聚合 TGSOM 特征抽取

Author Community:

  • [ 1 ] 北京工业大学计算机学院
  • [ 2 ] 清华大学电子工程系

Reprint Author's Address:

Email:

Show more details

Related Keywords:

Source :

哈尔滨工程大学学报

Year: 2008

Issue: 11

Volume: 29

Page: 1205-1209

Cited Count:

WoS CC Cited Count: 0

SCOPUS Cited Count:

ESI Highly Cited Papers on the List: 0 Unfold All

WanFang Cited Count:

Chinese Cited Count:

30 Days PV: 5

Online/Total:1108/10577360
Address:BJUT Library(100 Pingleyuan,Chaoyang District,Beijing 100124, China Post Code:100124) Contact Us:010-67392185
Copyright:BJUT Library Technical Support:Beijing Aegean Software Co., Ltd.