• Complex
  • Title
  • Keyword
  • Abstract
  • Scholars
  • Journal
  • ISSN
  • Conference
搜索

Author:

李玉鑑 (李玉鑑.) | 王曼丽 (王曼丽.)

Indexed by:

incoPat zhihuiya

Abstract:

本发明公开了一种基于组合凸线性感知器的两类文本的分类方法。本发明包括:收集文本数据集,将其划分为训练集和测试集;预处理数据集;提取总词表并统计词频;对训练样本集进行特征选取,得到特征向量表;将数据集中的所有样本特征项赋权值表示成向量;将所有数据降维到低维特征空间,得到组合凸线性感知器最终处理的数据;利用SMA算法构造组合凸线性感知器,从而判断测试样本的类别。本发明结合tf*idf特征提取法和PCA降维方法,使用SMA算法进行两类文本分类,这是首次将组合凸线性感知器应用到文本分类领域,非常具有独创意义。

Keyword:

Reprint Author's Address:

Email:

Show more details

Related Keywords:

Related Article:

Patent Info :

Type: 发明授权

Patent No.: CN201610083975.4

Filing Date: 2016-02-06

Publication Date: 2019-04-19

Pub. No.: CN105760471B

Applicants: 北京工业大学

Legal Status: 未缴年费

Cited Count:

WoS CC Cited Count: 0

SCOPUS Cited Count:

ESI Highly Cited Papers on the List: 0 Unfold All

WanFang Cited Count:

Chinese Cited Count:

30 Days PV: 6

Affiliated Colleges:

Online/Total:736/10592195
Address:BJUT Library(100 Pingleyuan,Chaoyang District,Beijing 100124, China Post Code:100124) Contact Us:010-67392185
Copyright:BJUT Library Technical Support:Beijing Aegean Software Co., Ltd.