Indexed by:
Abstract:
本发明公开了基于多隐层极限学习机的中文文本分类方法,将正则化极限学习机模型应用到中文文本分类问题中,使用多隐层极限学习机模型对文本进行分类。使用复旦大学中文语料库作为文本分类的训练集和测试集;对文本数据进行预处理等操作,包括:统一编码方式、切词和去除停用词、符号、数字等;使用空间向量模型对文本进行表示,将数据集转换成文本矩阵;使用多隐层极限学习机对文本进行分类,其中包括文本降维、特征映射和文本分类。文本降维:将高维文本数据转换成可以进行计算的低维文本数据。使用多隐层极限学习机的多隐层结果对文本的特征进行映射,进行高层特征表示。使用多隐层极限学习机中的正则化极限学习机对文本进行分类。
Keyword:
Reprint Author's Address:
Email:
Patent Info :
Type: 发明申请
Patent No.: CN201710665695.9
Filing Date: 2017-08-07
Publication Date: 2017-12-08
Pub. No.: CN107451278A
Applicants: 北京工业大学
Legal Status: 驳回
Cited Count:
WoS CC Cited Count: 0
SCOPUS Cited Count:
ESI Highly Cited Papers on the List: 0 Unfold All
WanFang Cited Count:
Chinese Cited Count:
30 Days PV: 4
Affiliated Colleges: