Indexed by:
Abstract:
文本分类是自然语言处理的典型应用,一般采用卷积神经网络、双向长短期记忆网络等分类方法。基于语义网络和信息融合原理,研究工作提出了一种融合上下文特征、局部特征和平均表示特征等多特征的长文本分类方法。多特征融合方法需要清洗长文本并将文本表示为词向量,预处理后的定长文本词向量输入模型层;在模型层聚类提取特征,用双向长短期记忆网络提取词的上下文特征,用卷积神经网络提取词的局部特征,用平均池化模型提取词的平均表示特征;在线性层融合文本内容的这些信息特征并分类。经大量数据集实验,多特征融合方法分类准确率统计可达98.3%。
Keyword:
Reprint Author's Address:
Email:
Source :
中国电子科学研究院学报
Year: 2020
Issue: 09
Volume: 15
Page: 910-916
Cited Count:
WoS CC Cited Count: 0
SCOPUS Cited Count:
ESI Highly Cited Papers on the List: 0 Unfold All
WanFang Cited Count:
Chinese Cited Count:
30 Days PV: 11
Affiliated Colleges: