在线虚假评论识别中的数据贫乏问题研究 - Details

Author：

张文 (张文.) | 王强 (王强.) | 唐子旭 (唐子旭.) | 秦广杰 (秦广杰.) | 李健 (李健.)

Abstract：

机器学习相关技术的发展提升了在线虚假评论识别的准确率,然而现阶段机器学习模型缺少足够量的已标注数据来进行模型训练.本文基于生成式对抗网络(GAN)提出了评论数据集扩充方法GAN-RDE(GAN-Review　Dataset　Expansion)以解决虚假评论识别中模型训练数据贫乏问题.具体而言,首先将初始评论数据划分为真实评论数据集和虚假评论数据集,使用真实评论数据集和虚假评论数据集分别训练GAN,生成符合真实评论与虚假评论特征分布的向量.然后将GAN训练得到的符合评论特征分布的向量与初始评论数据集的特征词词向量矩阵进行合并,扩充模型训练数据.最后,利用朴素贝叶斯、多层感知机和支持向量机作为基础分类器,对比数据扩充前后虚假评论识别的效果.实验结果表明,使用GAN-RDE方法扩充评论数据集后,机器学习模型对虚假评论识别准确率得到显著提升.

Keyword：

虚假评论支持向量机多层感知机生成式对抗网络机器学习

Author Community：

[ 1 ] [王强]北京工业大学
[ 2 ] [唐子旭]北京工业大学
[ 3 ] [秦广杰]山东浪潮新基建科技有限公司,山东济南 250011
[ 4 ] [张文]北京工业大学
[ 5 ] [李健]北京工业大学

Reprint Author's Address：

Email：

Show more details

Related Keywords：

基于生成对抗网络-支持向量机的冷水机组故障诊断方法
2022，
基于Co-training协同训练的在线虚假评论识别研究
2020，系统工程理论与实践
在线商品虚假评论发布动机及形成机理研究
2022，中国管理科学
基于中心损失的条件生成式对抗网络的冷水机组故障诊断
2022，化工学报

Source ：

运筹与管理

ISSN： 1007-3221

Year： 2022

Issue： 11

Volume： 31

Page： 167-173

Cited Count：

WoS CC Cited Count： 0

SCOPUS Cited Count：

ESI Highly Cited Papers on the List： 0 Unfold All

WanFang Cited Count： -1

Chinese Cited Count：

30 Days PV： 12

Affiliated Colleges：

学院待认领

Get Fulltext

Library Discovery Baidu Scholar Search WF WF WF WF WF WF WF WF

Type
Departments

All Years Choose Year From to