• Complex
  • Title
  • Keyword
  • Abstract
  • Scholars
  • Journal
  • ISSN
  • Conference
搜索

Author:

张文 (张文.) | 王强 (王强.) | 唐子旭 (唐子旭.) | 秦广杰 (秦广杰.) | 李健 (李健.)

Abstract:

机器学习相关技术的发展提升了在线虚假评论识别的准确率,然而现阶段机器学习模型缺少足够量的已标注数据来进行模型训练.本文基于生成式对抗网络(GAN)提出了评论数据集扩充方法GAN-RDE(GAN-Review Dataset Expansion)以解决虚假评论识别中模型训练数据贫乏问题.具体而言,首先将初始评论数据划分为真实评论数据集和虚假评论数据集,使用真实评论数据集和虚假评论数据集分别训练GAN,生成符合真实评论与虚假评论特征分布的向量.然后将GAN训练得到的符合评论特征分布的向量与初始评论数据集的特征词词向量矩阵进行合并,扩充模型训练数据.最后,利用朴素贝叶斯、多层感知机和支持向量机作为基础分类器,对比数据扩充前后虚假评论识别的效果.实验结果表明,使用GAN-RDE方法扩充评论数据集后,机器学习模型对虚假评论识别准确率得到显著提升.

Keyword:

虚假评论 支持向量机 多层感知机 生成式对抗网络 机器学习

Author Community:

  • [ 1 ] [王强]北京工业大学
  • [ 2 ] [唐子旭]北京工业大学
  • [ 3 ] [秦广杰]山东浪潮新基建科技有限公司,山东 济南 250011
  • [ 4 ] [张文]北京工业大学
  • [ 5 ] [李健]北京工业大学

Reprint Author's Address:

Email:

Show more details

Related Keywords:

Source :

运筹与管理

ISSN: 1007-3221

Year: 2022

Issue: 11

Volume: 31

Page: 167-173

Cited Count:

WoS CC Cited Count: 0

SCOPUS Cited Count:

ESI Highly Cited Papers on the List: 0 Unfold All

WanFang Cited Count: -1

Chinese Cited Count:

30 Days PV: 12

Affiliated Colleges:

Online/Total:559/10563235
Address:BJUT Library(100 Pingleyuan,Chaoyang District,Beijing 100124, China Post Code:100124) Contact Us:010-67392185
Copyright:BJUT Library Technical Support:Beijing Aegean Software Co., Ltd.