• Complex
  • Title
  • Keyword
  • Abstract
  • Scholars
  • Journal
  • ISSN
  • Conference
搜索

Author:

王露瑶 (王露瑶.) | 张涛 (张涛.) (Scholars:张涛) | 陈才 (陈才.) | 朱安琥 (朱安琥.) | 罗启明 (罗启明.)

Indexed by:

CQVIP

Abstract:

<正>TF-IDF算法作为最常见的特征权重计算方法被广泛使用。传统TF-IDF特征提取方法在文本分类任务中缺乏对类之间分布差异的体现。基于此种情况,立足于传统TF-IDF算法中根据词频来选择特征词的特性,本文提出一种新的基于卡方统计的特征词提取算法并通过改进后的新方法对文本分类模型进行评估。实验结果表明,新方法在查准率、查全率、F1值和ROC_AUC等评估结果上较传统特征提取方法有明显优化。

Keyword:

卡方统计 改进的 特征词提取 IDF 文本分类 TF-IDF

Author Community:

  • [ 1 ] 北京工业大学信息学部软件学院

Reprint Author's Address:

Email:

Show more details

Related Keywords:

Related Article:

Source :

电子世界

Year: 2019

Issue: 06

Page: 24-25,28

Cited Count:

WoS CC Cited Count: 0

SCOPUS Cited Count:

ESI Highly Cited Papers on the List: 0 Unfold All

WanFang Cited Count:

Chinese Cited Count:

30 Days PV: 12

Online/Total:394/10515494
Address:BJUT Library(100 Pingleyuan,Chaoyang District,Beijing 100124, China Post Code:100124) Contact Us:010-67392185
Copyright:BJUT Library Technical Support:Beijing Aegean Software Co., Ltd.