• Complex
  • Title
  • Keyword
  • Abstract
  • Scholars
  • Journal
  • ISSN
  • Conference
搜索

Author:

王慧玲 (王慧玲.) | 宋柔 (宋柔.) | 戴伟长 (戴伟长.)

Abstract:

有导文本分类是指在给定的分类体系下,通过对训练语料的学习对每个类建立特征向量以表示该类,然后对每一个新的文本自动确定其类别的过程.本文介绍的文本分类的目的不是按专业领域对文本分类,而是按语体对文本分类.这种分类研究对于统计语言模型的训练具有重要意义.本文以汉字的字频向量作为语体类别的表示方法,通过计算类别向量与文本向量的相似度来确定文本的类别.已应用该方法对几种不同语体的小说分类,取得了较好的分类结果.

Keyword:

语体 向量空间模型 文本分类

Author Community:

  • [ 1 ] 北京工业大学
  • [ 2 ] 北京语言文化大学

Reprint Author's Address:

Email:

Show more details

Related Keywords:

Source :

Year: 2001

Language: Chinese

Cited Count:

WoS CC Cited Count: 0

SCOPUS Cited Count:

ESI Highly Cited Papers on the List: 0 Unfold All

WanFang Cited Count:

Chinese Cited Count:

30 Days PV: 6

Affiliated Colleges:

Online/Total:451/10624651
Address:BJUT Library(100 Pingleyuan,Chaoyang District,Beijing 100124, China Post Code:100124) Contact Us:010-67392185
Copyright:BJUT Library Technical Support:Beijing Aegean Software Co., Ltd.