• Complex
  • Title
  • Keyword
  • Abstract
  • Scholars
  • Journal
  • ISSN
  • Conference
搜索

Author:

冀俊忠 (冀俊忠.) (Scholars:冀俊忠) | 贝飞 (贝飞.) | 吴晨生 (吴晨生.) | 柴鹰 (柴鹰.) | 宋辰 (宋辰.)

Indexed by:

CQVIP PKU CSCD

Abstract:

针对新闻和微博2组有代表性的语料开展实验研究,旨在发现不同词性特征及其组合对2种通用网络平台话题检测的作用及其影响.研究表明:在选择单一词性特征时,名词特征可得到最好的检测结果,命名实体可在保证准确率的情况下大大降低聚类的特征维度.在选择词性组合作为特征时,名词或命名实体、数词、时间短语、形容词以及量词的组合特征可提升新闻网络话题检测的准确率,而名词或命名实体、形容词、量词、数词以及特殊符号与网址的组合特征可在微博语料上获得较好的检测结果.

Keyword:

词性 微博 文本特征 新闻 话题检测

Author Community:

  • [ 1 ] 北京工业大学计算机学院多媒体与智能软件技术北京市重点实验室
  • [ 2 ] 北京市科学技术情报研究所

Reprint Author's Address:

Email:

Show more details

Related Keywords:

Source :

北京工业大学学报

Year: 2015

Issue: 04

Volume: 41

Page: 526-533

Cited Count:

WoS CC Cited Count: 0

SCOPUS Cited Count:

ESI Highly Cited Papers on the List: 0 Unfold All

WanFang Cited Count:

Chinese Cited Count:

30 Days PV: 14

Online/Total:267/10504959
Address:BJUT Library(100 Pingleyuan,Chaoyang District,Beijing 100124, China Post Code:100124) Contact Us:010-67392185
Copyright:BJUT Library Technical Support:Beijing Aegean Software Co., Ltd.