• Complex
  • Title
  • Keyword
  • Abstract
  • Scholars
  • Journal
  • ISSN
  • Conference
搜索

Author:

李雄 (李雄.) | 丁治明 (丁治明.) (Scholars:丁治明) | 苏醒 (苏醒.) | 郭黎敏 (郭黎敏.)

Indexed by:

CQVIP PKU CSCD

Abstract:

本研究主要解决在大量文本数据中抽取关键语义信息的问题.文本是自然语言的信息载体,在分析和处理文本信息时,由于目标与方式不同,对文本信息的特征表达方式也各不相同.已有的语义抽取方法往往是针对单篇文本的,忽略了不同文本间的语义联系.为此,文中提出了基于词项聚类的文本语义标签提取方法.该方法以语义抽取为目标,以Hinton的分布式表示假说为文本信息的表达方式,并以最大化语义标签与原文本数据间的语义相似度为目标,使用聚类算法对语义标签进行聚类.实验表明,所提方法由于是基于全体词汇表对语义信息分布进行聚类计算的,因此在语义丰富度和表达能力上相比很多现有方法具有更好的表现.

Keyword:

分布式表示假说 聚类 语义抽取 相似度

Author Community:

  • [ 1 ] [李雄]北京工业大学
  • [ 2 ] [丁治明]北京工业大学
  • [ 3 ] [苏醒]北京工业大学
  • [ 4 ] [郭黎敏]北京工业大学

Reprint Author's Address:

Email:

Show more details

Related Keywords:

Related Article:

Source :

计算机科学

ISSN: 1002-137X

Year: 2018

Issue: z2

Volume: 45

Page: 417-421,438

Cited Count:

WoS CC Cited Count: 0

SCOPUS Cited Count:

ESI Highly Cited Papers on the List: 0 Unfold All

WanFang Cited Count: -1

Chinese Cited Count:

30 Days PV: 3

Online/Total:215/10641819
Address:BJUT Library(100 Pingleyuan,Chaoyang District,Beijing 100124, China Post Code:100124) Contact Us:010-67392185
Copyright:BJUT Library Technical Support:Beijing Aegean Software Co., Ltd.