基于词项聚类的文本语义标签抽取研究 - Details

Author：

李雄 (李雄.) | 丁治明 (丁治明.) (Scholars：丁治明) | 苏醒 (苏醒.) | 郭黎敏 (郭黎敏.)

Indexed by：

CQVIP PKU CSCD

Abstract：

本研究主要解决在大量文本数据中抽取关键语义信息的问题.文本是自然语言的信息载体,在分析和处理文本信息时,由于目标与方式不同,对文本信息的特征表达方式也各不相同.已有的语义抽取方法往往是针对单篇文本的,忽略了不同文本间的语义联系.为此,文中提出了基于词项聚类的文本语义标签提取方法.该方法以语义抽取为目标,以Hinton的分布式表示假说为文本信息的表达方式,并以最大化语义标签与原文本数据间的语义相似度为目标,使用聚类算法对语义标签进行聚类.实验表明,所提方法由于是基于全体词汇表对语义信息分布进行聚类计算的,因此在语义丰富度和表达能力上相比很多现有方法具有更好的表现.

Keyword：

分布式表示假说聚类语义抽取相似度

Author Community：

[ 1 ] [李雄]北京工业大学
[ 2 ] [丁治明]北京工业大学
[ 3 ] [苏醒]北京工业大学
[ 4 ] [郭黎敏]北京工业大学

Reprint Author's Address：

Email：

Show more details

Related Keywords：

基于LDA主题模型的文本相似度计算
2013，计算机科学
基于LDA主题模型的文本相似度计算
2013，第四届全国智能信息处理学术会议
一种多视数据子空间聚类方法
2020，
基于模糊聚类的文本分类器
2006，微电子学与计算机

Source ：

计算机科学

ISSN： 1002-137X

Year： 2018

Issue： z2

Volume： 45

Page： 417-421,438

Cited Count：

WoS CC Cited Count： 0

SCOPUS Cited Count：

ESI Highly Cited Papers on the List： 0 Unfold All

WanFang Cited Count： -1

Chinese Cited Count：

30 Days PV： 3

Affiliated Colleges：

信息科学技术学院本学院/部未明确归属的数据

Get Fulltext

Library Discovery Baidu Scholar Search WF

Type
Departments

All Years Choose Year From to