• Complex
  • Title
  • Keyword
  • Abstract
  • Scholars
  • Journal
  • ISSN
  • Conference
搜索

Author:

杨震 (杨震.) (Scholars:杨震) | 王来涛 (王来涛.) | 赖英旭 (赖英旭.) (Scholars:赖英旭) | 高凯明 (高凯明.) | 张龙伯 (张龙伯.) | 段立娟 (段立娟.) (Scholars:段立娟) | 范科峰 (范科峰.)

Indexed by:

incoPat zhihuiya

Abstract:

基于语言实义单元数估计的短文本间文本距离的计算方法属于中文短文本信心处理领域,其特征在于,这是用于处理在线评论短文本文本聚类的方法,先去除网页标记,并进行短文本规范化处理,再进行分词处理,将文本转化为词语串,在此基础上以词语为单位,计算两个句子的编辑距离,然后将句子中具有实质意义的词语数定义为实义单元,利用Heap’s法则对句子中的实义单元进行估计,再选择两个句子的实义单元数中较大的实义单元数,用较大的实义单元数对用编辑距离表示的文本距离进行文本长度惩罚,得到一个经过实义单元数惩罚的文本距离,本发明克服了传统方法中利用原始句长处理而带来的误差。

Keyword:

Reprint Author's Address:

Email:

Show more details

Related Keywords:

Related Article:

Patent Info :

Type: 发明授权

Patent No.: CN201210012475.3

Filing Date: 2012-01-16

Publication Date: 2013-08-21

Pub. No.: CN102622405B

Applicants: 北京工业大学

Legal Status: 授权 ; 许可

Cited Count:

WoS CC Cited Count: 0

SCOPUS Cited Count:

ESI Highly Cited Papers on the List: 0 Unfold All

WanFang Cited Count:

Chinese Cited Count:

30 Days PV: 12

Online/Total:461/10586374
Address:BJUT Library(100 Pingleyuan,Chaoyang District,Beijing 100124, China Post Code:100124) Contact Us:010-67392185
Copyright:BJUT Library Technical Support:Beijing Aegean Software Co., Ltd.