• Complex
  • Title
  • Keyword
  • Abstract
  • Scholars
  • Journal
  • ISSN
  • Conference
搜索

Author:

谢前前 (谢前前.) | 李欣 (李欣.) (Scholars:李欣) | 黄鲁成 (黄鲁成.) (Scholars:黄鲁成)

Indexed by:

incoPat zhihuiya

Abstract:

一种文本语义分析方法与系统,可实现对文本数据基于词汇层面、句子层面的语义分析。针对词汇层面的语义分析,本发明首先采用改进分词算法,解决英文仅以空格分词带来的不足;其次基于分词基础进行TF‑IDF建模,得到权重值;然后将权重值与Word2Vec训练得到的词向量进行加权求和将文本向量化,最后求解文档相似度。本发明同时考虑词汇对文档内容贡献度和语义地位计算文档相似度,结果具有更高准确度,为后续的文本聚类提供良好的基础。针对句子层面的语义分析,本发明以文本分词、词性标注、句法分析、依存关系为基础,进行主谓宾结构提取。本发明实现了全方面、多种句子类型的主谓宾结构提取,并实现了名词扩展功能,更符合人工提取结果。

Keyword:

Reprint Author's Address:

Email:

Show more details

Related Keywords:

Related Article:

Patent Info :

Type: 发明授权

Patent No.: CN201811012430.X

Filing Date: 2018-08-31

Publication Date: 2023-09-26

Pub. No.: CN109271626B

Applicants: 北京工业大学

Legal Status: 授权

Cited Count:

WoS CC Cited Count: 0

SCOPUS Cited Count:

ESI Highly Cited Papers on the List: 0 Unfold All

WanFang Cited Count:

Chinese Cited Count:

30 Days PV: 0

Online/Total:1549/10958175
Address:BJUT Library(100 Pingleyuan,Chaoyang District,Beijing 100124, China Post Code:100124) Contact Us:010-67392185
Copyright:BJUT Library Technical Support:Beijing Aegean Software Co., Ltd.