Indexed by:
Abstract:
一种文本语义分析方法与系统,可实现对文本数据基于词汇层面、句子层面的语义分析。针对词汇层面的语义分析,本发明首先采用改进分词算法,解决英文仅以空格分词带来的不足;其次基于分词基础进行TF‑IDF建模,得到权重值;然后将权重值与Word2Vec训练得到的词向量进行加权求和将文本向量化,最后求解文档相似度。本发明同时考虑词汇对文档内容贡献度和语义地位计算文档相似度,结果具有更高准确度,为后续的文本聚类提供良好的基础。针对句子层面的语义分析,本发明以文本分词、词性标注、句法分析、依存关系为基础,进行主谓宾结构提取。本发明实现了全方面、多种句子类型的主谓宾结构提取,并实现了名词扩展功能,更符合人工提取结果。
Keyword:
Reprint Author's Address:
Email:
Patent Info :
Type: 发明授权
Patent No.: CN201811012430.X
Filing Date: 2018-08-31
Publication Date: 2023-09-26
Pub. No.: CN109271626B
Applicants: 北京工业大学
Legal Status: 授权
Cited Count:
WoS CC Cited Count: 0
SCOPUS Cited Count:
ESI Highly Cited Papers on the List: 0 Unfold All
WanFang Cited Count:
Chinese Cited Count:
30 Days PV: 0
Affiliated Colleges: