Indexed by:
Abstract:
本发明公开了一种面向企业内网的智能搜索引擎系统,分为采集器构建模块、采集器管理模块、数据管理模块、自然语言处理模块、检索模块和日志模块六大模块。采集器构建模块和采集器管理模块负责构造、管理一系列的采集器。采集器则负责按照预定流程采集、清洗、索引、入库数据。数据管理模块则为管理员提供了一个图形化的管理平台。自然语言处理模块提供文档向量化和文档相似度计算服务。检索模块接收到用户的查询请求之后通过和自然语言处理模块、ElasticSearch索引库交互,检索得到一系列和用户请求相关的文档,并按照相关性大小进行排序之后返回给用户。本发明能够快速搭建出采集器,方便搜索引擎系统快速的对接到现有系统,实现高效、准确的信息检索。
Keyword:
Reprint Author's Address:
Email:
Patent Info :
Type: 发明申请
Patent No.: CN202410087491.1
Filing Date: 2024-01-22
Publication Date: 2024-04-16
Pub. No.: CN117891804A
Applicants: 北京工业大学
Legal Status: 实质审查
Cited Count:
SCOPUS Cited Count:
ESI Highly Cited Papers on the List: 0 Unfold All
WanFang Cited Count:
Chinese Cited Count:
30 Days PV: 0
Affiliated Colleges: