Indexed by:
Abstract:
本发明提出一种用于金融仓单风险控制的网络爬虫方法,采用双布隆过滤器关键词匹配,实现对网络爬虫信息中包含货物信息结果的快速筛选;基于分类匹配方式实现对相同类别货物的精准分类,并结合阈值比较规则,实现对新货物类别的自动添加;基于消息机制,实现整个处理过程前后端任务的负载均衡,保证处理过程的可控性和效率最大化,防止局部热点。采用本发明的技术方案,可以实现对金融仓单抵押货物信息的高效爬取和精确筛选。
Keyword:
Reprint Author's Address:
Email:
Patent Info :
Type: 发明授权
Patent No.: CN201610465637.7
Filing Date: 2016-06-23
Publication Date: 2021-01-05
Pub. No.: CN106096008B
Applicants: 北京工业大学
Legal Status: 未缴年费
Cited Count:
WoS CC Cited Count: 0
SCOPUS Cited Count:
ESI Highly Cited Papers on the List: 0 Unfold All
WanFang Cited Count:
Chinese Cited Count:
30 Days PV: 4
Affiliated Colleges: