Abstract:
[目的/意义]新冠病毒出现以来,国内外与新冠病毒研究相关的论文迅猛增长.整理国内外COVID-19相关学术论文,创建针对新冠溯源类论文的数据集和细粒度的实体数据集能为新冠病毒的起源和传播机理等相关研究提供坚实的数据支撑.[方法/过程]提出基于主动学习模型的论文筛选方法,从海量论文中高效精准地定位与新冠溯源相关的论文.同时,设计了一种新冠领域18类实体的标注方案,不仅包含生物领域通有的基因、蛋白质和化合物等实体,还涵盖新冠领域特有的冠状病毒、野生动物等实体.[结果/结论]构建了一个新冠溯源类论文数据集,共包含885篇文章;基于提出的实体标注方案,标注全文本论文99篇,构建了一个细粒度的实体数据集,包含39118个实体,是目前新冠领域规模最大、最全面的实体标注数据集.
Keyword:
Reprint Author's Address:
Email:
Source :
农业图书情报学报
ISSN: 1002-1248
Year: 2023
Issue: 1
Volume: 35
Page: 87-98
Cited Count:
WoS CC Cited Count: 0
SCOPUS Cited Count:
ESI Highly Cited Papers on the List: 0 Unfold All
WanFang Cited Count: -1
Chinese Cited Count:
30 Days PV: 6
Affiliated Colleges: