• Complex
  • Title
  • Keyword
  • Abstract
  • Scholars
  • Journal
  • ISSN
  • Conference
搜索

Author:

张广朋 (张广朋.) | 张冬明 (张冬明.) | 张菁 (张菁.) | 王川宁 (王川宁.) | 王立冬 (王立冬.) | 邹学强 (邹学强.)

Abstract:

台标是视频的重要语义信息,其检测与识别面临类别多、结构复杂、区域小、信息量低、背景干扰大等难题.为提高模型的泛化能力,提出将台标图像叠加到背景图像中合成台标数据,来构建训练数据集.进一步,提出两阶段可伸缩台标检测与识别(scalable logo detection and recognition,SLDR)方法,其采用batch-hard度量学习方法快速训练匹配模型,确定台标类别.SLDR的检测与识别分离机制使得其可将检测目标扩展到未知类别.实验结果表明,合成数据可以有效提升模型的泛化能力和检测精度.实验亦显示SLDR方法在不更新检测模型的情况下,即可获得与端到端模型相当的精度.

Keyword:

台标检测和识别 可伸缩 度量学习 数据合成

Author Community:

  • [ 1 ] [邹学强]国家计算机网络应急技术处理协调中心
  • [ 2 ] [张菁]北京工业大学
  • [ 3 ] [张广朋]北京工业大学
  • [ 4 ] [王立冬]北京广播电视台
  • [ 5 ] [王川宁]北京工业大学
  • [ 6 ] [张冬明]国家计算机网络应急技术处理协调中心

Reprint Author's Address:

Email:

Show more details

Related Keywords:

Related Article:

Source :

软件学报

ISSN: 1000-9825

Year: 2022

Issue: 9

Volume: 33

Page: 3180-3194

Cited Count:

WoS CC Cited Count:

SCOPUS Cited Count:

ESI Highly Cited Papers on the List: 0 Unfold All

WanFang Cited Count: -1

Chinese Cited Count:

30 Days PV: 0

Online/Total:1420/10839879
Address:BJUT Library(100 Pingleyuan,Chaoyang District,Beijing 100124, China Post Code:100124) Contact Us:010-67392185
Copyright:BJUT Library Technical Support:Beijing Aegean Software Co., Ltd.