• Complex
  • Title
  • Keyword
  • Abstract
  • Scholars
  • Journal
  • ISSN
  • Conference
搜索

Author:

王辰成 (王辰成.) | 杨麟儿 (杨麟儿.) | 王莹莹 (王莹莹.) | 杜永萍 (杜永萍.) (Scholars:杜永萍) | 杨尔弘 (杨尔弘.)

Indexed by:

CQVIP CSCD

Abstract:

语法纠错任务是自然语言处理领域的一项重要任务,近年来受到了学术界广泛关注.该任务旨在自动识别并纠正文本中所包含的语法、拼写以及语序错误等.该文将语法纠错任务看作是翻译任务,即将带有错误表达的文本翻译成正确的文本,采用基于多头注意力机制的Transformer模型作为纠错模型,并提出了一种动态残差结构,动态结合不同神经模块的输出来增强模型捕获语义信息的能力.受限于目前训练语料不足的情况,该文提出了一种数据增强方法,通过对单语语料的腐化从而生成更多的纠错数据,进一步提高模型的性能.实验结果表明,该文所提出的基于动态残差的模型增强以及腐化语料的数据增强方法对纠错性能有着较大的提升,在NLPCC 2018中文语法纠错共享评测数据上达到了最优性能.

Keyword:

数据增强 多头注意力 动态残差结构 语法纠错

Author Community:

  • [ 1 ] [王辰成]北京工业大学 信息学部,北京 100124;北京语言大学 语言资源高精尖创新中心,北京 100083
  • [ 2 ] [杨麟儿]北京语言大学 语言资源高精尖创新中心,北京 100083;北京语言大学 信息科学学院,北京 100083
  • [ 3 ] [王莹莹]北京语言大学 语言资源高精尖创新中心,北京 100083;北京语言大学 信息科学学院,北京 100083
  • [ 4 ] [杜永萍]北京工业大学
  • [ 5 ] [杨尔弘]北京语言大学 语言资源高精尖创新中心,北京 100083;北京语言大学 信息科学学院,北京 100083

Reprint Author's Address:

Email:

Show more details

Related Keywords:

Related Article:

Source :

中文信息学报

ISSN: 1003-0077

Year: 2020

Issue: 6

Volume: 34

Page: 106-114

Cited Count:

WoS CC Cited Count:

SCOPUS Cited Count:

ESI Highly Cited Papers on the List: 0 Unfold All

WanFang Cited Count: -1

Chinese Cited Count:

30 Days PV: 7

Online/Total:378/10499588
Address:BJUT Library(100 Pingleyuan,Chaoyang District,Beijing 100124, China Post Code:100124) Contact Us:010-67392185
Copyright:BJUT Library Technical Support:Beijing Aegean Software Co., Ltd.