专利摘要显示,本申请涉及一种模型训练方法、下游任务的处理方法及装置、和电子设备,该方法包括:基于初始训练样本,生成第一训练样本;其中,第一训练样本中包括初始训练样本的类别信息、初始训练样本对应的第一文本单元集、及初始训练样本对应的类别信息集;对第一训练样本进行掩码处理,得到第二训练样本;利用第一模型对第二训练样本进行掩码预测,得到第二文本单元集;基于第二文本单元集,对第一模型的模型参数进行至少一次更新,得到训练后的第一模型。本申请通过在样本中引入各个文本单元的类别信息对模型进行训练,模型可以学习到文本单元的类别信息和上下文之间的关联,使得训练后的模型能够对各种语料进行精准识别,从而提升用户的体验。
本文源自金融界
工作时间:8:00-18:00
电子邮件
扫码二维码
获取最新动态