金融界2023年12月5日消息,据国家知识产权局公告,华为云计算技术有限公司申请一项名为“一种模型训练方法及相关设备“,公开号CN117171554A,申请日期为2022年5月。
专利摘要显示,本申请提供了一种模型训练方法,包括:获取第一基础模型的特征向量层参数,以及获取对齐矩阵,该第一基础模型为利用第一训练集预训练好的基础模型,然后根据第一基础模型的特征向量层参数和对齐矩阵,对第二基础模型的特征向量层参数进行初始化,接着利用第二训练集训练初始化后的第二基础模型。该方法通过对齐矩阵将第一基础模型的特征向量层参数迁移学习至第二基础模型的特征向量层进行初始化,由此可以加快训练进度,提高训练效率,提升训练效果。
来源:金融界