中信建投申请模型训练方法专利,提高模型的训练效率
金融界
2024-03-31 07:05:16

原标题:中信建投申请模型训练方法专利,提高模型的训练效率

金融界2024年3月29日消息,据国家知识产权局公告,中信建投证券股份有限公司申请一项名为“一种模型训练方法、装置、电子设备以及存储介质“,公开号CN117786104A,申请日期为2023年11月。

专利摘要显示,本发明实施例提供了一种模型训练方法、装置、电子设备以及存储介质,涉及大模型技术领域。具体实现方案为:获取训练数据集;利用待训练的大语言模型中的词嵌入层,对各条训练语料进行编码得到每一训练语料对应的编码矩阵;针对每一训练语料的编码矩阵,利用预测网络按照预设时间步预测该训练语料的对应的训练样本的、关于各个预定类别的初始概率分布,基于初始概率分布中概率最大的类别,执行第一处理方式或第二处理方式,得到预测结果;基于每一训练样本对应的预测结果以及所具有的指定标签,计算模型损失值;基于模型损失值调整大语言模型的参数。可见,通过本方案,可以在满足大语言模型的词向量表达需求的基础上,兼顾模型的训练效率。

来源:金融界

相关内容

热门资讯

国际货币基金组织:人工智能对金... 来源:滚动播报 (来源:经济参考报) 国际货币基金组织近日发布报告称,人工智能(AI)正在改变金融体...
中关村“两院”种下敢闯的种子,... 不久前,一项名为“Gaussian-Pile:基于稀疏三维高斯泼溅的切片式容积重建算法”的成果被国际...
网易加码大世界赛道:逆水寒改名... 什么情况,《逆水寒》手游要重做成大世界了!? 就在昨日,网易正式官宣将要在6月26日,上线旗下爆款...
原创 A... 要说在游戏行业,哪个厂商对AI最上心?许多玩家可能会下意识地选择微软,毕竟后者是OpenAI的大股东...
世嘉确认取消“超级游戏”项目,... IT之家 5 月 12 日消息,据游戏媒体 VGC 今天报道,世嘉确认,尽管“超级游戏”项目遭到取消...