中信建投申请模型训练方法专利,提高模型的训练效率
金融界
2024-03-31 07:05:16

原标题:中信建投申请模型训练方法专利,提高模型的训练效率

金融界2024年3月29日消息,据国家知识产权局公告,中信建投证券股份有限公司申请一项名为“一种模型训练方法、装置、电子设备以及存储介质“,公开号CN117786104A,申请日期为2023年11月。

专利摘要显示,本发明实施例提供了一种模型训练方法、装置、电子设备以及存储介质,涉及大模型技术领域。具体实现方案为:获取训练数据集;利用待训练的大语言模型中的词嵌入层,对各条训练语料进行编码得到每一训练语料对应的编码矩阵;针对每一训练语料的编码矩阵,利用预测网络按照预设时间步预测该训练语料的对应的训练样本的、关于各个预定类别的初始概率分布,基于初始概率分布中概率最大的类别,执行第一处理方式或第二处理方式,得到预测结果;基于每一训练样本对应的预测结果以及所具有的指定标签,计算模型损失值;基于模型损失值调整大语言模型的参数。可见,通过本方案,可以在满足大语言模型的词向量表达需求的基础上,兼顾模型的训练效率。

来源:金融界

相关内容

热门资讯

原创 赌... 在本月初,YY直播官宣引进一家超大型公会“星耀未来”入驻,并且该公会的幕后老板还是星竞威武集团董事长...
大华技术申请对象识别方法专利,... 国家知识产权局信息显示,浙江大华技术股份有限公司申请一项名为“对象识别方法、电子设备以及存储介质”的...
电厂 | 拼多多去雄安做什么? 作者 商迪安 判断一个行业是否火爆,可以观察以下几个不成文的“标准”:有没有大量涌入的资金,有没有重...
微信支付宝,又在AI入口打起来... 这两天,不少年轻人都在打听怎么弄到支付宝的“内测码”。 原因是支付宝搞出了一个“清爽版”,拥有测试资...
原创 小... 这是短暂跌落,还是价值回归? 1 股价 最新的新财富500创富榜出来了。 雷军家族以2250.6亿元...