阿里巴巴公布大型语言模型训练相关专利
创始人
2026-02-13 15:21:20

人民财讯2月13日电,企查查APP显示,近日,阿里巴巴(中国)有限公司申请公布“一种基于思维链训练大型语言模型的方法、装置和设备”专利。

专利摘要显示,本发明实施例中,通过获取多个初始采样数据,初始采样数据包括图像、图像的辅助文本信息以及图像的标准审核结果;根据每个初始采用数据生成思维链数据,并确定思维链数据集合;根据思维链数据集合对基础大型语言模型进行全量微调,确定中间大型语言模型;根据中间大型语言模型以及多个所述初始采样数据,迭代生成多个中间思维链数据;进而根据预先设置的奖励函数,确定各所述中间思维链数据的奖励数值;最后采用组相对策略优化算法GRPO对所述中间大型语言模型进行强化学习,确定目标大型语言模型。通过上述方法,可以提高大型语言模型的可解释性和审核精度。

相关内容

热门资讯

原创 为... 其实,我认为没那么复杂,就一个原因,现在不是不好玩了,是会玩的人太多了,什么时候的三角洲是最好的,毫...
5G覆盖、无人值守,老煤矿“焕... 来源:北京日报客户端 记者从中国煤炭工业协会获悉,我国已建成智能化煤矿超过1000处,煤矿智能化建设...
对话元知合汇管理合伙人余朝辉:... 图源:图虫创意 来源丨时代商业研究院 作者丨陆烁宜 编辑丨郑琳 在A股市场大规模扩容和IPO审核趋严...
探讨国内智能家居品牌加工厂,哪... 在智能家居市场蓬勃发展的当下,越来越多的消费者开始关注智能家居产品,而选择一家性价比高的智能家居品牌...
最高200万/部!快手入局短剧... 来源:市场资讯 (来源:温静聚焦) 主编温静导读:4月1日,快手磁力引擎成立短剧生态业务中心,推...