阿里巴巴公布大型语言模型训练相关专利
创始人
2026-02-13 15:21:20

人民财讯2月13日电,企查查APP显示,近日,阿里巴巴(中国)有限公司申请公布“一种基于思维链训练大型语言模型的方法、装置和设备”专利。

专利摘要显示,本发明实施例中,通过获取多个初始采样数据,初始采样数据包括图像、图像的辅助文本信息以及图像的标准审核结果;根据每个初始采用数据生成思维链数据,并确定思维链数据集合;根据思维链数据集合对基础大型语言模型进行全量微调,确定中间大型语言模型;根据中间大型语言模型以及多个所述初始采样数据,迭代生成多个中间思维链数据;进而根据预先设置的奖励函数,确定各所述中间思维链数据的奖励数值;最后采用组相对策略优化算法GRPO对所述中间大型语言模型进行强化学习,确定目标大型语言模型。通过上述方法,可以提高大型语言模型的可解释性和审核精度。

相关内容

热门资讯

除了打枪外,为什么还有人喜欢在... 在过去很长一段时间内,“枪车球”似乎一直都是欧美游戏厂商的偏好。 换句话说,受现实欧美文化的显著影响...
新春走基层|眼皮一眨“眼球发电... 在眼睛里搭建“微型发电站”?你没听错!最近青岛大学团队研发出的眨眼发电技术,有望帮助渐冻症患者实现眼...
育碧官宣《雷曼:30周年纪念版... IT之家 2 月 13 日消息,在今天(2 月 13 日)召开的索尼 State of Play 发...
原创 R... 各位LPL的观众和英雄联盟召唤师大家好,这里是天下游戏汇。 LPL第一赛段骑士之路的比赛全部结束,在...
数字孪生,上海思恒信息科技智慧... 喜讯!思恒信息科技图智校园服务平台在甘南州临潭县智慧校园统一管理平台和青海卫生职业技术学院应用落地,...