12月23日,百川智能全链路领域增强大模型Baichuan4-Finance正式发布。不同于行业常见的大语言模型,Baichuan4-Finance主要面向金融领域,但并未放弃通用能力。
在FLAME-Cer评测中,Baichuan4-Finance整体准确率高达93.26%,领先GPT-4o近20%,其中银行、保险、基金、证券等多个项目的从业资格认证测试中,Baichuan4-Finance准确率更是达到了95%以上。
(图源:百川智能)
在更偏向一级应用场景的FLAME - Sce和国内主流开源金融评测基准FinanceIQ两大评测中,Baichuan4-Finance整体成绩均优于GPT-4o和开源金融大模型XuanYuan3-70B-Chat。
据百川智能介绍,为实现模型在提升专业能力的同时,不损失通用能力,百川智能专门打造了一套全链路领域增强方案,行业首创领域自约束训练技术,涵盖高质量数据集构建、模型预训练、微调、强化学习等流程。Baichuan4-Finance正是该方案的最新成果,其高质量金融数据集全面严谨,包含核心专业金融知识数据及实践应用类数据,为提升金融能力提供良好支撑。
(图源:百川智能)
此外,百川智能还在领域自约束训练中引入高精通用数据混合训练,以确保通用能力能够稳步增长。后训练环节,百川智能通过合成数据、指令数据进行有监督微调,针对金融领域特定场景进行样本增强,进一步提升了大模型的性能表现。
对于Baichuan4-Finance,软通动力表示,该大模型的通用能力和专用能力均完美契合他们的需求,部署该大模型后,用户满意度提升了20%。
在大模型普及度日益提高的今天,如何权衡大模型的专业能力和通用能力已成为令AI企业头疼的难题。若使用大量通用数据训练大模型,很可能造成数据污染,降低大模型在专业领域的准确性,而不使用通用数据训练大模型,则可能导致大模型的通用能力增长停滞乃至下降。
百川智能通过行业首创的自约束训练技术和全链路领域增强方案,以专业金融知识和实践应用类数据训练大模型,用于提升Baichuan4-Finance面对金融领域专业应用场景时的能力。特选高精通用数据用于混合训练,则能够在避免外部数据污染的同时,提升AI大模型的通用能力。
(图源:百川智能)
该方案对于AI企业的数据样本筛选、算法、监督和调整能力提出了极高的要求,从多项测试表现来看,Baichuan4-Finance在金融领域的能力已跻身第一梯队,远超GPT-4o和XuanYuan3-70B-Chat。
百川智能表示,已与华为、中科曙光、软通动力、达观数据、中国移动/电信/联通等软硬件公司及运营商达成合作,为爱奇艺、完美世界游戏、360集团等数千家企业提供了服务。
通用大语言模型竞争烈度较高,且难以实现盈利创收,AI公司为大模型加入专业能力,面向特定人群是行业趋势。率布局金融领域的百川智能,或将通过Baichuan4-Finance奠定行业地位,与更多企业达成合作,并为个人用户提供更加完善的使用体验。