随着以大模型为代表的人工智能技术持续推进,关于一味追求参数“量变”的规模比拼进入冷静期,行业开始关注如何通过大模型应用的“质变”,在具体场景中产生真正价值。
凭借围绕京东言犀大模型的技术深耕与实践积累,大小模型协同这一理念,已成为京东云推动大模型落地的关键技术路径,同时也是对行业未来发展趋势的重要思考。大模型负责输出通用能力,小模型负责实际推理执行,一方面提升系统的覆盖度和准确率,另一方面亦可降低推理延时、保证隐私数据安全、节约算力。
京东科技领航者营销平台(以下简称领航者),秉承大小模型协同理念,依托持续迭代的领先技术,不断推进大模型在金融营销场景落地,助力金融营销实现降本增效:
过去涉及产品、研发、算法、设计、分析师等多类职能才可完成的流程,如今只需要1人;从策划到落地需要14天才能完成的一场营销活动,现在被极致压缩到1天上线;从大促前预热到活动中的用户触达,低成本生成更符合金融业务特征的多套文案与素材,并按照用户特征来组合投放,实现营销的千人千面。
大小模型协同:升级三大技术,养成运营“私人营销助手”
以技术驱动大小模型协同,源于业务自身需求。
过去,金融行业落地一场营销往往需要横跨多个系统,比如营销活动要搭个系统,营销策略也要搭个系统,不同系统的业务知识、用户目标、用户表述各不相同。但大模型的信息窗口有限,如何在同一框架下把这些系统管理在一起,还要解决窗口过长的遗忘问题、专业知识的注入问题,这些都是极大的挑战。
为此,领航者实现三大技术升级:
第一阶段,引入向量数据库和RAG架构实现主框架联动大模型完成串联;
第二阶段,用开放平台的概念,引入Application、Domain、Skill三层架构,将核心能力与主框架融合,让能力调用更加便捷。还定义了一套大模型与内部业务系统交互的规范,使内部业务系统API能快速与大模型整合,利用大模型驱动API调用;
第三阶段,进一步引入Multi Agents概念,以主动服务方式自动完成复杂任务的协同。同时,将业务流程SOP引入大模型的任务规划,提升大模型任务拆解和流程规划的可控性。
通俗的说,就是最上层由一个总的Agent负责和用户交互、识别理解用户意图,然后通过对任务的拆解,对应到不同的工具API进行编排,再调度到具体的领域小模型,最终满足营销中诸如活动搭建、活动投放、分析洞察等特定目标。
底层大模型则提供通用能力,使现有系统和后续接入的系统,能够快速调用素材生成、文案生成、NL2SQL、知识库问答等能力,从而提高营销效率。其中,面向需求、面向指标的SQL生成方式,提升NL2SQL准确率至95%+,通过构建分析框架,让用户在Agent协作下自主完成活动运营分析。
这样一来,底层的通用能力负责各个系统的快速调用;上层的应用能力完成具体的营销动作,比如页面搭建、图片生成、风格设定,以及流量分发投放和数据分析。
构建专业数据集:定义一套AIGCSOP,让算法更“懂”业务
当算法对业务有足够理解,才能解决业务的实际问题。领航者的优势,正在于京东金融场内4.6亿用户和十余年金融行业Know-How,这些专业知识沉淀构建的数据集,让领航者的算法更懂业务的需求。
领航者在锻造中,定义了AIGC中文案生成和图片生成的可量化的多维评价标准,提升算法迭代效率:由业务方提供高质量种子数据以及行业素材经验,算法基于种子数据构建数据评价模型,以实现大规模生成新的训练数据。
在文案生成方面,京东金融运营团队将多年沉淀的营销理论、实践经验,凝结成金融运营白皮书,作为知识背景“喂”给大模型。同时协助算法团队打标,将历史优秀文案进行结构化拆解,梳理出了触发时机、文案技巧、文案风格等信息,以此激发大模型的CoT(思维链)能力,形成更强的泛化能力,使其在新的场景中也可以生成优质营销文案。目前,系统主观评分从2.08分提升至3.5分,达到少量修改即可直接使用的水平。
在素材生成方面,京东金融算法工程师将设计师头脑中的专业设计知识转化为参数,将京东百万级积累素材灌入大模型,指定风格素材更达到万级扩充。为了让素材具备更高可用性,算法工程师团队引入了主动学习的方式,在模型迭代过程中,由28位专业设计师每人每天用1小时主观评分,加速模型收敛。目前,由领航者生成的营销素材,可用率超40%。京东金融“15理财日”“18权益日”的素材生成任务,已经全部交给了领航者。
由此,领航者从技术角度定义了一套AIGC SOP,针对用户输入进行关键信息的抽取、意图理解、金融知识增强、prompt转配、模型生成,以形成更好的营销效果。
未来,京东科技领航者的领先技术能力还将对外开放,结合金融领域营销、运营的数字化经验,一同输出给金融机构,适配其各类营销运营场景需求,持续推动大模型落地金融行业。
来源:金融界资讯