OPPO申请数据去重专利,提升训练数据的数据质量
金融界
2024-02-28 03:31:01

原标题:OPPO申请数据去重专利,提升训练数据的数据质量

金融界2024年2月27日消息,据国家知识产权局公告,OPPO广东移动通信有限公司申请一项名为“数据去重方法、装置、存储介质以及终端“,公开号CN117609201A,申请日期为2023年11月。

专利摘要显示,本申请实施例公开了一种数据去重方法、装置、存储介质以及终端,所述方法包括:在大语言模型训练场景下,获取初始语料训练数据,确定所述初始语料训练数据对应的目标去重级别,基于所述目标去重级别对所述初始语料训练数据进行数据去重处理得到语料训练数据。采用该方法,本申请实施例通过先确定针对训练数据的去重级别后,再对训练数据进行相应级别的去重处理,以实现对训练数据进行不同级别的去重处理,不仅达到了提升训练数据的数据质量的效果,还增加了训练数据去重的灵活性。

来源:金融界

相关内容

热门资讯

深度|华为 AI,迎来大变 新智元报道 编辑:艾伦 【新智元导读】 华为诺亚方舟实验室主任王云鹤官宣离职。我们梳理了王云鹤的经...
机器人摘草莓、做咖啡,AI+农... 新京报讯(记者刘欢)作为2026中关村论坛年会的配套科普活动,“AI在海淀 燃动科普”,3月27日在...
原创 《... 类暗黑游戏《流放之路》最近曝出大瓜,其最大的交易服务器负责人,知名主播Jenebu被封号了。他这一封...
海致科技业绩解读:智能体确立第... 2026年,全球人工智能产业迎来从“对话生成”向“原生执行”的范式裂变,由 OpenClaw 引发的...
开源驱动AI范式跃迁 智能体时... 新华社北京3月28日电 《中国证券报》28日刊发文章《开源驱动AI范式跃迁 智能体时代开启产业新周期...